另外,我觉得今天的 AGI 事实上做不了超长任务。而我现在的任务很多时候都超过半小时。
我每天消耗的 Token 就是 50 美元。只要我那天想工作,从早到晚它都在消耗 Token。我真的觉得,我完全可以跟它说:「我有一些 Idea,这是我的 Idea 方向,请你帮我完成一个 10 天的任务,帮我赚 500 万美元。」
我认为这并非神话,只是我好像对此没有那么大的吸引力,就没有去做,或者说,因为这可能要消耗自己很多情绪和精力,赚不到钱的时候会很痛苦。
但我就想,它能否连续工作 10 天,你不用干预它,或者偶尔提醒一下方向,它能否工作一个月,甚至一年?
我觉得在不久的将来,达到诺贝尔奖或菲尔兹奖级别的成果是完全没有问题的。
因为我与它交流时,有时会讨论我们以前学过的超级复杂的算法,全世界可能都没几个人研究,它都比很多人聊得好多了。所以,如果你给它足够的上下文和代码,它其实可以进行非常深入的沟通。
回归本质:什么是通用Agent 和智能接下来,我想跟大家分享一下我对智能和 Agent 的思考。
简单来说,一个 AI Agent 包含两个核心部分:规划器(Planner)和执行器(Executor)。

AI Agent 的结构|图片来源:出门问问,下同
规划器通常依托大型语言模型,承载了 Agent 的主要职能。它根据任务制定详细的计划。执行器则负责将这些计划付诸实践,无论是编写代码,还是自动化浏览器操作以制作视频。
Agent 的运作是一个持续的反馈循环:
-
规划: Agent 根据任务制定具体行动方案。
-
执行: 执行器按计划操作。
-
获取反馈: 执行过程中,Agent 从环境中获得即时反馈。例如,当 Agent 尝试运行「python」命令而本地实际是「python 3」时,系统会报错,Agent 便能识别并修正为正确的命令。
-
调整与迭代: Agent 根据反馈重新规划,更新对当前情境的理解(上下文),然后再次执行。
-
目标达成: 当预设的成功标准(如程序编译通过或测试全部完成)达到时,循环结束。
如果我们思考智能的本质,我认为,智能的第一个本质是进化。
就像人类作为智能体,在特定环境中(无论是社交还是任务执行),通过获取反馈来不断调整自身行为并进行反思一样,AI 也应如此。这种进化是自动的,无需人工干预。Agent 自主建立循环,通过规划、在环境中执行、获得反馈、调整规划并更新上下文,实现持续的自我完善。
在此进化过程中,关键在于:从自身经验中学习,以及 Learn from others,就是所谓的群体智慧,从别人那里学习经验。
