聊透 Agent,它是「同事」还是「工具」,创业机会和价值究竟是什么?(6) / BTC123 | 区块链信息行情第一站

聊透 Agent,它是「同事」还是「工具」,创业机会和价值究竟是什么?(6)

06-16 , 09:47 分享新闻

2.成本和效率:包括计算成本(token cost)和用户的时间成本。如果 GPT-4o 跑一个任务 3 分钟,而另一个 Agent 要跑 30 分钟,这对用户是很大的消耗。而且这 30 分钟里,算力消耗是巨大的,这会影响规模效应。

3.用户指标:最典型的是用户粘性。用户在尝鲜后是否愿意反复使用?比如日活 / 月活(DAU/MAU)比例、次月留存率、付费率等,这些是避免公司只有「虚假繁荣」(five minutes of fame)的根本指标。

李广密:我再补充一个视角:Agent 与当前模型能力的匹配程度。今天 Agent 80% 的能力依赖于模型这个引擎。比如,GPT 到了 3.5,多轮对话的通用范式出现了,Chatbot 这种产品形态就行得通了。Cursor 的崛起也是因为模型发展到了 Claude 3.5 的水平,它的代码补全能力才得以成立。

像 Devin 其实出来就得偏早了,所以创始团队对模型能力的边界理解非常重要,要清楚今天以及未来六个月模型能到哪一步,这与 Agent 能实现的目标息息相关。

张鹏:什么叫「AI Native」的产品?我觉得 AI Native 的产品不只是给人用的,它必须同时服务于 AI。

换句话说,如果一个产品里没有合理的数据去调试,没有为未来 AI 的工作环境做搭建,那它只是把 AI 当成一种降本增效的工具,这样的产品生命力是有限的,很容易被技术浪潮淹没。一个真正的 AI Native 产品,应该是内建了服务 AI 和人类的双向机制。简单来说,AI 在服务用户的时候,用户有没有也在服务 AI?

钟凯祺 (Cage):我非常喜欢这个概念。Agent 的数据在现实世界里是不存在的,没有人会在完成任务时把思考过程一步步拆解清楚。那怎么办?一个方法是找专业的标注公司,另一个方法就是要撬动(leverage)用户,把用户的真实使用方式和 Agent 自身的运行过程捕捉下来。

张鹏:那如果要通过 Agent 的方式让人类给 AI「投喂」数据,什么样的任务是最有价值的?

钟凯祺 (Cage):与其想着用数据服务 AI,不如想 AI 有什么长板应该被放大。比如科学研究,在 AlphaGo 之前,人类觉得围棋和数学是最难的。但用了强化学习之后发现,这些对 AI 反而是最简单的。在科学领域也一样,人类历史上已经很久没有一个学者能通晓每个学科的犄角旮旯了,但 AI 可以。所以我认为,科学研究这类任务对人类来说很难,但对 AI 不一定难。正因如此,我们才要多找一些数据和服务来支持它。这类任务的回报比大部分任务更 verifiable,未来甚至可能是人类帮 AI「摇试管」,然后告诉 AI 结果是对是错,帮助 AI 一起去点亮科技树。

李广密:一开始的数据冷启动是必要的。做一个 Agent 就像做一个创业公司,创始人肯定要做冷启动,要亲力亲为。接下来,搭建环境就很重要,决定了 Agent 往哪个方向走。再往后,更重要的是搭建奖励(Reward)系统。我觉得环境和奖励这两个因素非常关键。在这个基础上,Agent 的创业者做好这个 Agent 的「CEO」就好了。今天 AI 已经能写出人类看不懂但能运行的代码,我们不一定非要理解强化学习端到端的逻辑,只要搭好环境、设好奖励就行。