聊透 Agent，它是「同事」还是「工具」，创业机会和价值究竟是什么？(6) / BTC123

2.成本和效率：包括计算成本（token cost）和用户的时间成本。如果 GPT-4o 跑一个任务 3 分钟，而另一个 Agent 要跑 30 分钟，这对用户是很大的消耗。而且这 30 分钟里，算力消耗是巨大的，这会影响规模效应。

3.用户指标：最典型的是用户粘性。用户在尝鲜后是否愿意反复使用？比如日活 / 月活（DAU/MAU）比例、次月留存率、付费率等，这些是避免公司只有「虚假繁荣」（five minutes of fame）的根本指标。

李广密：我再补充一个视角：Agent 与当前模型能力的匹配程度。今天 Agent 80% 的能力依赖于模型这个引擎。比如，GPT 到了 3.5，多轮对话的通用范式出现了，Chatbot 这种产品形态就行得通了。Cursor 的崛起也是因为模型发展到了 Claude 3.5 的水平，它的代码补全能力才得以成立。

像 Devin 其实出来就得偏早了，所以创始团队对模型能力的边界理解非常重要，要清楚今天以及未来六个月模型能到哪一步，这与 Agent 能实现的目标息息相关。

张鹏：什么叫「AI Native」的产品？我觉得 AI Native 的产品不只是给人用的，它必须同时服务于 AI。

换句话说，如果一个产品里没有合理的数据去调试，没有为未来 AI 的工作环境做搭建，那它只是把 AI 当成一种降本增效的工具，这样的产品生命力是有限的，很容易被技术浪潮淹没。一个真正的 AI Native 产品，应该是内建了服务 AI 和人类的双向机制。简单来说，AI 在服务用户的时候，用户有没有也在服务 AI？

钟凯祺 (Cage)：我非常喜欢这个概念。Agent 的数据在现实世界里是不存在的，没有人会在完成任务时把思考过程一步步拆解清楚。那怎么办？一个方法是找专业的标注公司，另一个方法就是要撬动（leverage）用户，把用户的真实使用方式和 Agent 自身的运行过程捕捉下来。

张鹏：那如果要通过 Agent 的方式让人类给 AI「投喂」数据，什么样的任务是最有价值的？

钟凯祺 (Cage)：与其想着用数据服务 AI，不如想 AI 有什么长板应该被放大。比如科学研究，在 AlphaGo 之前，人类觉得围棋和数学是最难的。但用了强化学习之后发现，这些对 AI 反而是最简单的。在科学领域也一样，人类历史上已经很久没有一个学者能通晓每个学科的犄角旮旯了，但 AI 可以。所以我认为，科学研究这类任务对人类来说很难，但对 AI 不一定难。正因如此，我们才要多找一些数据和服务来支持它。这类任务的回报比大部分任务更 verifiable，未来甚至可能是人类帮 AI「摇试管」，然后告诉 AI 结果是对是错，帮助 AI 一起去点亮科技树。

李广密：一开始的数据冷启动是必要的。做一个 Agent 就像做一个创业公司，创始人肯定要做冷启动，要亲力亲为。接下来，搭建环境就很重要，决定了 Agent 往哪个方向走。再往后，更重要的是搭建奖励（Reward）系统。我觉得环境和奖励这两个因素非常关键。在这个基础上，Agent 的创业者做好这个 Agent 的「CEO」就好了。今天 AI 已经能写出人类看不懂但能运行的代码，我们不一定非要理解强化学习端到端的逻辑，只要搭好环境、设好奖励就行。