聊透 Agent,它是「同事」还是「工具」,创业机会和价值究竟是什么?(4) / BTC123 | 区块链信息行情第一站

聊透 Agent,它是「同事」还是「工具」,创业机会和价值究竟是什么?(4)

06-16 , 09:47 分享新闻

国内初创团队打造的 flowith |图源:flowith

张鹏:我们深入聊聊 Cursor 这个例子,它背后的技术栈和成长路径是怎样的?

钟凯祺 (Cage):自动驾驶的例子就很有意思,直到今天,特斯拉也不敢真的把方向盘、刹车和油门去掉。这说明在很多关键决策上,AI 还没办法完全超越人类。只要 AI 的能力和人类差不多,一些关键决策就一定需要人类介入。这正是 Cursor 一开始就想得比较明白的地方。

所以他们最早贴合的特性,就是一个人类最需要的功能:自动补全(Autocompletion),它把这个功能做成了 Tab 键触发,随着 Claude 3.5 这样的模型出来,Cursor 把 Tab 的准确率提高到 90% 以上。在这种准确率下,我可以在一个任务流中连续使用 5 到 10 次,心流体验就出现了。这是 Cursor 作为 Copilot 的第一个阶段。

第二个阶段,他们做的功能是代码重构(Code Refactoring)。Devin 和 Cursor 都想做这个需求,但 Cursor 做得更巧妙。它会跳出一个对话框,当我输入需求时,它可以在文件外开启一个平行的修改模式来重构代码。

这个功能刚出来时准确率也不高,但因为用户对它的预期是 Copilot,所以大家都能接受。而且他们很准确地预判到,模型的 coding 能力一定会快速提升。所以他们一边打磨产品功能,一边等待模型能力提升,Agent 能力就很顺利地浮现了。

第三步就是我们今天看到的 Cursor 状态了,一个相对端到端的、在后台(background)运行的 Agent。它背后有一个像沙盒一样的环境,我甚至可以在上班时把不想做的任务布置给它,它可以在后台用我的计算资源去完成,与此同时,我能专注于自己最想做的核心任务。

最后,它以异步交互的形式,像发邮件或飞书消息一样,把结果告诉我。这个过程很顺利地实现了从 Copilot 到 Autopilot(或者说 Agent)的转型。

关键还是要抓住人的交互心智,从一开始让用户更乐于接受同步交互,这样就能收集到大量的用户数据和反馈。

03 为何 Coding 是通往 AGI 的「关键试炼场」?

张鹏:广密刚才说「Coding 是通向 AGI 的关键,如果不能在这个领域实现 ASI(超级智能),其他领域也很难。」为什么?

李广密:有几个逻辑。第一,Code 这个数据是最干净、最容易闭环,并且结果是可以验证的。我有一个猜想,Chatbot 可能没有数据飞轮(一种反馈循环机制,通过从交互或流程中收集数据,持续优化 AI 模型,进而产生更优的结果和更有价值的数据)。但 Code 领域有机会跑出数据飞轮,因为它可以进行多轮的强化学习,而 Code 是跑多轮强化学习的关键环境。