IOSG:当你的浏览器成为代理(2) / BTC123 | 区块链信息行情第一站

IOSG:当你的浏览器成为代理(2)

08-19 , 23:34 分享新闻

此外,Comet 还内置 Comet Assistant,这是一个驻留在侧边栏的代理,可以跨网站自动执行日常任务。例如,它可以总结你打开的邮件、安排会议、管理浏览器标签页,或代表你浏览并抓取网页信息。

通过侧边栏接口让代理能够感知当前网页内容,Comet 旨在将浏览与 AI 助手无缝融合。

浏览器代理的真实应用场景

在前文中,我们已经回顾了各大科技公司(OpenAI、Anthropic、Perplexity 等)如何通过不同的产品形态为浏览器代理(browser agents)注入功能。为了更直观地理解它们的价值,我们可以进一步看看在真实场景中,这些能力如何被应用到日常生活和企业工作流程中。

日常网页自动化

#电商与个人购物

一个非常实用的场景是将购物与预订任务委托给代理。代理可以根据固定清单自动填充你的线上购物车并下单,也可以在多个零售商之间寻找最低价,并代你完成结账流程。

对于旅行,你可以让 AI 执行这样的任务:「帮我预订下个月去东京的航班(票价低于 800 美元),再订一家有免费 Wi-Fi 的酒店。」代理会处理整个流程:搜索航班、比较选项、填写乘客信息、完成酒店预订,全部通过航空公司与酒店网站完成。这种自动化水平远远超越了现有的旅游机器人:它不仅仅是推荐,而是直接执行购买。

#提升办公效率

代理能够自动化许多人们在浏览器中进行的重复性业务操作。例如,整理电子邮件并提取待办事项,或在多个日历中检查空档并自动安排会议。Perplexity 的 Comet 助手已经可以通过网页界面总结你的收件箱内容,或为你添加日程。代理还可以在获得你的授权后,登录 SaaS 工具生成常规报告、更新电子表格,或提交表单。想象一个 HR 代理,能够自动登录不同的招聘网站发布职位;或一个销售代理,可以更新 CRM 系统的潜在客户数据。这些日常琐碎工作本来会耗费大量员工时间,但 AI 可以通过自动化网页表单和页面操作完成。

除了单一任务,代理还能串联起跨多个网络系统的完整工作流。所有这些步骤都需要在不同的网页界面中操作,而这正是 browser agent 的强项。代理可以登录各种仪表盘进行故障排查,甚至编排流程,例如为新员工完成入职操作(在多个 SaaS 网站上创建账号)。本质上,任何目前需要点开多个网站完成的多步骤操作,都可以交由代理执行。