OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level 3时代开启

OpenAI 热炒已久的智能体,刚刚正式发布! OpenAI 官方介绍: Operator是我们的首批智能体之一。这些 AI 能够独立为你完成工作——只需给它一个任务,它就会执行。 be like,给它一个购物清单,Operator 就能完全自主地帮你买好东西。 可以看到操作老哥的双手已经离开键盘,屏幕上的所有操作都是 Operator 自己完成。 还能让它来预定餐厅: 这边奥特曼直播刚结束,OpenAI 总裁 Brockman 就迫不及待地宣布: 2025 是智能体之年。 并且这一次,Ope...


OpenAI 热炒已久的智能体,刚刚正式发布!

OpenAI 官方介绍:

Operator是我们的首批智能体之一。这些 AI 能够独立为你完成工作——只需给它一个任务,它就会执行。

be like,给它一个购物清单,Operator 就能完全自主地帮你买好东西。

可以看到操作老哥的双手已经离开键盘,屏幕上的所有操作都是 Operator 自己完成。

还能让它来预定餐厅:

这边奥特曼直播刚结束,OpenAI 总裁 Brockman 就迫不及待地宣布:

2025 是智能体之年。

并且这一次,Operator 官宣即上线——只不过,暂时只面向 Pro 用户,对,就是一个月 200 刀(约合人民币 1458 元)的那个大会员。

看罢直播,网友们还是非常兴奋的,直呼"疯狂星期四"。

但是嘛……

嗯,Operator 很香,但要是开源就更棒了,DeepSeek、Meta 快卷起来(doge)。

玩转浏览器,无需人类辅助

口说无凭,咱们还是先通过官方 Demo,来看看 Operator 到底有多"独立自主"。

它几乎可以使用任何网站,无需人类的操作辅助。

比如从 Allrecipes 上找到一份蛤蜊扁面条的食谱,然后把所有的食材都放到我 instacart 的购物车里?

它操作这一切的逻辑和人类一样,看到了哪些图片、该点击哪些按钮。

这和其他使用 API 或者基于编程接口的 Agent 不同,它是基于文本的思维链进行推理。

确认好菜单后,去哪个店下单买菜呢?

人类进一步给出指令,使用 Gus ’ s,然后 Operator 就会到对应的网站开始下单。

遇到登录、支付等操作时,Operator 会将操作权交还给用户。

在用户实测中,有博主发现如果 Operator 被 Reddit 墙了,它还会自己在搜索时就加入" Reddit "关键词以找到相关帖子。

用户也可以通过添加自定义指令,获得个性化体验。比如设置订机票时的首选航司。

Operator 允许用户保存提示,以便在主页上快速访问,非常适合重复任务,如在购物网站上补货。

Operator 也能同时运行多个任务,就像是打开多个网页那样,比如让它在 Etsy 上订购个性化的搪瓷马克杯,同时在 Hipcamp 上预订露营地。

Operator 的底层使用了一个全新的模型Computer-Using-Agent(CUA)。

通过将 GPT-4o 的视觉能力和高级推理强化学习相结合,CUA 可以进行 GUI 交互。

Operator 可以看到网页界面的内容,使用鼠标、键盘允许的所有操作。由此它可以自动操作,而无需自定义的 API 集成。

如果遇到问题或者出现错误,Operator 可以利用推理能力自我纠错。并在它卡住需要帮助时,将控制权交还给用户。

CUA 在 WebArena 和 WebVoyager 两个基准测试中都取得了 SOTA。

目前,美区的 Pro 会员已经可以通过 operator.chatgpt.com 来使用 Operator。Plus、Team、Enterprise 等付费用户和其他地区的胖友们,还得再等等,但 OpenAI 承诺未来会将这些功能集成到 ChatGPT 中。

OpenAI 迈入" Level 3 "

2024 年 7 月,OpenAI 发布了"从 AI 到 AGI 的五步过程":

Level 1:Chatbots,AI 可以以对话的方式与人互动。

Level 2:Reasoners,AI 科技解决人类水平的问题。

Level 3:Agents,AI 可以作为系统执行一些行动任务。

Level 4:Innovators,AI 可以开发创新性的 AI。

Level 5:Organizations,AI 可以完成一个组织完成的工作。

在当时的定义和规划中,OpenAI 表示自己还只处于 Level 1 阶段,正在靠近 Level 2。

而现在,随着 Operator 的发布,奥特曼宣布:

这是我们进入 Level 3 的开始。

值得注意的是,就像开头提到,OpenAI 悄悄画了个重点:Operator 还只是"首批"而非唯一智能体。

在直播中,奥特曼也预告了:

我们还将在未来几周和几个月内推出更多智能体。

One More Thing

就在 OpenAI 今天这场直播之前,还有一个小小的花絮。

Operator 发布 2 小时前,OpenAI 发了一条推文,表示修复了 ChatGPT 和 API 错误率高的问题。

又虚晃了网友们一枪(doge)。

另一个好消息是,奥特曼还预告,ChatGPT 免费版就能用上 o3-mini。



相关资讯