
Image generated with OpenAI
观点:为什么AI代理是日常AI的未来
2025似乎是代理人工智能(Agentic AI)的年份。OpenAI、微软、Anthropic以及其他主要科技公司发布了他们最先进的人工智能模型,能够执行去年还无法完成的复杂任务。但是,AI代理到底是什么?这项技术真实的成分和炒作的成分各占多少?
跟上近年来的AI趋势可能会让人感到疲惫。我们从基础的AI发展到生成性AI,再到推理型AI,现在,AI代理正在主导话题。在过去的几个月里,多家科技公司纷纷推出新的AI代理,并强调连接这些代理的工作流程越来越具有吸引力。
在一月份,OpenAI发布了其首个AI代理,Operator,它能够自主地执行任务,比如根据你的喜好和标准浏览网页,预订餐厅,或者为你购买音乐会门票。
两个月后,中国AI初创公司Zhipu发布了AutoGLM Rumination,这是一个免费的AI代理,可以独立操作并为用户规划旅行。就在几天前,微软为Copilot Studio推出了“计算机使用”功能,为AI代理增加了更多自主能力,包括接管用户的桌面。
但这个趋势并不只是公司推出酷炫新产品的问题,它关乎一个复杂且不断发展的领域,该领域将各种形式的AI与人类交互相结合。科技爱好者和专家们对代理人工智能Agentic AI都表示出了强烈的乐观态度。
“我同样对AI代理人工作流这个趋势感到兴奋。”Coursera和DeepLearning联合创始人、AI专家吴恩达在11月的Snowflake的BUILD 2024会议上说,“如果你问我,最重要的AI技术是什么?我会说是Agentic AI。”
那么,AI代理究竟是什么呢?他们的表现是否如专家所说的那么好呢?以下是关于这项新兴技术最核心方面的简要概述,以及最新的发展动态。
什么是AI代理?
正如OpenAI和Microsoft等公司所展示的,AI代理是能够执行复杂任务的技术,它们自主地结合不同的应用和软件来完成任务。
从本质上讲,它们是“传统”的AI聊天机器人——但更高级,能够完成我们在过去两年中习惯的任务之外的工作。这些包括规划,浏览网页,记住你的兴趣,甚至在没有逐步指导的情况下完成你的杂货购物,因为它们能够自己解决问题。
Google Cloud将AI代理定义为“使用AI来追求目标并代表用户完成任务的软件系统。”
这些AI模型真正特别之处在于它们的高级推理能力,能够同时处理多种类型的信息——音频、文字、视频、代码和图像。它们能够像人类一样理解复杂的情况,采取行动,并与软件和平台进行交互。
许多科技公司现在都在推动他们的AI模型向这个新的水平迈进。
就在几天前,OpenAI宣布其AI模型o3和o4-mini可以“思考”图像并对它们进行操作——例如裁剪或转换它们。与此同时,微软的新功能“计算机使用”使其AI代理能够识别图形用户界面。
“如果一个人能用这个应用,那么AI代理也能用,”微软公司副总裁,业务与行业副驾驶员Charles Lamanna在公告中说。
下一级:代理AI技术
虽然许多科技公司正在开发超智能的AI聊天机器人,但代理人AI则更进一步。这项技术专注于构建多个AI代理可以互动并执行不同任务的系统,以提供更准确和更全面的结果。
在我参加的由eDreams组织的最近的一场科技讲座中,AI专家Patricia Gutierrez Faxas在她的“AI代理的力量”主题演讲中解释说,这些系统可以采取各种结构。多代理系统可以将复杂任务分解为简单的任务,将它们分配给专门的代理,并形成不同类型的网络。
一个AI代理可以扮演“主管”角色,将较小的任务委派给其他专门的代理,或者多个代理可以同时在不同的任务上工作并协调以交付最终的成果。这些系统的一些好处包括提高准确性,更大的隐私,以及减少错误。
吴恩达对这种方法表示赞同。在他2024年在BUILD上的演讲中,他强调了代理型AI工作流处理复杂任务以取得更好结果的重要性。从像GPT-3.5这样的模型到GPT-4的性能飞跃 – 以及它们在编码基准测试上的更强结果 – 主要归功于代理型工作流和代理型推理。
AI代理将如何影响我们的生活?
科技公司对代理人工智能(Agentic AI)的处理方式各不相同。OpenAI专注于为日常用户提供的想法。在发布Operator时,该团队在一个视频中解释说,人们只需要想出他们想要准备的菜肴,然后请ChatGPT找出最好的食谱,甚至可以让它从在线超市购买所需的食材。
这个AI模型可以在执行关键任务,如使用用户的信用卡完成购买之前,提出跟进的问题并暂停。用户可以设定消费限额,或要求助手在购买任何东西之前先征得确认。
普通人可以如何使用AI代理的可能性似乎无穷无尽,但到目前为止最受欢迎的使用案例包括充当旅行代理,个人购物者,和行政助手——毕竟,谁不想要一个可以发送电子邮件,记住重要的生日,和处理税务的个性化技术呢?
微软采取了更加企业化的方法。该公司展示了营销机构如何使用AI代理来自动化市场数据收集,并生成洞察驱动的分析,或者大型企业如何在其系统中使用它们进行发票处理。
然而,尽管所有这些用例听起来都很革命性,但专家们一致认为,前方的路还很长。大多数人还无法使用AI代理来改善他们的日常生活,因为许多这样的功能,比如Operator,只对Pro用户开放,而这需要每月200美元的订阅费。
那么,代理人工智能是否符合其炒作的程度呢?
许多媒体头条都在预言由Agentic AI引领的新一轮AI革命。这个行业确实有许多炒作,而现实可能并不远。IBM最近分享的一份报告揭示,许多开发者正在积极探索和开发这项技术。
“IBM和Morning Consult对1000名正在为企业构建AI应用的开发者进行了调查,其中99%的人表示他们正在探索或开发AI代理人,” IBM watsonx.ai的产品管理总监,Maryam Ashoori博士解释道,“所以,答案是,2025年将是代理人的一年。”
然而,专家们指出,对于AI代理真正是什么以及它们应如何表现,有多种解释。因此,当前AI代理的进步和表现往往取决于评估这项技术的人的观点和标准。
可以肯定的是,许多专家和决策者深深地相信这项技术,并正在大力投资其发展。最近的一项研究揭示,84%的IT领导者像信任人类一样信任AI代理,并且OpenAI预计到2029年其收入将达到1250亿美元。
虽然代理人工智能技术尚未完全开发,且其应用的普及程度也不如聊天机器人——这主要是由于其高昂的成本——但很明显,围绕这一趋势的极度乐观和热情足以在未来几个月内推动重大变革。
留下评论
取消