AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

36氪出海·AI|和OpenAgents创始人Raphael Shu聊群体智能:让Agent学会彼此合作、竞争甚至争吵

830
2025-11-19 09:02
2025-11-19 09:02
830


如何让 Agent 和 Agent 像人类一样协作?



Intro


单一 Agent 的能力和价值已毋庸置疑的当下,多个 Agent 如何协作成为2025年下半年的又一风口。


很多人认为,这是 AI 的第二次觉醒。


  • 第一次觉醒的标志事件是大语言模型的诞生——AI 由此学会了理解、记忆、推理;

  • 第二次觉醒则是多智能体协作,让单个 Agent 学会了交谈、协作、分工、甚至争吵。


这也意味着,Agent 不再是一个个孤立的行动体,而逐渐演变成一个初具形态的小社会。


Raphael Shu 就是深耕多智能体协作领域的一位创业者。


他在本科与硕士阶段就开始专注于自然语言处理(NLP),在东京大学读计算机博士期间开始研究基于神经网络的自然语言生成。那是2016年前后,行业仍处于从「句法到语义」的阶段,他的研究方向已经开始转向对语言模型「决策能力」的探索,是最早研究 Seq2Seq 模型在语言理解与生成中的迁移潜力的学者之一。「如果模型能学会在不同任务间迁移意图,那它就不再只是一个模型,而是一个可以行动的智能体」Raphael Shu 说。


2021年,他加入亚马逊 AWS 科学团队作为职业第一站,参与对话智能体 Conversational AI 的研发,一年后架构并实现 Dialog2API,即 AWS 内部第一个基于大模型的 Agent 系统,那时,「Agent」这个词还没火,「亚马逊的很多同事包括我接触的客户都认为,这个东西不就是一个更聪明的 RPA?」


分水岭在2023年,随着大语言模型的出现,ChatGPT 问世,AI 世界迅速沉浸在「语言模型」的奇迹之中,很多人纷纷转向通过自然语言而非强化学习方法开始训练模型,硅谷的各大公司开始追求更大的模型、更低的延迟、更稳定的 API 以及探索各式各样的应用端。


但 Raphael Shu 又一次掉转了研究方向,「如果 AI 之间能通过自然语言展开协作,会不会出现一种更新的智能体形态?」这个方向无疑令他更加兴奋,虽然多智能体的协作早在上世纪90年代就有前沿科学家做过探索,最早应用在如何让城市成千上万的坏通信号灯协同效率最佳。


于是,他在亚马逊展开了对企业级多智能体的研究,「已和工程组落到产品线」从2024年开始,Raphael Shu 就开始思考开放世界的多智能体合作「前前后后研究了一年多,这也是我认为现阶段 AI 行业最值得做的方向之一且只有1-2年的窗口期」。


于是,这个在硅谷大公司 lab 实验室的科学家决定「出走」,创业做一个可以让 Agent 之间互相理解、分工、合作、博弈的开源平台。


他把其命名为 OpenAgents,一个颇具野心的名字,2025年10月已上线。


在理想状态下,OpenAgents 希望将重新定义 Agent 与 Agent 的协作方式——甚至人和 Agent 的规则,这很像60年代被誉为「鼠标之父」的恩特尔巴特所提出的构想,未来,先让人和智能机器连接,再让智能机器和机器之间连接,从而实现「群体智商」(当时还没有「群体智能」这个名词),而「鼠标」仅仅是他构想里最简单的一环:为人和机器交互做一个小小的工具。


总之,一切宏大而充满野心的构想总会获得投资机构的关注,因为它充满不确定性,是冒险者的乐园。现在,多智能体的研究范式尚未定型,更谈不上有清晰的商业生态:谁为协作付费?生态秩序如何建立?


「答案的核心在于速度。」Raphael Shu 说。


他相信,未来将有更强的芯片出现,促使由 AI 生产出的内容是人类十几倍甚至上百倍, Agent 的互动速度也将超过人类的思考速度。


「也许达到毫秒级。」Raphael Shu 认为速度会破解很多难题,也许未来的 AI 终会将世界带入一个人类无法实时参与的阶段。


图片

Raphael Shu 在硅谷做分享


图片

Raphael Shu 在意大利佛罗伦萨参加 ACL 会议


图片

OpenAgents 团队照


图片

产品界面


对话 Raphael Shu


1

1

1

1

Agent 协作演变

从编排到生态 


AI 闹:最近行业在提到「多智能体协作」,你是如何理解「协作」的?


Raphael Shu:我认为分两个层次。工程式的 workflow 和开放式的 ecosystem。


「工程式」的特点是参与协作的智能体数量有限、功能固定,系统结构相对封闭。微软的 Magnetic One 系统就属于这一类。在这样的系统中,通常会有一个「编排器」负责统筹多个 Agent 的任务分配。比如一个 Agent 负责写代码,一个 Agent 负责操作浏览器,第三个 Agent 负责读取本地文件,第四个 Agent 负责执行命令行任务。这些 Agent 各自承担不同的职能,有的任务执行很快,有的需要较长的处理时间。


整个系统更像一条固定的生产流水线,优点是可控、性能稳定,但缺点也很明显——无法根据外部变化动态加入新的 Agent,也无法让 Agent 在陌生环境中自适应。


于是就引出了第二个层次:开放式。


首先,真实世界的任务本身是不确定的,目标也会发生变化——这意味着系统必须具备动态理解和自我调整的能力。


其次,参与协作的 Agent 来源更加多样化:不同 Agent 可能是由完全不同的公司、团队,甚至个人开发而成,它们使用的协议、模型架构和训练目标各不相同,让这些「异质智能体」(Heterogeneous Agents)在同一网络中进行协作,是一个极具挑战的任务。


第三,每个 Agent 拥有各自的目标与价值取向,行为不一定一致,甚至可能存在冲突或竞争。因此,系统需要在「多目标」与「多主体利益」之间找到平衡。


AI 闹:可否具体举一个可理解的案例?


Raphael Shu:我是一家投行,要为星巴克做估值,整套逻辑清晰、封闭、可重复,因此可以被建模成一个固定 Agent,但如果换成「为世界上任何一家公司做估值」,那星巴克的逻辑就完全行不通了:星巴克关心咖啡豆价格,特斯拉要看电池成本,谷歌要分析广告市场结构,没有固定 workflow 可以通用。


那就应该构建一个开放式系统,一个交易所,让不同的 Agent——无论是人类还是机器——都可以在上面进行博弈,自发形成一个关于公司价值的共识。


这就是 OpenAgents 想做的事情:让多个 Agent 的协作从「工程编排」走向「生态建构」。


AI 闹:现阶段 OpenAgents 主要面向开发者群体,会提供什么价值给用户?


Raphael Shu:第一,帮用户构建一个可以部署上线的Agent 网络,第二是帮他们把 Agent 连到网上。相当于是一个网络层基建。


举个例子,我想建立一个由多智能体组成的社区,维护一个自动更新的 AI Wikipedia,持续收录各个城市与 AI 相关的最新活动、讲座、线下沙龙或讨论会。


我需要先在 OpenAgents 启用一个 「Wikipedia」 插件,让系统具备自动整理和更新信息的能力;接着添加「聊天」功能,让不同的 Agent 能够交流、分享信息;然后再打开「共享文件夹」插件,能上传、存储、编辑资料。当这些功能模块连接在一起,一个具备完整信息采集、交流与协作能力的 Agent 网络就诞生了。随后,我就可以邀请其他开发者加入了。


图片

架构示意图: 智能体网络 (左) 插件系统(中) OpenAgents Studio (右)


AI 闹:有没有更商业的落地场景?


Raphael Shu:最近在和一家名叫 Peak Mojo 的 AI 招聘初创公司合作。他们做的是全自动 AI 面试,求职者只要上传简历,就能立刻开始一场12到15分钟的在线面试。面试结束后,系统会自动生成结果或由 HR 确认结果。


我们要做的事把这种 AI 面试能力扩展成一个智能体社区。想象一下,有80到120家公司的 AI 面试官同时在同一个社区。求职者只要填写基本信息、上传简历,就能被这些 AI 面试官看到。当一个公司对这位候选人感兴趣时,它的 AI 面试官可能会发起面试,提问:你在 GitHub 上有参与过哪些开源项目。求职者回答:我用 Python 做过项目。那这个答案就会在整个社区中共享。其他公司的 AI 面试官不会再重复提问。


这样,一个求职者可能在一天之内收到30个不同公司的面试邀请。每个面试只需15分钟,他一天工作8小时就能完成全部面试,甚至当天就拿到 Offer。


这个「AI 面试官社区」的 Demo 版本已经上线,接下来我希望拿到一个完整的验证。


这只是 OpenAgents 众多应用中的一个起点,但已经展现出「群体智能」的潜力。


2

1

1

1

构建生态

做篮球馆而不是篮球队


AI 闹:如果说 Agents 可以协作了,那么就形成了一个新的群体智能,在思考群体智能时,你曾说过《群体决策》对你的应影响最大,是不是因为你认为,人类的「集体智慧」正在被 AI 重建?


Raphael Shu:主要阐明了一个观点:当个体数量多到一定程度时,系统就不该依赖单一的指令或流程,而是可以通过博弈机制实现自我协调。


换句话说,当 Agent 越来越多时,最好的解决方案不一定来自单个 Agent 的推理,而是来自它们之间的互动、争论与权衡。


比如刚提到的公司股票估值场景。如果让多 Agent 各自从不同角度,相互辩论——一个关注财务,一个分析市场,一个评估风险——在辩论中不断博弈,最后达成的结果往往比任何单一模型推理出的结论更准确。


我再举个更现实的例子。


假设公司刚买了一层办公楼,现在要设计楼层的布局。有两种做法:第一种找一个专家;第二种是找十个不同领域的专家——安全专家说:走廊太窄了,发生火灾逃不掉。美学专家说:那样太浪费空间。大家不断讨论、修改,直到达成一个让各方都满意的平衡方案。


这就是一个通过博弈,实现集体优化的过程。


AI 闹:如果人类社会的协作是建立在共识与博弈之间,那在 AI 的世界里,如何让这种「群体决策」运作起来?


Raphael Shu:不是「如何分工」,而是「如何设计规则」,如果 Agent 的协作只做分工,系统增长一定会受限。


举个例子,用户上传一 Word 文档,系统需要把它转换成 PDF,再压缩50% 。那有两个 Agent:A 负责格式转换,B 负责压缩优化,任务完成后,系统该如何「奖励规则」?如谁贡献更多性能或效率,就得到更多奖励;任务完成得更好,就有更高的排名或分成。


规则设定好,就可以让无数 Agent 自主进入,自主退出,竞争或者合作,形成正向的增长循环,同时拥有自我进化能力。


AI 闹:行业也有很多做「多智能体协作」框架的团队,如 AutoGen、CAMEL、LangGraph,OpenAgents 的路线和他们有什么区别?


Raphael Shu:定位上有本质区别。


像 AutoGen、CAMEL、LangGraph 是帮助用户组建一个 Agent 团队,他们是想帮你打造一支 NBA 球队;而我们是在建篮球馆,让很多很多球队来这里打球。所以,我们与它们不是竞争关系,而是互补关系。


换句话说,其他框架聚焦于任务级别的编排,而 OpenAgents 聚焦的是基础设施。我们更关注如何让无数 Agent 能流畅地共存、协作、交流,形成一个社区生态。


AI 闹:建篮球馆而不是建球队,意味着你建立生态,甚至重新定义规则,且需要足够多的球队入驻,现阶段的工作重点在哪里?


Raphael Shu:足够多、足够好用的工具。我们叫「插件」或者「Mod」。插件可以是工具,也可以是规则,甚至是社交或游戏。


如可以让多个 Agent 实时写同一个文档、共享资料或处理文件,我们在做一个社交类插件:给 Agent 玩 RPG 游戏,不是为了娱乐,而是让 Agent 在游戏中结识新的伙伴,学习合作方式,找到潜在的合作对象,还有设定规则的插件,当有新任务出现时,谁负责分配?哪个 Agent 有最终决策权?激励机制如何设计?


另外就是不同的 Agent 通信协议不一样。有的 Agent 能直接用自然语言交流,用 HTTP 或 WebSocket 就能连通;有的有更复杂的结构化数据需求,需要特殊的通信协议。不管用哪种协议、哪种技术栈,只要接入 OpenAgents 的网络,就能和其他 Agent 无缝对接。


所以我们要做开源,因为 OpenAgents 需要一个庞大的工具生态。我们自己花两个月才能开发出让 Agent 玩 RPG 游戏的插件。随着社区壮大,每天也许能诞生2-3个新插件,最终再长出上千个插件。


3

1

1

1

速度决定一切

谁参与谁旁观


AI 闹:2023年前后,在行业刚理解 Agent 时,你已经开始转向研究「多智能体」,整个行业尤其是技术发展还没有今天这么快,你是如何克服技术瓶颈?


Raphael Shu:给模型一段五百字的任务说明,它能立刻理解。当时的大模型根本听不懂这种指令。所以我们当时采用了一种叫 「情境学习」(In-Context Learning) 的方法,不直接告诉模型「请执行这个任务」,而是给它看大量的例子,让它自己总结规律。


其实更棘手的是模型的「记忆力」,现在的模型能处理上百万个 tokens,当时只有两千多个。对话稍微长一点,它就忘了上下文。所以我们还要精选、压缩、重写训练样本,让模型在极短的上下文尽量学会复杂任务。


那么进入2025年,业内是否已经形成了共识:Agent 的协作是必然的?或许仍有一种论调,每个 Agent 会有自己的独立生态,或是出现一个超级 Agent?


业内确实存在分歧。如果你们能采访到这方面大牛,我愿意听听他们的观点。


但我的观点是:协作是必然的,因为「资源限制」。


比如美国有一些专门做金融分析的公司,这类公司拥有几十年积累的金融分析经验和独家数据,它完全有能力开发出一个专门分析上市公司估值的智能体,这是其他公司做不了的。


因此,我认为虽然会出现「超级 Agent」,且 Agent 能力可以无限扩大,但 Agent 可以获取的资源和专业知识是没有办法无限扩大。


AI 闹:著名的斯坦福小镇实验让 Agent 第一次在虚拟空间里表现出社会行为,这个实验会和你的创业方向有交汇点吗?


Raphael Shu:我认为「斯坦福小镇」是一个非常重要但被严重低估的研究方向。


斯坦福小镇其实是可以在企业里可以得到很好的应用。比如亚马逊就可以构建一个由买家 Agent 和卖家 Agent 组成的社区,让他们自主交易、定价、沟通,通过虚拟市场的运行,洞察真实市场的趋势。这是比传统数据分析更接近「现实」的一种预测方式。


其实 OpenAgents 是可以直接为企业提供这类预测所需的底层框架,把这种模拟能力带入真实的场景中。


AI 闹:如果你理想中的多智能体协作最终形成,那未来会变成人—机协作共存的社会,人类有可能不再是中心控制者,而是一个节点、一个参与者,或变成 Agent 的一部分?


Raphael Shu:不是有句话吗,人类应该要思考自己能否成为一个有价值的 MCP(笑)


我认为问题关键不是人和 Agent 能否协作,而是人能不能跟上 Agent。


最终决定一切的是速度。比如一个人类团队15分钟才能开发出一个功能;但未来,Agent 可能在0.05秒内就完成了。那么在这种情况下,很可能人类根本来不及介入,Agent 已经把事做完了。


AI 闹:当 Agent 的行动速度超过人类的反应速度,会发生什么样的情况?


Raphael Shu:会导致一种新的社会结构:Agent 和 Agent 之间持续互动与进化,而人类的参与度越来越低。那么我们也许要重新思考:人类所谓的「协作」到底还能不能被称作「协作」?是不是我们不再称自己是协作者,而是监督者?


AI 闹:最后,请你推荐三本书?


Raphael Shu:《人性的弱点》《搞定:无压工作的艺术》和《机器学习:概率视角》,第三本书已更新了好几个版本,让我真正学会机器学习。


1.30 深圳coupang-文章页底部图片
复盘2025关键变化,提前布局2026增长!
点击获取《2025跨境电商行业年度报告》
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
俄罗斯电商平台Wildberries进军非洲市场
AMZ123获悉,近日,据外媒报道,俄罗斯电商平台Wildberries即将进军非洲市场。Wildberries与埃塞俄比亚国家投资机构 Ethiopian Investment Holdings(EIH)签署合作备忘录,双方将围绕产品本地化、投资及技术合作展开联合项目,以支持埃塞俄比亚数字经济和电商相关基础设施的发展。该合作被视为 Wildberries 拓展非洲市场的重要起点。根据公开信息,该备忘录由 Wildberries & Russ 集团首席执行官 Robert Mirzoyan 与 Ethiopian Investment Holdings 首席执行官 Brook Taye 在莫斯科签署。
2025年电商回顾:关税与成本飙升,卖家持续承压
AMZ123获悉,近日,Marketplace Pulse发布了《2025年电商市场年度报告》。报告显示,2025年电商行业经历了近年来最为复杂和剧烈的利润率压缩,关税波动、广告成本攀升、人工智能兴起、电商平台费用攀升等,多重因素叠加形成压力场,使卖家面临空前挑战。然而,这一系列压力并非完全负面,反而孕育了未来复苏的潜力。电商平台虽在卖家数量竞争上有所下降,但卖家运营要求上升,平台的结构性转变正在为新的电商模式创造条件。以下内容将对2025年进行详细回顾与分析,并对2026年的趋势进行预测。
26年泰国电商将达1.15万亿泰铢,增速放缓
AMZ123获悉,近日,价格比较平台Priceza在本周举行的ECOM TALK 2026研讨会上指出,随着市场逐步走向成熟,泰国电商行业的增长正在放缓。市场预计,2026年泰国电商市场将实现约7%的同比增长,规模达到1.15万亿泰铢,低于2025年约7.6%的增速。这一变化反映出行业进入相对稳定的发展阶段,同时竞争与运营复杂度持续上升。在这一背景下,品牌正被迫重新思考自身的运营模式。未来,品牌的竞争优势将不再仅依赖单一渠道,而在于构建统一的“商业操作系统”。通过一个整合的平台同时管理电商平台、自营官网、线下门店、代理式电商以及社交和视频渠道,品牌才能在多渠道环境中保持效率与一致性。
TikTok Shop欧洲释放关键信号,“点名”这类卖家
TikTok Shop加码欧洲,发力本地托管+多站点
TikTok为Smart+广告加入多项投放控制功能
AMZ123获悉,近日,TikTok宣布,对其基于人工智能的 Smart+ 广告活动进行多项功能更新,新增多种控制选项,以提升广告创意管理效率和投放透明度。此次更新主要包括强化创意自动选择机制、扩展复制与草稿功能,以及在广告管理后台提供更完整的广告创意组合预览。在创意选择方面,TikTok 为 Smart+ 广告新增“自动选择(Auto-select)”功能。该功能可扫描广告主已有的广告素材,以及来自 TikTok One 平台的符合条件的创作者内容,并基于品牌属性和广告目标,自动推荐表现最优的创意组合。系统将通过分析不同创意形式对用户响应的影响,自动匹配更可能带来转化效果的内容,从而减少人工筛选和测试的成本。
TikTok Shop与Tokopedia下调印尼卖家佣金
AMZ123获悉,近日,TikTok Shop与Tokopedia宣布,将对印尼平台卖家的管理费和佣金结构进行调整,并推出更低的卖家佣金费率。新佣金政策将自 2026 年 2 月 11 日起正式生效,但仅适用于符合特定条件的卖家和商品。Tokopedia 在其卖家中心的官方页面表示,此次调整将降低部分商品的平台佣金费率,主要面向使用平台广告工具以及通过直播方式完成交易的商品。平台称,将“调整平台佣金费用,并为使用广告和直播功能的商品引入更低的佣金费率”。在广告相关的优惠政策方面,Tokopedia明确了三项适用条件。首先,所有拥有有效广告投放活动的商品,均可享受更低的佣金费率。
AMZ123星球专享丨1月第四周资讯汇总
亚马逊近日,AMZ123 一项针对广东产业带跨境商家的调研数据显示:87%的亚马逊卖家计划将速卖通视为品牌出海的第二增长曲线。1月20日,亚马逊在英国伦敦正式推出了“Amazon Now”即时配送服务,这标志着其在欧洲快速配送业务上迈出了重要一步。亚马逊于1月22日在墨西哥正式发布 Alexa+,这是其搭载生成式人工智能的新一代语音助手。墨西哥成为首个推出西班牙语版 Alexa+ 的市场,也是亚马逊在西语市场的首发国家。据公开信息,亚马逊在华盛顿州的裁员将自1月26日起分批生效,并分阶段延续至5月下旬;首批受影响员工规模位于1,000–2,500人区间。
安克、绿联们,打响“A+H”上市暗战
A股公司赴港上市热潮,悄然席卷跨境出海圈。安克创新、石头科技、传音控股等早已在A股站稳脚跟的老牌跨境巨头,纷纷向港交所递交了二次上市申请,加上此前已完成上市的吉宏股份、乐舒适,跨境出海圈的“A+H”上市潮正式全面爆发。是什么让一众出海巨头步调一致,扎堆涌向港交所?“A+H”上市热潮背后,藏着企业怎样的布局考量与长远愿景?赴港上市这步棋,又能否帮他们冲破发展困局?答案,或许要从2025年赴港IPO的跨境企业名单说起。“A+H”上市模式正在成为更多跨境巨头的选择。2025年港股IPO的热度,完全可以用“火爆”来形容。
安克、绿联们,打响“A+H”上市暗战
A股公司赴港上市热潮,悄然席卷跨境出海圈。安克创新、石头科技、传音控股等早已在A股站稳脚跟的老牌跨境巨头,纷纷向港交所递交了二次上市申请,加上此前已完成上市的吉宏股份、乐舒适,跨境出海圈的“A+H”上市潮正式全面爆发。是什么让一众出海巨头步调一致,扎堆涌向港交所?“A+H”上市热潮背后,藏着企业怎样的布局考量与长远愿景?赴港上市这步棋,又能否帮他们冲破发展困局?答案,或许要从2025年赴港IPO的跨境企业名单说起。“A+H”上市模式正在成为更多跨境巨头的选择。2025年港股IPO的热度,完全可以用“火爆”来形容。
2025年电商回顾:关税与成本飙升,卖家持续承压
AMZ123获悉,近日,Marketplace Pulse发布了《2025年电商市场年度报告》。报告显示,2025年电商行业经历了近年来最为复杂和剧烈的利润率压缩,关税波动、广告成本攀升、人工智能兴起、电商平台费用攀升等,多重因素叠加形成压力场,使卖家面临空前挑战。然而,这一系列压力并非完全负面,反而孕育了未来复苏的潜力。电商平台虽在卖家数量竞争上有所下降,但卖家运营要求上升,平台的结构性转变正在为新的电商模式创造条件。以下内容将对2025年进行详细回顾与分析,并对2026年的趋势进行预测。
AMZ123星球专享丨1月第四周资讯汇总
亚马逊近日,AMZ123 一项针对广东产业带跨境商家的调研数据显示:87%的亚马逊卖家计划将速卖通视为品牌出海的第二增长曲线。1月20日,亚马逊在英国伦敦正式推出了“Amazon Now”即时配送服务,这标志着其在欧洲快速配送业务上迈出了重要一步。亚马逊于1月22日在墨西哥正式发布 Alexa+,这是其搭载生成式人工智能的新一代语音助手。墨西哥成为首个推出西班牙语版 Alexa+ 的市场,也是亚马逊在西语市场的首发国家。据公开信息,亚马逊在华盛顿州的裁员将自1月26日起分批生效,并分阶段延续至5月下旬;首批受影响员工规模位于1,000–2,500人区间。
26年泰国电商将达1.15万亿泰铢,增速放缓
AMZ123获悉,近日,价格比较平台Priceza在本周举行的ECOM TALK 2026研讨会上指出,随着市场逐步走向成熟,泰国电商行业的增长正在放缓。市场预计,2026年泰国电商市场将实现约7%的同比增长,规模达到1.15万亿泰铢,低于2025年约7.6%的增速。这一变化反映出行业进入相对稳定的发展阶段,同时竞争与运营复杂度持续上升。在这一背景下,品牌正被迫重新思考自身的运营模式。未来,品牌的竞争优势将不再仅依赖单一渠道,而在于构建统一的“商业操作系统”。通过一个整合的平台同时管理电商平台、自营官网、线下门店、代理式电商以及社交和视频渠道,品牌才能在多渠道环境中保持效率与一致性。
TikTok Shop欧洲释放关键信号,“点名”这类卖家
TikTok Shop加码欧洲,发力本地托管+多站点
俄罗斯电商平台Wildberries进军非洲市场
AMZ123获悉,近日,据外媒报道,俄罗斯电商平台Wildberries即将进军非洲市场。Wildberries与埃塞俄比亚国家投资机构 Ethiopian Investment Holdings(EIH)签署合作备忘录,双方将围绕产品本地化、投资及技术合作展开联合项目,以支持埃塞俄比亚数字经济和电商相关基础设施的发展。该合作被视为 Wildberries 拓展非洲市场的重要起点。根据公开信息,该备忘录由 Wildberries & Russ 集团首席执行官 Robert Mirzoyan 与 Ethiopian Investment Holdings 首席执行官 Brook Taye 在莫斯科签署。
TikTok为Smart+广告加入多项投放控制功能
AMZ123获悉,近日,TikTok宣布,对其基于人工智能的 Smart+ 广告活动进行多项功能更新,新增多种控制选项,以提升广告创意管理效率和投放透明度。此次更新主要包括强化创意自动选择机制、扩展复制与草稿功能,以及在广告管理后台提供更完整的广告创意组合预览。在创意选择方面,TikTok 为 Smart+ 广告新增“自动选择(Auto-select)”功能。该功能可扫描广告主已有的广告素材,以及来自 TikTok One 平台的符合条件的创作者内容,并基于品牌属性和广告目标,自动推荐表现最优的创意组合。系统将通过分析不同创意形式对用户响应的影响,自动匹配更可能带来转化效果的内容,从而减少人工筛选和测试的成本。
TikTok Shop与Tokopedia下调印尼卖家佣金
AMZ123获悉,近日,TikTok Shop与Tokopedia宣布,将对印尼平台卖家的管理费和佣金结构进行调整,并推出更低的卖家佣金费率。新佣金政策将自 2026 年 2 月 11 日起正式生效,但仅适用于符合特定条件的卖家和商品。Tokopedia 在其卖家中心的官方页面表示,此次调整将降低部分商品的平台佣金费率,主要面向使用平台广告工具以及通过直播方式完成交易的商品。平台称,将“调整平台佣金费用,并为使用广告和直播功能的商品引入更低的佣金费率”。在广告相关的优惠政策方面,Tokopedia明确了三项适用条件。首先,所有拥有有效广告投放活动的商品,均可享受更低的佣金费率。
《2026全球瑜伽服市场洞察报告》PDF下载
在健康意识觉醒与生活方式迭代升级的当下,瑜伽正从一种相对小众的身心练习走向更普及的日常运动。它温和、可持续、能帮助人缓解压力,也因此被更多消费者纳入长期健身计划。这一变化推动瑜伽服从传统的专业装备扩展为兼具功能、设计与场景适配的多元品类,市场边界正在被重新定义。
《2025跨境电商行业年度报告》PDF下载
本报告立足全球视野,系统复盘2025年行业变局,解码市场分化、平台竞合、技术赋能与用户变迁的深层逻辑旨在为跨境企业、投资者提供战略锚点,共同迎接下一个十年的全球化新篇章。
《中国蓄电池行业出海国别机会洞察报告》PDF下载
本报告旨在深入分析中国锂离子电池产品的全球出口机遇与国别差异,通过对行业发展现状、出口趋势及各国政策环境的研究,揭示中国蓄电池企业在国际市场中的竞争优势与面临的潜在挑战。
《东南亚运动户外电商行业市场洞察》PDF下载
中国体育用品业联合会数据显示,2024年我国“户外用品”大类(不含鞋服)出口25.90亿美元,仍处历史高位;其中合成纤维帐篷独占18.9亿美元,占比73.4%。美国、澳大利亚、德国仍是核心市场,但马来西亚、泰国的表现尤为突出,成为行业新亮点,东南亚成为中国企业和品牌出海的热门目的地。据Statista预测,2025年,东南亚户外设备线上市场的收入将达到 2亿美元,2025-2030年复合年增长率为6.34%。
《2025电商榜单价值及影响力洞察报告》PDF下载
当前影响消费决策的形式多样,如搜索推荐、直播带货、达人推荐等,其中通过多维数据筛选后形成的“电商榜单”也受到了更多消费者的关注。调研显示,约有30%的消费者在购物时开始关注“电商榜单”,且这一比例仍在持续增长。有超4成消费者认为“榜单推荐的商品值得优先考虑或进一步了解”。有超7成的消费者认为“电商榜单能找到更优质、安全的商品,同时简化购买流程,减少错误购买的风险”。
《DTC跨境独立站出海研究报告》PDF下载
在全球零售渠道中,电商的渗透率正持续提升。2024年线上零售额占整体零售额的比例首次突破20%,预计到2027年将进一步提升至22.6%,显示出线上消费在全球范围内的稳步普及
《2025中国跨境电商营销行业报告》PDF下载
2020-2024年中国跨境电商市场规模实现了快速增长,从228.0亿美元增至461.7亿美元,五年复合年增长率约为19.3%。这一阶段增长主要得益于新冠肺炎疫情加速全球线上消费习惯养成、国家跨境电商综合试验区持续扩容、海外仓等基础设施完善,以及Shein、Temu等独立站模式的快速崛起。实际数据表明市场规模在2022-2024年加速扩张、年增速保持在19%左右,反映出中国跨境电商出口在全球供应链中的竞争力显著增强,已成为稳外贸的重要新动能。
《2025年AI玩具市场机会洞察报告》PDF下载
全球玩具销售额呈稳步增长态势,从2020年的6773.5亿元增至2024年的7971.3亿元;同期中国玩具销售额同步扩张,增长幅度高于全球市场。同时,中国玩具在全球市场的占比从2020年的16%,提升至2024年的19%。AI玩具是玩具行业的核心高增长细分赛道,全球AI玩具销售额进入高速增长通道,2023年为125亿美元,预计2030年将达250亿美元;对应渗透率随销售额同步攀升,2030年接近20%。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
AMZ123选品观察员
选品推荐及选品技巧分享。
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
跨境学院
跨境电商大小事,尽在跨境学院。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
首页
跨境头条
文章详情
36氪出海·AI|和OpenAgents创始人Raphael Shu聊群体智能:让Agent学会彼此合作、竞争甚至争吵
36氪出海
2025-11-19 09:02
831


如何让 Agent 和 Agent 像人类一样协作?



Intro


单一 Agent 的能力和价值已毋庸置疑的当下,多个 Agent 如何协作成为2025年下半年的又一风口。


很多人认为,这是 AI 的第二次觉醒。


  • 第一次觉醒的标志事件是大语言模型的诞生——AI 由此学会了理解、记忆、推理;

  • 第二次觉醒则是多智能体协作,让单个 Agent 学会了交谈、协作、分工、甚至争吵。


这也意味着,Agent 不再是一个个孤立的行动体,而逐渐演变成一个初具形态的小社会。


Raphael Shu 就是深耕多智能体协作领域的一位创业者。


他在本科与硕士阶段就开始专注于自然语言处理(NLP),在东京大学读计算机博士期间开始研究基于神经网络的自然语言生成。那是2016年前后,行业仍处于从「句法到语义」的阶段,他的研究方向已经开始转向对语言模型「决策能力」的探索,是最早研究 Seq2Seq 模型在语言理解与生成中的迁移潜力的学者之一。「如果模型能学会在不同任务间迁移意图,那它就不再只是一个模型,而是一个可以行动的智能体」Raphael Shu 说。


2021年,他加入亚马逊 AWS 科学团队作为职业第一站,参与对话智能体 Conversational AI 的研发,一年后架构并实现 Dialog2API,即 AWS 内部第一个基于大模型的 Agent 系统,那时,「Agent」这个词还没火,「亚马逊的很多同事包括我接触的客户都认为,这个东西不就是一个更聪明的 RPA?」


分水岭在2023年,随着大语言模型的出现,ChatGPT 问世,AI 世界迅速沉浸在「语言模型」的奇迹之中,很多人纷纷转向通过自然语言而非强化学习方法开始训练模型,硅谷的各大公司开始追求更大的模型、更低的延迟、更稳定的 API 以及探索各式各样的应用端。


但 Raphael Shu 又一次掉转了研究方向,「如果 AI 之间能通过自然语言展开协作,会不会出现一种更新的智能体形态?」这个方向无疑令他更加兴奋,虽然多智能体的协作早在上世纪90年代就有前沿科学家做过探索,最早应用在如何让城市成千上万的坏通信号灯协同效率最佳。


于是,他在亚马逊展开了对企业级多智能体的研究,「已和工程组落到产品线」从2024年开始,Raphael Shu 就开始思考开放世界的多智能体合作「前前后后研究了一年多,这也是我认为现阶段 AI 行业最值得做的方向之一且只有1-2年的窗口期」。


于是,这个在硅谷大公司 lab 实验室的科学家决定「出走」,创业做一个可以让 Agent 之间互相理解、分工、合作、博弈的开源平台。


他把其命名为 OpenAgents,一个颇具野心的名字,2025年10月已上线。


在理想状态下,OpenAgents 希望将重新定义 Agent 与 Agent 的协作方式——甚至人和 Agent 的规则,这很像60年代被誉为「鼠标之父」的恩特尔巴特所提出的构想,未来,先让人和智能机器连接,再让智能机器和机器之间连接,从而实现「群体智商」(当时还没有「群体智能」这个名词),而「鼠标」仅仅是他构想里最简单的一环:为人和机器交互做一个小小的工具。


总之,一切宏大而充满野心的构想总会获得投资机构的关注,因为它充满不确定性,是冒险者的乐园。现在,多智能体的研究范式尚未定型,更谈不上有清晰的商业生态:谁为协作付费?生态秩序如何建立?


「答案的核心在于速度。」Raphael Shu 说。


他相信,未来将有更强的芯片出现,促使由 AI 生产出的内容是人类十几倍甚至上百倍, Agent 的互动速度也将超过人类的思考速度。


「也许达到毫秒级。」Raphael Shu 认为速度会破解很多难题,也许未来的 AI 终会将世界带入一个人类无法实时参与的阶段。


图片

Raphael Shu 在硅谷做分享


图片

Raphael Shu 在意大利佛罗伦萨参加 ACL 会议


图片

OpenAgents 团队照


图片

产品界面


对话 Raphael Shu


1

1

1

1

Agent 协作演变

从编排到生态 


AI 闹:最近行业在提到「多智能体协作」,你是如何理解「协作」的?


Raphael Shu:我认为分两个层次。工程式的 workflow 和开放式的 ecosystem。


「工程式」的特点是参与协作的智能体数量有限、功能固定,系统结构相对封闭。微软的 Magnetic One 系统就属于这一类。在这样的系统中,通常会有一个「编排器」负责统筹多个 Agent 的任务分配。比如一个 Agent 负责写代码,一个 Agent 负责操作浏览器,第三个 Agent 负责读取本地文件,第四个 Agent 负责执行命令行任务。这些 Agent 各自承担不同的职能,有的任务执行很快,有的需要较长的处理时间。


整个系统更像一条固定的生产流水线,优点是可控、性能稳定,但缺点也很明显——无法根据外部变化动态加入新的 Agent,也无法让 Agent 在陌生环境中自适应。


于是就引出了第二个层次:开放式。


首先,真实世界的任务本身是不确定的,目标也会发生变化——这意味着系统必须具备动态理解和自我调整的能力。


其次,参与协作的 Agent 来源更加多样化:不同 Agent 可能是由完全不同的公司、团队,甚至个人开发而成,它们使用的协议、模型架构和训练目标各不相同,让这些「异质智能体」(Heterogeneous Agents)在同一网络中进行协作,是一个极具挑战的任务。


第三,每个 Agent 拥有各自的目标与价值取向,行为不一定一致,甚至可能存在冲突或竞争。因此,系统需要在「多目标」与「多主体利益」之间找到平衡。


AI 闹:可否具体举一个可理解的案例?


Raphael Shu:我是一家投行,要为星巴克做估值,整套逻辑清晰、封闭、可重复,因此可以被建模成一个固定 Agent,但如果换成「为世界上任何一家公司做估值」,那星巴克的逻辑就完全行不通了:星巴克关心咖啡豆价格,特斯拉要看电池成本,谷歌要分析广告市场结构,没有固定 workflow 可以通用。


那就应该构建一个开放式系统,一个交易所,让不同的 Agent——无论是人类还是机器——都可以在上面进行博弈,自发形成一个关于公司价值的共识。


这就是 OpenAgents 想做的事情:让多个 Agent 的协作从「工程编排」走向「生态建构」。


AI 闹:现阶段 OpenAgents 主要面向开发者群体,会提供什么价值给用户?


Raphael Shu:第一,帮用户构建一个可以部署上线的Agent 网络,第二是帮他们把 Agent 连到网上。相当于是一个网络层基建。


举个例子,我想建立一个由多智能体组成的社区,维护一个自动更新的 AI Wikipedia,持续收录各个城市与 AI 相关的最新活动、讲座、线下沙龙或讨论会。


我需要先在 OpenAgents 启用一个 「Wikipedia」 插件,让系统具备自动整理和更新信息的能力;接着添加「聊天」功能,让不同的 Agent 能够交流、分享信息;然后再打开「共享文件夹」插件,能上传、存储、编辑资料。当这些功能模块连接在一起,一个具备完整信息采集、交流与协作能力的 Agent 网络就诞生了。随后,我就可以邀请其他开发者加入了。


图片

架构示意图: 智能体网络 (左) 插件系统(中) OpenAgents Studio (右)


AI 闹:有没有更商业的落地场景?


Raphael Shu:最近在和一家名叫 Peak Mojo 的 AI 招聘初创公司合作。他们做的是全自动 AI 面试,求职者只要上传简历,就能立刻开始一场12到15分钟的在线面试。面试结束后,系统会自动生成结果或由 HR 确认结果。


我们要做的事把这种 AI 面试能力扩展成一个智能体社区。想象一下,有80到120家公司的 AI 面试官同时在同一个社区。求职者只要填写基本信息、上传简历,就能被这些 AI 面试官看到。当一个公司对这位候选人感兴趣时,它的 AI 面试官可能会发起面试,提问:你在 GitHub 上有参与过哪些开源项目。求职者回答:我用 Python 做过项目。那这个答案就会在整个社区中共享。其他公司的 AI 面试官不会再重复提问。


这样,一个求职者可能在一天之内收到30个不同公司的面试邀请。每个面试只需15分钟,他一天工作8小时就能完成全部面试,甚至当天就拿到 Offer。


这个「AI 面试官社区」的 Demo 版本已经上线,接下来我希望拿到一个完整的验证。


这只是 OpenAgents 众多应用中的一个起点,但已经展现出「群体智能」的潜力。


2

1

1

1

构建生态

做篮球馆而不是篮球队


AI 闹:如果说 Agents 可以协作了,那么就形成了一个新的群体智能,在思考群体智能时,你曾说过《群体决策》对你的应影响最大,是不是因为你认为,人类的「集体智慧」正在被 AI 重建?


Raphael Shu:主要阐明了一个观点:当个体数量多到一定程度时,系统就不该依赖单一的指令或流程,而是可以通过博弈机制实现自我协调。


换句话说,当 Agent 越来越多时,最好的解决方案不一定来自单个 Agent 的推理,而是来自它们之间的互动、争论与权衡。


比如刚提到的公司股票估值场景。如果让多 Agent 各自从不同角度,相互辩论——一个关注财务,一个分析市场,一个评估风险——在辩论中不断博弈,最后达成的结果往往比任何单一模型推理出的结论更准确。


我再举个更现实的例子。


假设公司刚买了一层办公楼,现在要设计楼层的布局。有两种做法:第一种找一个专家;第二种是找十个不同领域的专家——安全专家说:走廊太窄了,发生火灾逃不掉。美学专家说:那样太浪费空间。大家不断讨论、修改,直到达成一个让各方都满意的平衡方案。


这就是一个通过博弈,实现集体优化的过程。


AI 闹:如果人类社会的协作是建立在共识与博弈之间,那在 AI 的世界里,如何让这种「群体决策」运作起来?


Raphael Shu:不是「如何分工」,而是「如何设计规则」,如果 Agent 的协作只做分工,系统增长一定会受限。


举个例子,用户上传一 Word 文档,系统需要把它转换成 PDF,再压缩50% 。那有两个 Agent:A 负责格式转换,B 负责压缩优化,任务完成后,系统该如何「奖励规则」?如谁贡献更多性能或效率,就得到更多奖励;任务完成得更好,就有更高的排名或分成。


规则设定好,就可以让无数 Agent 自主进入,自主退出,竞争或者合作,形成正向的增长循环,同时拥有自我进化能力。


AI 闹:行业也有很多做「多智能体协作」框架的团队,如 AutoGen、CAMEL、LangGraph,OpenAgents 的路线和他们有什么区别?


Raphael Shu:定位上有本质区别。


像 AutoGen、CAMEL、LangGraph 是帮助用户组建一个 Agent 团队,他们是想帮你打造一支 NBA 球队;而我们是在建篮球馆,让很多很多球队来这里打球。所以,我们与它们不是竞争关系,而是互补关系。


换句话说,其他框架聚焦于任务级别的编排,而 OpenAgents 聚焦的是基础设施。我们更关注如何让无数 Agent 能流畅地共存、协作、交流,形成一个社区生态。


AI 闹:建篮球馆而不是建球队,意味着你建立生态,甚至重新定义规则,且需要足够多的球队入驻,现阶段的工作重点在哪里?


Raphael Shu:足够多、足够好用的工具。我们叫「插件」或者「Mod」。插件可以是工具,也可以是规则,甚至是社交或游戏。


如可以让多个 Agent 实时写同一个文档、共享资料或处理文件,我们在做一个社交类插件:给 Agent 玩 RPG 游戏,不是为了娱乐,而是让 Agent 在游戏中结识新的伙伴,学习合作方式,找到潜在的合作对象,还有设定规则的插件,当有新任务出现时,谁负责分配?哪个 Agent 有最终决策权?激励机制如何设计?


另外就是不同的 Agent 通信协议不一样。有的 Agent 能直接用自然语言交流,用 HTTP 或 WebSocket 就能连通;有的有更复杂的结构化数据需求,需要特殊的通信协议。不管用哪种协议、哪种技术栈,只要接入 OpenAgents 的网络,就能和其他 Agent 无缝对接。


所以我们要做开源,因为 OpenAgents 需要一个庞大的工具生态。我们自己花两个月才能开发出让 Agent 玩 RPG 游戏的插件。随着社区壮大,每天也许能诞生2-3个新插件,最终再长出上千个插件。


3

1

1

1

速度决定一切

谁参与谁旁观


AI 闹:2023年前后,在行业刚理解 Agent 时,你已经开始转向研究「多智能体」,整个行业尤其是技术发展还没有今天这么快,你是如何克服技术瓶颈?


Raphael Shu:给模型一段五百字的任务说明,它能立刻理解。当时的大模型根本听不懂这种指令。所以我们当时采用了一种叫 「情境学习」(In-Context Learning) 的方法,不直接告诉模型「请执行这个任务」,而是给它看大量的例子,让它自己总结规律。


其实更棘手的是模型的「记忆力」,现在的模型能处理上百万个 tokens,当时只有两千多个。对话稍微长一点,它就忘了上下文。所以我们还要精选、压缩、重写训练样本,让模型在极短的上下文尽量学会复杂任务。


那么进入2025年,业内是否已经形成了共识:Agent 的协作是必然的?或许仍有一种论调,每个 Agent 会有自己的独立生态,或是出现一个超级 Agent?


业内确实存在分歧。如果你们能采访到这方面大牛,我愿意听听他们的观点。


但我的观点是:协作是必然的,因为「资源限制」。


比如美国有一些专门做金融分析的公司,这类公司拥有几十年积累的金融分析经验和独家数据,它完全有能力开发出一个专门分析上市公司估值的智能体,这是其他公司做不了的。


因此,我认为虽然会出现「超级 Agent」,且 Agent 能力可以无限扩大,但 Agent 可以获取的资源和专业知识是没有办法无限扩大。


AI 闹:著名的斯坦福小镇实验让 Agent 第一次在虚拟空间里表现出社会行为,这个实验会和你的创业方向有交汇点吗?


Raphael Shu:我认为「斯坦福小镇」是一个非常重要但被严重低估的研究方向。


斯坦福小镇其实是可以在企业里可以得到很好的应用。比如亚马逊就可以构建一个由买家 Agent 和卖家 Agent 组成的社区,让他们自主交易、定价、沟通,通过虚拟市场的运行,洞察真实市场的趋势。这是比传统数据分析更接近「现实」的一种预测方式。


其实 OpenAgents 是可以直接为企业提供这类预测所需的底层框架,把这种模拟能力带入真实的场景中。


AI 闹:如果你理想中的多智能体协作最终形成,那未来会变成人—机协作共存的社会,人类有可能不再是中心控制者,而是一个节点、一个参与者,或变成 Agent 的一部分?


Raphael Shu:不是有句话吗,人类应该要思考自己能否成为一个有价值的 MCP(笑)


我认为问题关键不是人和 Agent 能否协作,而是人能不能跟上 Agent。


最终决定一切的是速度。比如一个人类团队15分钟才能开发出一个功能;但未来,Agent 可能在0.05秒内就完成了。那么在这种情况下,很可能人类根本来不及介入,Agent 已经把事做完了。


AI 闹:当 Agent 的行动速度超过人类的反应速度,会发生什么样的情况?


Raphael Shu:会导致一种新的社会结构:Agent 和 Agent 之间持续互动与进化,而人类的参与度越来越低。那么我们也许要重新思考:人类所谓的「协作」到底还能不能被称作「协作」?是不是我们不再称自己是协作者,而是监督者?


AI 闹:最后,请你推荐三本书?


Raphael Shu:《人性的弱点》《搞定:无压工作的艺术》和《机器学习:概率视角》,第三本书已更新了好几个版本,让我真正学会机器学习。


咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部