AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

AI|对话Sheet0.com创始人王文锋:Agent下一阶段的关键要素:可解释、造工具和100%确认美学

2298
2025-10-29 17:59
2025-10-29 17:59
2298

想系统掌握亚马逊广告的投放逻辑与底层闭环?点击免费学习《亚马逊广告基础逻辑》


为什么让 Agent「动」起来是下一步的关键因素?



01


行业如今的关键是「谁能造出一个真正有用的 Agent?」


讨论的焦点问题变成「Agent 的认知边界」:有多大的自主性?需要多强的上下文理解?又如何在现实任务中保持稳定?


这背后需要实践者具备四种超强的能力:即对模型的边界预估,对复杂系统的理解力、对产品工程的实践力,以及对商业场景的洞察力。


在 Sheet0.com 的创始人王文锋看来:Agent 本质上是一种「利用模型知识,结合实时信息,使用工具解决问题」的产品形态。


他提出的关键问题是:为什么模型本身已经达到博士水平,但很多Agent 的表现仍停留在实习生阶段?


这中间的 GAP 关键在于在「实时信息」和「工具设计」层并没有很好的适配模型能力。


Sheet0.com 就是他对 Agent 的认知落地:一款在 AI 时代为模型提供可扩展的实时数据获取能力的产品。今年8月中旬,产品上线, 主要面向数据分析师、产品经理、工程师、市场营销人员等在数据收集处理上花超过5个小时的用户。


一个典型的用户场景:一位销售在寻找潜在 AI 行业客户,过去,他要先通过 LinkedIn、X 等社媒,收集公司信息,再分析该公司是否为 AI 行业公司,还需要寻找目标联系人联系方式等等。而搭建这样一个程序,需要一个工程师4-8周的时间。而 Sheet0 只需要30分钟内就可以给用户交付完整的数据表格。


王文锋认为,产品核心解决的问题是让无论是个人、企业还是 Agent 这个新个体,都可以随心所欲的获取数据,解决问题。


「在经济学里面有个概念叫价格弹性,是一个衡量价格/成本发生变化时,需求会如何变化的指标。数据领域往往价格弹性远大于1,这意味着10倍的成本下降,带来的不是需求的10倍增加,而是几十倍甚至上百倍」


图片

王文锋在 SpaceX 的星舰基地


图片

sheet0 日常团建,举着 sheet0 的是王文锋


02


尽管 Sheet0 在数据获取环节已经帮用户做到10倍提效,但王文锋并没有将「省时间」作为产品的核心价值,他认为「准+快」才是 Sheet0 的长期核心价值。即:


1、 必须保证给用户交付的数据100%准确。


2、在单位时间内,尽可能提高数据的交付量。


构建人与 Agent 之间的信任,是一个长期的命题。「这背后是作为工程师也要信任模型。」


Sheet0 所有的系统行为都被分解成可以追踪、可复用的「语义步骤」,Agent 必须理解自己在做什么,并在出错时可以进行自我修复。这是王文锋的设计哲学,「在 Agent 干活之前,先让他变聪明。」


而让 Agent 变得可解释,是 Agent 下一步发展的关键环节。


作为连续创业者,王文锋自2017年毕业后,先是写了四年代码,期间曾负责地平线 AI 数据平台。 2021年和朋友合伙创业,作为 CTO 研发了新一代的 Serverles 消息队列,在 Data Infra、AI 领域积累了近十年的开发经验。2023年加入 AI 浪潮,开始了自己的第二次创业和 CEO 之旅。


AI 闹见到王文锋时,他刚从美国回来,时差还没有完全倒明白,sheet0 现在主攻美国市场,一半的团队在美国,10月将全量上线。


我们的话题围绕在 sheet0 上线两个月后,他对 Agent 的最新思考。实时数据的获取只是第一步,他接下来计划为大模型造更多的工具,他认为让模型自主学会使用工具,是 Agent 未来的竞争关键:「每造出一个新工具,相当于为模型解锁了一个新技能。」


图片

Sheet0 的用户界面


图片

Sheet0 的产品展示


话王文锋


1

1

1

1

可解释

先变聪明再变强


AI 闹:beta 版本8月上线后,用户是否接受这款产品?反馈如何?


王文:从注册用户、付费数据,比我预期要好不少。


现在80%的用户来自于发达国家,第一是美国,第二是日本,其中60%的用户每周在数据工作方面消耗时长超过5个小时。


日本是超出我预期的一个市场,好像是有一个日本博主把我们在美国做推广的帖子搬运后,来了很多日本流量。后来我调研发现日本用户的付费意愿更强,是因为他们的数字化基础比美国落后不少,使用 Excel 等传统数据工具的用户更多。


不过现在的主要目标是先把美国市场做好,美国市场起来后打其他市场可以事半功倍。


AI 闹:中国市场呢?


王文锋:我第一次创业也是做软件,我的经验是,美国竞争很激烈,但都有钱赚。因为能赚到钱,所以大家对做事情更有信心一些。国内软件的商业化土壤一言难尽。


AI 闹:进入真实的用户场景后,现阶段 Agent 需优化的最棘手的问题?


王文锋:如何构建一个合理的反馈闭环,这是非常细致的一个工程,比我想象的难度要大。


解决这个问题给我启发最大的是 Claude Code ,它让我意识到——Agent 要真正聪明,关键不在于「能做多少事」,而在于它能不能「知道自己在干什么」。


Claude Code 系统完全是事件驱动的,每一个动作、每一次变化,它都会自动记录成一条带语义的信息。


比如说,它会在工作过程中发出一种叫 reminder 的内部消息,用来提醒自己注意某个细节,但这条消息用户是看不到的。换句话说,它不仅知道「怎么做」,还知道「为什么要这么做」。


AI 闹:「带语义的信息」具体指什么?


王文锋:举个例子,你让 Agent 去整理一张网页上的表格。它可能要花四五步才能完成:打开网页、识别内容、发现错误、修改数据。但对模型来说,四五步太冗余了。


能不能把这些过程压缩成一句有意义的总结,比如「因为发现数值错误,系统自动调整了这一列」。这样一来,Agent 就不再是机械执行,而是能带着理解去行动。


它的每一步都有清晰的定义,可以被记录、被复用、被优化。


现在,我们架构上基本已经调整成类 Claude Code 的形式。希望 Agent 不只是执行指令,而是能像一个真正的「人」,理解自己为什么要这么做。只有这样,它才能不断进化。


AI 闹:Sheet0 没上线之前,你在一次行业分享中曾说过 Context engineering 是 Agent 成败的关键,这个思考现在有变化吗?


王文锋:没有,反而会觉得更重要了。Agent 想变得更聪明,关键是 Context 要够多、够细。包括用户的使用记录、任务执行过程中的反馈、失败案例等等。


只有积累到一定程度,Agent 才能真正学会在不同场景下该怎么做。


AI 闹:你认为具体需要多少才算积累到位?


王文锋:没有标准答案。因为 context 的类型太多样了。


我们现在有一个做法:当用户任务执行失败,比如某个网页数据没采集下来,我们会记录下失败案例,然后再去找类似任务里那些成功的案例,对比两者的差异。成功的路径,我们提炼出来、结构化保存,放进内部知识库。下次再有类似任务,系统就能直接调用这些经验,成功率会更高。


你可以把它理解成,我们在给 Agent 建记忆——每一次出错、修复、成功,都会变成它下次做得更好的基础。


AI 闹:听起来有点像是给模型建立 bad case 库?


王文锋:可以这么理解。当积累到足够多的经验后,这些数据就能直接拿去微调模型。原来它靠外部经验,慢慢就会变成模型自己的知识。也就是说,Agent 在一次次失败和修复的过程中,逐渐学会了避免犯同样的错误。


AI 闹:这个过程现在能自动化吗?行业有些做法会训练一个小模型去 check?


王文锋:目前还没办法完全自动化,我们是半自动的流程。人还是要参与做一些轻量级的标注或分类。


大家都在讲「端到端」,希望模型从头到尾自己搞定一切,但现实情况是没到那一步。


我觉得我们并没有脱离有多少人工,就有多少智能的阶段,LLM 只是放大了人类工作到 Agent 智能之间的杠杆;另外还有个关键是我们需要知道什么时候可以离开人工。


2

1

1

1

实时数据

从使用工具到创造工具


AI 闹:很多人质疑 sheet0 更像是一个传统的表格工具或者爬虫工具?


王文锋:我知道外界会有这样的印象。原因也挺简单的——因为 Sheet0 现在从能力上来说确实只有一个基础能力:从网页收集数据。


Sheet0 的目标是「在 AI 时代提供可扩展的实时数据获取能力」。


因为 Agent 的目标是 take actions,所以需要做决策,而做决策一方面需要依赖模型知识,另一方面还要依赖实时数据。比如「明天穿什么衣服」这个问题,模型就至少需要知道明天天气、去哪里找实时数据才能作出决策,光有知识还不行。


为了实现目标,Sheet0 采取的方案是 bottom-up 重新为模型构建出一整套的「数据工作环境」,构建这个环境的第一步,是可以将「任意的数据源变为动态的结构化表格」,而我们最先选择的数据源就是网页,因为它受众广,商业化价值也够高,让我们可以在 day 1 就开始赚钱。


所以现在大家说我们像「表格」或「爬虫」工具,有点像我们养狗,在狗子成年前都会有一段尴尬期。而 Sheet0 就在这样的尴尬期。我相信6个月以后大家再来看 Sheet0,就不会这样说了。我们会有更创新的产品形态交付给大家。


AI 闹:现在,你怎么看模型的能力边界和 Sheet0 的分工?


王文锋:其实我更想说模型和 Agent 的区别。


Agent 本质上利用模型知识,结合实时信息,使用工具解决问题的程序。今天我们看到基座模型在多个领域已经达到或接近博士水平;但是在实际的产品表现上面,还停留在实习生。


这里面的核心是实时信息和恰当工具的缺失。


我们讲「工欲善其事必先利」,所以 Sheet0 核心是在围绕数据场景设计一系列的「趁手工具」,并不会过多的去考虑模型的边界,因为我们相信在长期来看,模型是没有能力边界的。


对于模型厂商而言,如果一个工具的复杂性过高,就意味着它们一定不会去做,因为复杂的工具意味着需要 own 一个复杂的 infra。


AI 闹:基于上面的认知,你认为有哪些有巨大商业潜力的方向等待开发?


王文锋:比如最近我们的用户想做一件事情,需要找1000个英国 K12 的家长。传统办法是找当地的社区网站、或脸书的一些用户群组。


但换个角度想,什么样的人完成这个任务最简单,肯定是本身就在英国读书的孩子,假如他们有自己的 Agent,跟他的 Agent 联系一下,让他们收集20个家长联系方式,酬劳100块钱,肯定有人愿意(假设不考虑合规问题)。


现阶段这些数据是离线的,但却是最有价值的,如何更方便的获取这些数据也是我们的主线目标之一。这是让我最兴奋的部分,肯定会想出办法解决。


未来,我希望 sheet0 可以为用户收集整理所有数据,私有的,公开的和个性化的,并以结构化的方式交付。之所以强调结构化,是因为结构化数据天然是带有语义的,而且可以进一步通过类似 SQL 的工具让模型实时创造工具。


AI 闹:你觉得2025下半年到2026年,Agent 行业还有什么新机会?


王文锋:具体我说不上,但是我可以分享一个概念:价格弹性。


这是一个经济学上的概念,用于衡量当解决的问题的成本下降的时候,需求增加或减少的程度。当价格弹性为1的时候,意味着成本下降10倍,需求也会增长10倍。我的建议是可以思考哪些领域的问题是价格弹性大于1的,这些问题都非常值得用 Agent 的方式去解决。


3

1

1

1

100%确认美学

信任是第一要素


AI 闹:现在模型不可避免存在幻觉,以及 Agent 还严重缺乏 Context 的情况下,你为什么格外强调自己100%的准确率?


王文锋:我的理念是做 Agent 首先要让用户信任,信任很重要,背后也是工程师要信任大模型。


模型的「幻觉」由它的底层原理决定的,它的本质上是在「总结信息」——比如说我给它两百个网页,它会自己判断筛选出其中的一百个,然后再去总结内容。但压缩总结这件事是有风险的,它可能会理解错、归纳错,「幻觉」就是这么来的。


但是我们抓数据的逻辑更接近「复制粘贴」,你可以理解成,sheet0 就像一个认真抄笔记的人——网页上是什么,它就一模一样抓下来放进表格,比如说网页上是一张公司信息表,我们抓下来的数据在表格里也是一模一样。


在技术上,我们底层全是动态生成的代码,所以才敢说给用户交付的数据是100%准确的。


AI 闹:初期阶段就追求100%准确会不会导致进度慢?


王文锋:短期内确实会慢,因为我们做了很多 Infar 层面的努力,但我觉得长期来看,这是「慢就是快」。我们尽量避免做消耗动能的事情,而是长期积累势能。

就像我前面提到了,我认为构建 Trust 是人和 AI 之间的终极命题,我们需要在 Day 1 就坚持去做这件事情。


很多人不看好我们,我非常理解,因为相信,所以看见,我不能这么去要求别人。我过去的失败经验告诉我,选择坚持什么非常重要,这个是创始人的品味。


AI 闹:现在你中美两地跑,这一年美国的 AI 创业环境给你什么启发?


王文锋:我和很多美国的创始人交流,发现他们和中国创业者最大的区别是,他们敢于勇敢创新,敢于 bet(下注)。而中国的创业者,今天一上来就会被问「你的用户是谁、他们为什么用你、怎么保持用户粘性、竞品是什么、大厂干了后怎么办」,这其实是很让人难过的事情,因为过早的关注这些问题会扼杀真正的创新。


Lovable 火了以后,人们才发现用的最多是产品经理和销售,而不是程序员;同样在 Manus 诞生之后,人们才发现原来一个人真的可以一周看100个研报。


AI 产品应该从人性角度出发,在恰当的节点「打造出符合大家对未来想象的产品」。I know it when I see it。


图片

王文锋和他的柯基小狗叫「鸡腿」


图片

前景背包是王文锋,他日常热爱徒步,图在美国某国家公园


AI 闹:创业2年,前两个都没推进下去,有没有心理上的至暗时刻?


王文锋:有的。2024年10月份—12月底接近3个月的时间,真的是一片灰暗。那时第一个项目黄了,第二个项目决定不做了,新方向还没定,完全丧失了信心。加上我妈妈那会身体非常不好,应该是有点抑郁。


当时有非常想躺平的感觉,创什么业,为什么这么辛苦这么累;在3月份处理完我妈妈的后事之后,我又回到了北京,开始触底反弹。Sheet0 就是在这种状态下一点一点探索出来的。


加上回过头去看,当时做的第1个产品和第2个产品其实方向都很正确,但是就是因为太在意短期目标,中间没能推进下来。


之前有朋友问我,觉得做 CEO 最关键的能力是什么?我的回答是对痛苦的长期耐受力。而之所以能够忍受痛苦,一定是有一个更强的信念在支撑。所以我想告诉很多创业者,一定要相信自己!

12.12 厦门emag沙龙-文章页底部
TikTok、Facebook、谷歌、Twitter广告服务,0门槛抢占全球流量!
极速开户+优化投流+风险保障+效果跟踪,仅需4步,轻松撬动亿万海外流量,让品牌销量翻倍增长!
已成功开通5000+账户
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
俄罗斯电商市场快速增长,综合平台优势大于独立站
AMZ123获悉,近日,Euromonitor、EMARKETER及Yakov and Partners发布了《俄罗斯电商市场发展现状》报告。报告基于2020-2024年的数据,对俄罗斯电商市场的发展趋势、综合电商平台与独立电商的竞争格局、各品类表现、未来市场预测进行了系统分析。一、俄罗斯电商趋势1.互联网渗透率增长放缓2020至2024年,俄罗斯互联网使用率从78.1%(约9560万用户)提升至85.5%(约1.04亿用户),四年间增加7.4%(新增约790万用户)。俄罗斯的互联网渗透率增速正在逐年放缓,预计到2029年互联网渗透率将达到89%(约1.08亿用户)。
越南加强进口商品监管,修订多项增值税和海关规则
AMZ123获悉,近日,越南海关公布了2026年对增值税(VAT)、特别消费税(SCT)及电子交易管理的多项修订,核心在于统一税制规则、扩大免税范围并加强跨境与电子化申报管理。此次调整既有减轻企业合规成本、扶持出口与产业链升级的内容,也伴随对部分消费品与临时进口再出口环节的更严监管,直接影响生产、进出口和跨境电商卖家。在增值税方面,新法律将此前零散的官方函件并入法律和配套法令,提升透明度并便于电子化处理。关键变化包括扩大增值税免税目录:列入政府清单的自然资源与矿产(无论原料还是加工品)在出口时被明确归为增值税免税项目。
TikTok Shop黑五复盘,一堆中国卖家晒出百万GMV
黑五复盘,TikTok卖家:“库存差点给我爆完了!”
存生命危险!美国CPSC紧急召回超1万件儿童手写板玩具
AMZ123获悉,近日,美国消费品安全委员会(CPSC)宣布,紧急召回亚马逊在售的KTEBO品牌的儿童书写板玩具,原因是该产品未能符合玩具类产品的强制性安全标准,电池仓固定螺丝无法保持牢固,可能导致纽扣电池外露。若儿童误吞纽扣电池,可能造成严重伤害、内部化学灼伤,甚至威胁生命。此次召回涉及KTEBO品牌的双件套书写平板玩具,召回数量约10,380件,产品提供四种颜色组合,包括粉色/蓝色、绿色/黄色、橙色/蓝色以及紫色/红色,并有8.5英寸与10英寸两种规格,每套配有与机身同色的手写笔。
AliExpress波兰11月增长显著,双十一活动日活用户增长37%
AMZ123获悉,近日,AliExpress的数据显示,平台11月的消费者参与度与卖家销售额大幅增长。今年11月11日至19日举行的AliExpress双十一购物节活动期间,波兰用户的参与度显著提升,日活跃用户数量同比增长37%。随着去年秋季AliExpress开放波兰本地卖家入驻,今年波兰本地卖家的参与度也明显提高,他们在此次双十一促销期间的GMV同比增长74%。从消费偏好来看,智能生活类产品持续吸引波兰消费者,智能家居与清洁设备成为销售榜单的主导品类。Dreame、ILIFE、Laresar等品牌的扫地机器人和自动吸尘设备进入最畅销产品行列,反映波兰家庭对智能化、便捷化生活方式的需求不断上升。
亚马逊印度计划投资127亿美元,推动本地云和AI基础设施建设
AMZ123获悉,近日,亚马逊宣布,将在2030年前进一步推动人工智能在印度的普及,计划投入127亿美元建设本地云和AI基础设施。亚马逊表示,这项长期投资将为超过1500万家中小企业带来AI应用能力,同时在2030年前为400万名公立学校学生提供AI素养课程与职业教育,提高数字技能普及度。亚马逊认为,AI正成为提升印度数字包容性的关键力量,能够突破语言、读写能力与访问渠道的限制,让更多个人与企业受益。在中小企业领域,亚马逊正在推出新一代AI工具,以降低经营门槛、简化业务操作并提升增长效率。
“黑五网一”DTC投放数据复盘,流量都去哪了?
2025 年“黑五网一”大战,终于落下帷幕。除了 GMV ,这场仗花了多少“弹药”,你算清楚了吗?流量场上的每一发子弹,都正中靶心了吗?偏离的原因找到了吗?除了看自己后台的数据,还要看清整个大盘的趋势——这决定了我们下一步该往哪儿走。基于 GoodsFox 监控的投放数据,我们有以下发现:服装、美妆的竞争力度只增不减3D 打印与机械键盘,从“小众圈层”跃升为热门赛道宠物经济的流量稳定,不靠爆点也能撑起大盘这些变化背后,都在重塑今年“黑五网一”的投放结构,我们先从流量基本盘讲起——尽管每年都有新风口,但从广告投放的绝对体量来看,传统大盘仍在支撑整体流量水位。
还在“索评”?亚马逊Review管理的红线与出路
亚马逊的评论管理格局是如何改变的?首先要明确一点:过去几年,亚马逊的Review生态系统发生了剧变,这对各类管理工具产生了深远影响。在买家端,那些专门用来标记“虚假评论”(或帮助买家鉴别真伪)的老一代工具正在失效甚至消失。不少买家就因为Fakespot在平台冲突、合规问题和数据接口变更的压力下关停而感到措手不及。Fakespot是一个分析电商产品评论真实性、帮助消费者识别虚假评价的平台。在卖家端,亚马逊的政策合规和风控机制变得更加严厉。这意味着Review的风险红线变了:以前那些“地毯式索评”或“送测(Giveaway)”的套路可能有效,但现在操作这些手段的封号风险极高。
AMZ123PayPal计算器使用指南及常见问题详解(内附计算公式)
Paypal手续费计算器介绍及计算公式分享 https://www.amz123.com/tools-paypal
重磅!亚马逊公布2026年战略重心变化
AMZ123获悉,12月4日,2025年亚马逊全球开店跨境峰会上,亚马逊回顾了过去一年里中国卖家在亚马逊上所取得的进展,并围绕2026年四大业务战略重点——供应链服务、AI赋能、全球拓展布局、本地服务,揭晓了40余项创新举措。根据亚马逊披露的数据:2025年以来,中国卖家通过亚马逊全球站点售出数十亿件商品,在美欧等成熟站点的销售额增长超过15%,在新兴站点的销售额增长超过30%;2025年以来,销售额达到200万、500万、800万美金的中国卖家数量,增长均超过20%;销售额超过1000万美金的中国卖家数量,增幅近30%。
亚马逊新功能,能救你一整条链接!
最近有卖家后台发现,亚马逊多了一个新功能,看起来不起眼,实则很关键——绩效提醒(Performance Notifications)。这个功能解决了我们运营过程中的一个老大难:链接出问题时能不能第一时间被提醒?以前我们发现Listing出状况,大多靠“事后诸葛”:出单突然断了,去查是不是被下架;关键词排名一夜暴跌,才想起去对比转化率;广告Acos拉爆、CTR异常,才知道图可能挂了;等你发现问题,可能已经晚了。这次,亚马逊终于“良心发现”,开始主动提醒你链接的数据异常了。这个新功能到底能干啥?说白了,它就是一个链接级别的数据异常预警系统。
宠物消费持续升温,亚马逊10款月销过万宠物产品推荐
AMZ123获悉,近日,亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。1. 猫咪情绪舒缓喷雾预计销售额:139.84万美元/月销量:26,000+星级评分:4.4好评数量:12,694+图源:亚马逊产品描述:FELIWAY Optimum猫咪情绪舒缓喷雾的专利信息素复合物能显著减少猫咪的应激表现,包括喷尿、抓挠、恐惧反应、紧张冲突等。产品无药性、安全且不干扰人类与其他宠物,每个喷雾覆盖面积约 700 平方英尺。
“月薪3W”的运营因工作敷衍被辞,一线运营应具备哪些综合素质和竞争力?
匿名用户我的C位上个月公司招的一个运营离职了面试的的时候表现非常好据他所说,他上一份工作的综合薪资在3W左右面试的时候他的想法也是有的,所以我也给的比相对比较高的底薪。
跨界AI失败?深圳大卖资产重组终止!
12月2日,跨境3C 配件大卖杰美特发布公告,宣布决定终止筹划以现金方式收购AI 算力解决方案提供商思腾合力(天津)科技有限公司(以下简称“思腾合力”)控制权的重大资产重组事项。这场筹划半年、备受行业关注的跨界收购突然落幕,消息一出引发市场热议。AMZ123获悉,杰美特于2025年6月21日首次披露了筹划重组的提示性公告,拟通过现金交易控股思腾合力,该交易初步测算构成重大资产重组,且不涉及发行股份、不构成关联交易,也不会导致公司控制权变更。杰美特是“中国手机壳第一股”,主营业务为移动智能终端保护类产品的研发、设计与销售,产品包括手机、平板及穿戴设备的保护壳与表带等。
还在“索评”?亚马逊Review管理的红线与出路
亚马逊的评论管理格局是如何改变的?首先要明确一点:过去几年,亚马逊的Review生态系统发生了剧变,这对各类管理工具产生了深远影响。在买家端,那些专门用来标记“虚假评论”(或帮助买家鉴别真伪)的老一代工具正在失效甚至消失。不少买家就因为Fakespot在平台冲突、合规问题和数据接口变更的压力下关停而感到措手不及。Fakespot是一个分析电商产品评论真实性、帮助消费者识别虚假评价的平台。在卖家端,亚马逊的政策合规和风控机制变得更加严厉。这意味着Review的风险红线变了:以前那些“地毯式索评”或“送测(Giveaway)”的套路可能有效,但现在操作这些手段的封号风险极高。
AMZ123星球专享丨12月第一周资讯汇总
亚马逊亚马逊的AI购物助手Rufus已新增识别虚假折扣的功能。用户可以查询商品在过去30天内的价格走势,系统将显示当前价格、促销价及历史折扣时段,并提供价格曲线图以辅助决策。市场研究机构Wells Fargo估算,亚马逊在美国服装市场的影响力持续扩大。亚马逊服装与鞋类品类在2024年销售额超过670亿美元,占据近13%的市场份额;预计在2025年销售额将超过720亿美元。亚马逊宣布,自12月15日起,对欧洲市场卖家收费进行大幅调整,重点下调服装与配饰等低价商品的推荐费,并在2026年继续对多个类别下调推荐费与履约费,以应对来自Shein、Temu等低价平台的竞争。
《亚马逊生活日用品类攻略手册》PDF下载
作为日常生活不可或缺的重要组成,生活百货品类覆盖范围广泛,包括家居用品、家具、车用配件、户外装备、园艺 工具、运动器材、家装用品、厨房、玩具以及宠物用品等众多领域。这类产品不仅是满足基本生活所需,更体现了人们对美好生活的向往和追求。
《掘金泰国-市场洞察与战略机遇报告2025》PDF下载
随着全球经济一体化的加速,泰国作为东盟的核心枢纽,凭借其独特的地缘优势庞大的消费市场以及持续优化的营商环境,成为众多企业战略布局的重要目标。本报告深入剖析泰国市场的政策红利、消费趋势、产业机遇以及合规挑战,旨在为有志于开拓泰国市场的中国企业提供行动指南,助力企业在东盟这片充满活力的土地上把握机遇、应对挑战、!实现可持续发展。
《2025欧美假日购物季营销指南》PDF下载
2025年美国假日购物季零售额预计同比仅增长1.2%,总销售额约1.359万亿美元,虽仍保持正增长,但为2009年以来最低增速,市场正在步入低增长的新常态。
《2025年跨境电商东南亚市场进入战略白皮书》PDF下载
东南亚电商,正以惊人的速度复刻中国电商高速增长的黄金时代。2024年东南亚电商GMV达到1284亿美元,短短5年涨幅超过3倍。全球电商2024年GMV增幅最快的十大市场中,东南亚独占四席。东南亚是拥有约6.7亿人口的广阔市场,在现今全球关税的不确定性大格局下,因其电商基建完善,利好的贸易政策,和更高的年轻人口占比,成为跨境卖家生意拓张焦点之一。
《2025年TikTok Shop玩具品类行业报告(欧美站)》PDF下载
分析TikTok Shop美国市场、英国市场、西班牙市场、墨西哥市场等主流市场点短视频及直播电商数据,选取TikTok与玩具爱好品类相关的内容进行分析报告。
《2025 洗护品类趋势与创新洞察》PDF下载
本报告独特价值:将消费者的“行为结果”据),揭示消费者深层心理动机、并能精准预判未来增长机会
《亚马逊双轨增长指南》PDF下载
亚马逊以“以客户为中心”为核心理念,通过整合B2B与B2C的全渠道服务,帮助卖家实现“一店双拓”-- 一次上架,同步触达个人消费者与企业买家,获得双重收益。同时,基于Direct to Buyer(直接触达买家)的模式,更能有效减少中间环节,提升利润空间与品牌掌控力。
《亚马逊全球线上商采趋势与区域洞察》PDF下载
随着全球企业数字化转型的深入推进,B2B商采有望成为下一个万亿级别的蓝海市场然而,中国卖家在开拓海外企业商采市场时往往面临着一个关键挑战:难以准确把握海外企业买家的商采行为和决策模式。这种认知偏差不仅影响了产品开发方向,也制约了市场拓展策略的制定。
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
AMZ123卖家导航
这个人很懒,还没有自我介绍
侃侃跨境那些事儿
不侃废话,挣钱要紧!
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
首页
跨境头条
文章详情
AI|对话Sheet0.com创始人王文锋:Agent下一阶段的关键要素:可解释、造工具和100%确认美学
36氪出海
2025-10-29 17:59
2298


为什么让 Agent「动」起来是下一步的关键因素?



01


行业如今的关键是「谁能造出一个真正有用的 Agent?」


讨论的焦点问题变成「Agent 的认知边界」:有多大的自主性?需要多强的上下文理解?又如何在现实任务中保持稳定?


这背后需要实践者具备四种超强的能力:即对模型的边界预估,对复杂系统的理解力、对产品工程的实践力,以及对商业场景的洞察力。


在 Sheet0.com 的创始人王文锋看来:Agent 本质上是一种「利用模型知识,结合实时信息,使用工具解决问题」的产品形态。


他提出的关键问题是:为什么模型本身已经达到博士水平,但很多Agent 的表现仍停留在实习生阶段?


这中间的 GAP 关键在于在「实时信息」和「工具设计」层并没有很好的适配模型能力。


Sheet0.com 就是他对 Agent 的认知落地:一款在 AI 时代为模型提供可扩展的实时数据获取能力的产品。今年8月中旬,产品上线, 主要面向数据分析师、产品经理、工程师、市场营销人员等在数据收集处理上花超过5个小时的用户。


一个典型的用户场景:一位销售在寻找潜在 AI 行业客户,过去,他要先通过 LinkedIn、X 等社媒,收集公司信息,再分析该公司是否为 AI 行业公司,还需要寻找目标联系人联系方式等等。而搭建这样一个程序,需要一个工程师4-8周的时间。而 Sheet0 只需要30分钟内就可以给用户交付完整的数据表格。


王文锋认为,产品核心解决的问题是让无论是个人、企业还是 Agent 这个新个体,都可以随心所欲的获取数据,解决问题。


「在经济学里面有个概念叫价格弹性,是一个衡量价格/成本发生变化时,需求会如何变化的指标。数据领域往往价格弹性远大于1,这意味着10倍的成本下降,带来的不是需求的10倍增加,而是几十倍甚至上百倍」


图片

王文锋在 SpaceX 的星舰基地


图片

sheet0 日常团建,举着 sheet0 的是王文锋


02


尽管 Sheet0 在数据获取环节已经帮用户做到10倍提效,但王文锋并没有将「省时间」作为产品的核心价值,他认为「准+快」才是 Sheet0 的长期核心价值。即:


1、 必须保证给用户交付的数据100%准确。


2、在单位时间内,尽可能提高数据的交付量。


构建人与 Agent 之间的信任,是一个长期的命题。「这背后是作为工程师也要信任模型。」


Sheet0 所有的系统行为都被分解成可以追踪、可复用的「语义步骤」,Agent 必须理解自己在做什么,并在出错时可以进行自我修复。这是王文锋的设计哲学,「在 Agent 干活之前,先让他变聪明。」


而让 Agent 变得可解释,是 Agent 下一步发展的关键环节。


作为连续创业者,王文锋自2017年毕业后,先是写了四年代码,期间曾负责地平线 AI 数据平台。 2021年和朋友合伙创业,作为 CTO 研发了新一代的 Serverles 消息队列,在 Data Infra、AI 领域积累了近十年的开发经验。2023年加入 AI 浪潮,开始了自己的第二次创业和 CEO 之旅。


AI 闹见到王文锋时,他刚从美国回来,时差还没有完全倒明白,sheet0 现在主攻美国市场,一半的团队在美国,10月将全量上线。


我们的话题围绕在 sheet0 上线两个月后,他对 Agent 的最新思考。实时数据的获取只是第一步,他接下来计划为大模型造更多的工具,他认为让模型自主学会使用工具,是 Agent 未来的竞争关键:「每造出一个新工具,相当于为模型解锁了一个新技能。」


图片

Sheet0 的用户界面


图片

Sheet0 的产品展示


话王文锋


1

1

1

1

可解释

先变聪明再变强


AI 闹:beta 版本8月上线后,用户是否接受这款产品?反馈如何?


王文:从注册用户、付费数据,比我预期要好不少。


现在80%的用户来自于发达国家,第一是美国,第二是日本,其中60%的用户每周在数据工作方面消耗时长超过5个小时。


日本是超出我预期的一个市场,好像是有一个日本博主把我们在美国做推广的帖子搬运后,来了很多日本流量。后来我调研发现日本用户的付费意愿更强,是因为他们的数字化基础比美国落后不少,使用 Excel 等传统数据工具的用户更多。


不过现在的主要目标是先把美国市场做好,美国市场起来后打其他市场可以事半功倍。


AI 闹:中国市场呢?


王文锋:我第一次创业也是做软件,我的经验是,美国竞争很激烈,但都有钱赚。因为能赚到钱,所以大家对做事情更有信心一些。国内软件的商业化土壤一言难尽。


AI 闹:进入真实的用户场景后,现阶段 Agent 需优化的最棘手的问题?


王文锋:如何构建一个合理的反馈闭环,这是非常细致的一个工程,比我想象的难度要大。


解决这个问题给我启发最大的是 Claude Code ,它让我意识到——Agent 要真正聪明,关键不在于「能做多少事」,而在于它能不能「知道自己在干什么」。


Claude Code 系统完全是事件驱动的,每一个动作、每一次变化,它都会自动记录成一条带语义的信息。


比如说,它会在工作过程中发出一种叫 reminder 的内部消息,用来提醒自己注意某个细节,但这条消息用户是看不到的。换句话说,它不仅知道「怎么做」,还知道「为什么要这么做」。


AI 闹:「带语义的信息」具体指什么?


王文锋:举个例子,你让 Agent 去整理一张网页上的表格。它可能要花四五步才能完成:打开网页、识别内容、发现错误、修改数据。但对模型来说,四五步太冗余了。


能不能把这些过程压缩成一句有意义的总结,比如「因为发现数值错误,系统自动调整了这一列」。这样一来,Agent 就不再是机械执行,而是能带着理解去行动。


它的每一步都有清晰的定义,可以被记录、被复用、被优化。


现在,我们架构上基本已经调整成类 Claude Code 的形式。希望 Agent 不只是执行指令,而是能像一个真正的「人」,理解自己为什么要这么做。只有这样,它才能不断进化。


AI 闹:Sheet0 没上线之前,你在一次行业分享中曾说过 Context engineering 是 Agent 成败的关键,这个思考现在有变化吗?


王文锋:没有,反而会觉得更重要了。Agent 想变得更聪明,关键是 Context 要够多、够细。包括用户的使用记录、任务执行过程中的反馈、失败案例等等。


只有积累到一定程度,Agent 才能真正学会在不同场景下该怎么做。


AI 闹:你认为具体需要多少才算积累到位?


王文锋:没有标准答案。因为 context 的类型太多样了。


我们现在有一个做法:当用户任务执行失败,比如某个网页数据没采集下来,我们会记录下失败案例,然后再去找类似任务里那些成功的案例,对比两者的差异。成功的路径,我们提炼出来、结构化保存,放进内部知识库。下次再有类似任务,系统就能直接调用这些经验,成功率会更高。


你可以把它理解成,我们在给 Agent 建记忆——每一次出错、修复、成功,都会变成它下次做得更好的基础。


AI 闹:听起来有点像是给模型建立 bad case 库?


王文锋:可以这么理解。当积累到足够多的经验后,这些数据就能直接拿去微调模型。原来它靠外部经验,慢慢就会变成模型自己的知识。也就是说,Agent 在一次次失败和修复的过程中,逐渐学会了避免犯同样的错误。


AI 闹:这个过程现在能自动化吗?行业有些做法会训练一个小模型去 check?


王文锋:目前还没办法完全自动化,我们是半自动的流程。人还是要参与做一些轻量级的标注或分类。


大家都在讲「端到端」,希望模型从头到尾自己搞定一切,但现实情况是没到那一步。


我觉得我们并没有脱离有多少人工,就有多少智能的阶段,LLM 只是放大了人类工作到 Agent 智能之间的杠杆;另外还有个关键是我们需要知道什么时候可以离开人工。


2

1

1

1

实时数据

从使用工具到创造工具


AI 闹:很多人质疑 sheet0 更像是一个传统的表格工具或者爬虫工具?


王文锋:我知道外界会有这样的印象。原因也挺简单的——因为 Sheet0 现在从能力上来说确实只有一个基础能力:从网页收集数据。


Sheet0 的目标是「在 AI 时代提供可扩展的实时数据获取能力」。


因为 Agent 的目标是 take actions,所以需要做决策,而做决策一方面需要依赖模型知识,另一方面还要依赖实时数据。比如「明天穿什么衣服」这个问题,模型就至少需要知道明天天气、去哪里找实时数据才能作出决策,光有知识还不行。


为了实现目标,Sheet0 采取的方案是 bottom-up 重新为模型构建出一整套的「数据工作环境」,构建这个环境的第一步,是可以将「任意的数据源变为动态的结构化表格」,而我们最先选择的数据源就是网页,因为它受众广,商业化价值也够高,让我们可以在 day 1 就开始赚钱。


所以现在大家说我们像「表格」或「爬虫」工具,有点像我们养狗,在狗子成年前都会有一段尴尬期。而 Sheet0 就在这样的尴尬期。我相信6个月以后大家再来看 Sheet0,就不会这样说了。我们会有更创新的产品形态交付给大家。


AI 闹:现在,你怎么看模型的能力边界和 Sheet0 的分工?


王文锋:其实我更想说模型和 Agent 的区别。


Agent 本质上利用模型知识,结合实时信息,使用工具解决问题的程序。今天我们看到基座模型在多个领域已经达到或接近博士水平;但是在实际的产品表现上面,还停留在实习生。


这里面的核心是实时信息和恰当工具的缺失。


我们讲「工欲善其事必先利」,所以 Sheet0 核心是在围绕数据场景设计一系列的「趁手工具」,并不会过多的去考虑模型的边界,因为我们相信在长期来看,模型是没有能力边界的。


对于模型厂商而言,如果一个工具的复杂性过高,就意味着它们一定不会去做,因为复杂的工具意味着需要 own 一个复杂的 infra。


AI 闹:基于上面的认知,你认为有哪些有巨大商业潜力的方向等待开发?


王文锋:比如最近我们的用户想做一件事情,需要找1000个英国 K12 的家长。传统办法是找当地的社区网站、或脸书的一些用户群组。


但换个角度想,什么样的人完成这个任务最简单,肯定是本身就在英国读书的孩子,假如他们有自己的 Agent,跟他的 Agent 联系一下,让他们收集20个家长联系方式,酬劳100块钱,肯定有人愿意(假设不考虑合规问题)。


现阶段这些数据是离线的,但却是最有价值的,如何更方便的获取这些数据也是我们的主线目标之一。这是让我最兴奋的部分,肯定会想出办法解决。


未来,我希望 sheet0 可以为用户收集整理所有数据,私有的,公开的和个性化的,并以结构化的方式交付。之所以强调结构化,是因为结构化数据天然是带有语义的,而且可以进一步通过类似 SQL 的工具让模型实时创造工具。


AI 闹:你觉得2025下半年到2026年,Agent 行业还有什么新机会?


王文锋:具体我说不上,但是我可以分享一个概念:价格弹性。


这是一个经济学上的概念,用于衡量当解决的问题的成本下降的时候,需求增加或减少的程度。当价格弹性为1的时候,意味着成本下降10倍,需求也会增长10倍。我的建议是可以思考哪些领域的问题是价格弹性大于1的,这些问题都非常值得用 Agent 的方式去解决。


3

1

1

1

100%确认美学

信任是第一要素


AI 闹:现在模型不可避免存在幻觉,以及 Agent 还严重缺乏 Context 的情况下,你为什么格外强调自己100%的准确率?


王文锋:我的理念是做 Agent 首先要让用户信任,信任很重要,背后也是工程师要信任大模型。


模型的「幻觉」由它的底层原理决定的,它的本质上是在「总结信息」——比如说我给它两百个网页,它会自己判断筛选出其中的一百个,然后再去总结内容。但压缩总结这件事是有风险的,它可能会理解错、归纳错,「幻觉」就是这么来的。


但是我们抓数据的逻辑更接近「复制粘贴」,你可以理解成,sheet0 就像一个认真抄笔记的人——网页上是什么,它就一模一样抓下来放进表格,比如说网页上是一张公司信息表,我们抓下来的数据在表格里也是一模一样。


在技术上,我们底层全是动态生成的代码,所以才敢说给用户交付的数据是100%准确的。


AI 闹:初期阶段就追求100%准确会不会导致进度慢?


王文锋:短期内确实会慢,因为我们做了很多 Infar 层面的努力,但我觉得长期来看,这是「慢就是快」。我们尽量避免做消耗动能的事情,而是长期积累势能。

就像我前面提到了,我认为构建 Trust 是人和 AI 之间的终极命题,我们需要在 Day 1 就坚持去做这件事情。


很多人不看好我们,我非常理解,因为相信,所以看见,我不能这么去要求别人。我过去的失败经验告诉我,选择坚持什么非常重要,这个是创始人的品味。


AI 闹:现在你中美两地跑,这一年美国的 AI 创业环境给你什么启发?


王文锋:我和很多美国的创始人交流,发现他们和中国创业者最大的区别是,他们敢于勇敢创新,敢于 bet(下注)。而中国的创业者,今天一上来就会被问「你的用户是谁、他们为什么用你、怎么保持用户粘性、竞品是什么、大厂干了后怎么办」,这其实是很让人难过的事情,因为过早的关注这些问题会扼杀真正的创新。


Lovable 火了以后,人们才发现用的最多是产品经理和销售,而不是程序员;同样在 Manus 诞生之后,人们才发现原来一个人真的可以一周看100个研报。


AI 产品应该从人性角度出发,在恰当的节点「打造出符合大家对未来想象的产品」。I know it when I see it。


图片

王文锋和他的柯基小狗叫「鸡腿」


图片

前景背包是王文锋,他日常热爱徒步,图在美国某国家公园


AI 闹:创业2年,前两个都没推进下去,有没有心理上的至暗时刻?


王文锋:有的。2024年10月份—12月底接近3个月的时间,真的是一片灰暗。那时第一个项目黄了,第二个项目决定不做了,新方向还没定,完全丧失了信心。加上我妈妈那会身体非常不好,应该是有点抑郁。


当时有非常想躺平的感觉,创什么业,为什么这么辛苦这么累;在3月份处理完我妈妈的后事之后,我又回到了北京,开始触底反弹。Sheet0 就是在这种状态下一点一点探索出来的。


加上回过头去看,当时做的第1个产品和第2个产品其实方向都很正确,但是就是因为太在意短期目标,中间没能推进下来。


之前有朋友问我,觉得做 CEO 最关键的能力是什么?我的回答是对痛苦的长期耐受力。而之所以能够忍受痛苦,一定是有一个更强的信念在支撑。所以我想告诉很多创业者,一定要相信自己!

1
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部