AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

AI|对话Sheet0.com创始人王文锋:Agent下一阶段的关键要素:可解释、造工具和100%确认美学

2674
2025-10-29 17:59
2025-10-29 17:59
2674

20亿2026


为什么让 Agent「动」起来是下一步的关键因素?



01


行业如今的关键是「谁能造出一个真正有用的 Agent?」


讨论的焦点问题变成「Agent 的认知边界」:有多大的自主性?需要多强的上下文理解?又如何在现实任务中保持稳定?


这背后需要实践者具备四种超强的能力:即对模型的边界预估,对复杂系统的理解力、对产品工程的实践力,以及对商业场景的洞察力。


在 Sheet0.com 的创始人王文锋看来:Agent 本质上是一种「利用模型知识,结合实时信息,使用工具解决问题」的产品形态。


他提出的关键问题是:为什么模型本身已经达到博士水平,但很多Agent 的表现仍停留在实习生阶段?


这中间的 GAP 关键在于在「实时信息」和「工具设计」层并没有很好的适配模型能力。


Sheet0.com 就是他对 Agent 的认知落地:一款在 AI 时代为模型提供可扩展的实时数据获取能力的产品。今年8月中旬,产品上线, 主要面向数据分析师、产品经理、工程师、市场营销人员等在数据收集处理上花超过5个小时的用户。


一个典型的用户场景:一位销售在寻找潜在 AI 行业客户,过去,他要先通过 LinkedIn、X 等社媒,收集公司信息,再分析该公司是否为 AI 行业公司,还需要寻找目标联系人联系方式等等。而搭建这样一个程序,需要一个工程师4-8周的时间。而 Sheet0 只需要30分钟内就可以给用户交付完整的数据表格。


王文锋认为,产品核心解决的问题是让无论是个人、企业还是 Agent 这个新个体,都可以随心所欲的获取数据,解决问题。


「在经济学里面有个概念叫价格弹性,是一个衡量价格/成本发生变化时,需求会如何变化的指标。数据领域往往价格弹性远大于1,这意味着10倍的成本下降,带来的不是需求的10倍增加,而是几十倍甚至上百倍」


图片

王文锋在 SpaceX 的星舰基地


图片

sheet0 日常团建,举着 sheet0 的是王文锋


02


尽管 Sheet0 在数据获取环节已经帮用户做到10倍提效,但王文锋并没有将「省时间」作为产品的核心价值,他认为「准+快」才是 Sheet0 的长期核心价值。即:


1、 必须保证给用户交付的数据100%准确。


2、在单位时间内,尽可能提高数据的交付量。


构建人与 Agent 之间的信任,是一个长期的命题。「这背后是作为工程师也要信任模型。」


Sheet0 所有的系统行为都被分解成可以追踪、可复用的「语义步骤」,Agent 必须理解自己在做什么,并在出错时可以进行自我修复。这是王文锋的设计哲学,「在 Agent 干活之前,先让他变聪明。」


而让 Agent 变得可解释,是 Agent 下一步发展的关键环节。


作为连续创业者,王文锋自2017年毕业后,先是写了四年代码,期间曾负责地平线 AI 数据平台。 2021年和朋友合伙创业,作为 CTO 研发了新一代的 Serverles 消息队列,在 Data Infra、AI 领域积累了近十年的开发经验。2023年加入 AI 浪潮,开始了自己的第二次创业和 CEO 之旅。


AI 闹见到王文锋时,他刚从美国回来,时差还没有完全倒明白,sheet0 现在主攻美国市场,一半的团队在美国,10月将全量上线。


我们的话题围绕在 sheet0 上线两个月后,他对 Agent 的最新思考。实时数据的获取只是第一步,他接下来计划为大模型造更多的工具,他认为让模型自主学会使用工具,是 Agent 未来的竞争关键:「每造出一个新工具,相当于为模型解锁了一个新技能。」


图片

Sheet0 的用户界面


图片

Sheet0 的产品展示


话王文锋


1

1

1

1

可解释

先变聪明再变强


AI 闹:beta 版本8月上线后,用户是否接受这款产品?反馈如何?


王文:从注册用户、付费数据,比我预期要好不少。


现在80%的用户来自于发达国家,第一是美国,第二是日本,其中60%的用户每周在数据工作方面消耗时长超过5个小时。


日本是超出我预期的一个市场,好像是有一个日本博主把我们在美国做推广的帖子搬运后,来了很多日本流量。后来我调研发现日本用户的付费意愿更强,是因为他们的数字化基础比美国落后不少,使用 Excel 等传统数据工具的用户更多。


不过现在的主要目标是先把美国市场做好,美国市场起来后打其他市场可以事半功倍。


AI 闹:中国市场呢?


王文锋:我第一次创业也是做软件,我的经验是,美国竞争很激烈,但都有钱赚。因为能赚到钱,所以大家对做事情更有信心一些。国内软件的商业化土壤一言难尽。


AI 闹:进入真实的用户场景后,现阶段 Agent 需优化的最棘手的问题?


王文锋:如何构建一个合理的反馈闭环,这是非常细致的一个工程,比我想象的难度要大。


解决这个问题给我启发最大的是 Claude Code ,它让我意识到——Agent 要真正聪明,关键不在于「能做多少事」,而在于它能不能「知道自己在干什么」。


Claude Code 系统完全是事件驱动的,每一个动作、每一次变化,它都会自动记录成一条带语义的信息。


比如说,它会在工作过程中发出一种叫 reminder 的内部消息,用来提醒自己注意某个细节,但这条消息用户是看不到的。换句话说,它不仅知道「怎么做」,还知道「为什么要这么做」。


AI 闹:「带语义的信息」具体指什么?


王文锋:举个例子,你让 Agent 去整理一张网页上的表格。它可能要花四五步才能完成:打开网页、识别内容、发现错误、修改数据。但对模型来说,四五步太冗余了。


能不能把这些过程压缩成一句有意义的总结,比如「因为发现数值错误,系统自动调整了这一列」。这样一来,Agent 就不再是机械执行,而是能带着理解去行动。


它的每一步都有清晰的定义,可以被记录、被复用、被优化。


现在,我们架构上基本已经调整成类 Claude Code 的形式。希望 Agent 不只是执行指令,而是能像一个真正的「人」,理解自己为什么要这么做。只有这样,它才能不断进化。


AI 闹:Sheet0 没上线之前,你在一次行业分享中曾说过 Context engineering 是 Agent 成败的关键,这个思考现在有变化吗?


王文锋:没有,反而会觉得更重要了。Agent 想变得更聪明,关键是 Context 要够多、够细。包括用户的使用记录、任务执行过程中的反馈、失败案例等等。


只有积累到一定程度,Agent 才能真正学会在不同场景下该怎么做。


AI 闹:你认为具体需要多少才算积累到位?


王文锋:没有标准答案。因为 context 的类型太多样了。


我们现在有一个做法:当用户任务执行失败,比如某个网页数据没采集下来,我们会记录下失败案例,然后再去找类似任务里那些成功的案例,对比两者的差异。成功的路径,我们提炼出来、结构化保存,放进内部知识库。下次再有类似任务,系统就能直接调用这些经验,成功率会更高。


你可以把它理解成,我们在给 Agent 建记忆——每一次出错、修复、成功,都会变成它下次做得更好的基础。


AI 闹:听起来有点像是给模型建立 bad case 库?


王文锋:可以这么理解。当积累到足够多的经验后,这些数据就能直接拿去微调模型。原来它靠外部经验,慢慢就会变成模型自己的知识。也就是说,Agent 在一次次失败和修复的过程中,逐渐学会了避免犯同样的错误。


AI 闹:这个过程现在能自动化吗?行业有些做法会训练一个小模型去 check?


王文锋:目前还没办法完全自动化,我们是半自动的流程。人还是要参与做一些轻量级的标注或分类。


大家都在讲「端到端」,希望模型从头到尾自己搞定一切,但现实情况是没到那一步。


我觉得我们并没有脱离有多少人工,就有多少智能的阶段,LLM 只是放大了人类工作到 Agent 智能之间的杠杆;另外还有个关键是我们需要知道什么时候可以离开人工。


2

1

1

1

实时数据

从使用工具到创造工具


AI 闹:很多人质疑 sheet0 更像是一个传统的表格工具或者爬虫工具?


王文锋:我知道外界会有这样的印象。原因也挺简单的——因为 Sheet0 现在从能力上来说确实只有一个基础能力:从网页收集数据。


Sheet0 的目标是「在 AI 时代提供可扩展的实时数据获取能力」。


因为 Agent 的目标是 take actions,所以需要做决策,而做决策一方面需要依赖模型知识,另一方面还要依赖实时数据。比如「明天穿什么衣服」这个问题,模型就至少需要知道明天天气、去哪里找实时数据才能作出决策,光有知识还不行。


为了实现目标,Sheet0 采取的方案是 bottom-up 重新为模型构建出一整套的「数据工作环境」,构建这个环境的第一步,是可以将「任意的数据源变为动态的结构化表格」,而我们最先选择的数据源就是网页,因为它受众广,商业化价值也够高,让我们可以在 day 1 就开始赚钱。


所以现在大家说我们像「表格」或「爬虫」工具,有点像我们养狗,在狗子成年前都会有一段尴尬期。而 Sheet0 就在这样的尴尬期。我相信6个月以后大家再来看 Sheet0,就不会这样说了。我们会有更创新的产品形态交付给大家。


AI 闹:现在,你怎么看模型的能力边界和 Sheet0 的分工?


王文锋:其实我更想说模型和 Agent 的区别。


Agent 本质上利用模型知识,结合实时信息,使用工具解决问题的程序。今天我们看到基座模型在多个领域已经达到或接近博士水平;但是在实际的产品表现上面,还停留在实习生。


这里面的核心是实时信息和恰当工具的缺失。


我们讲「工欲善其事必先利」,所以 Sheet0 核心是在围绕数据场景设计一系列的「趁手工具」,并不会过多的去考虑模型的边界,因为我们相信在长期来看,模型是没有能力边界的。


对于模型厂商而言,如果一个工具的复杂性过高,就意味着它们一定不会去做,因为复杂的工具意味着需要 own 一个复杂的 infra。


AI 闹:基于上面的认知,你认为有哪些有巨大商业潜力的方向等待开发?


王文锋:比如最近我们的用户想做一件事情,需要找1000个英国 K12 的家长。传统办法是找当地的社区网站、或脸书的一些用户群组。


但换个角度想,什么样的人完成这个任务最简单,肯定是本身就在英国读书的孩子,假如他们有自己的 Agent,跟他的 Agent 联系一下,让他们收集20个家长联系方式,酬劳100块钱,肯定有人愿意(假设不考虑合规问题)。


现阶段这些数据是离线的,但却是最有价值的,如何更方便的获取这些数据也是我们的主线目标之一。这是让我最兴奋的部分,肯定会想出办法解决。


未来,我希望 sheet0 可以为用户收集整理所有数据,私有的,公开的和个性化的,并以结构化的方式交付。之所以强调结构化,是因为结构化数据天然是带有语义的,而且可以进一步通过类似 SQL 的工具让模型实时创造工具。


AI 闹:你觉得2025下半年到2026年,Agent 行业还有什么新机会?


王文锋:具体我说不上,但是我可以分享一个概念:价格弹性。


这是一个经济学上的概念,用于衡量当解决的问题的成本下降的时候,需求增加或减少的程度。当价格弹性为1的时候,意味着成本下降10倍,需求也会增长10倍。我的建议是可以思考哪些领域的问题是价格弹性大于1的,这些问题都非常值得用 Agent 的方式去解决。


3

1

1

1

100%确认美学

信任是第一要素


AI 闹:现在模型不可避免存在幻觉,以及 Agent 还严重缺乏 Context 的情况下,你为什么格外强调自己100%的准确率?


王文锋:我的理念是做 Agent 首先要让用户信任,信任很重要,背后也是工程师要信任大模型。


模型的「幻觉」由它的底层原理决定的,它的本质上是在「总结信息」——比如说我给它两百个网页,它会自己判断筛选出其中的一百个,然后再去总结内容。但压缩总结这件事是有风险的,它可能会理解错、归纳错,「幻觉」就是这么来的。


但是我们抓数据的逻辑更接近「复制粘贴」,你可以理解成,sheet0 就像一个认真抄笔记的人——网页上是什么,它就一模一样抓下来放进表格,比如说网页上是一张公司信息表,我们抓下来的数据在表格里也是一模一样。


在技术上,我们底层全是动态生成的代码,所以才敢说给用户交付的数据是100%准确的。


AI 闹:初期阶段就追求100%准确会不会导致进度慢?


王文锋:短期内确实会慢,因为我们做了很多 Infar 层面的努力,但我觉得长期来看,这是「慢就是快」。我们尽量避免做消耗动能的事情,而是长期积累势能。

就像我前面提到了,我认为构建 Trust 是人和 AI 之间的终极命题,我们需要在 Day 1 就坚持去做这件事情。


很多人不看好我们,我非常理解,因为相信,所以看见,我不能这么去要求别人。我过去的失败经验告诉我,选择坚持什么非常重要,这个是创始人的品味。


AI 闹:现在你中美两地跑,这一年美国的 AI 创业环境给你什么启发?


王文锋:我和很多美国的创始人交流,发现他们和中国创业者最大的区别是,他们敢于勇敢创新,敢于 bet(下注)。而中国的创业者,今天一上来就会被问「你的用户是谁、他们为什么用你、怎么保持用户粘性、竞品是什么、大厂干了后怎么办」,这其实是很让人难过的事情,因为过早的关注这些问题会扼杀真正的创新。


Lovable 火了以后,人们才发现用的最多是产品经理和销售,而不是程序员;同样在 Manus 诞生之后,人们才发现原来一个人真的可以一周看100个研报。


AI 产品应该从人性角度出发,在恰当的节点「打造出符合大家对未来想象的产品」。I know it when I see it。


图片

王文锋和他的柯基小狗叫「鸡腿」


图片

前景背包是王文锋,他日常热爱徒步,图在美国某国家公园


AI 闹:创业2年,前两个都没推进下去,有没有心理上的至暗时刻?


王文锋:有的。2024年10月份—12月底接近3个月的时间,真的是一片灰暗。那时第一个项目黄了,第二个项目决定不做了,新方向还没定,完全丧失了信心。加上我妈妈那会身体非常不好,应该是有点抑郁。


当时有非常想躺平的感觉,创什么业,为什么这么辛苦这么累;在3月份处理完我妈妈的后事之后,我又回到了北京,开始触底反弹。Sheet0 就是在这种状态下一点一点探索出来的。


加上回过头去看,当时做的第1个产品和第2个产品其实方向都很正确,但是就是因为太在意短期目标,中间没能推进下来。


之前有朋友问我,觉得做 CEO 最关键的能力是什么?我的回答是对痛苦的长期耐受力。而之所以能够忍受痛苦,一定是有一个更强的信念在支撑。所以我想告诉很多创业者,一定要相信自己!

1.30 深圳coupang-文章页底部图片
复盘2025关键变化,提前布局2026增长!
点击获取《2025跨境电商行业年度报告》
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
亚马逊裁员落地!1月26日起分批执行
此前AMZ123在文章中提到,去年10月底,亚马逊已对外释放出罕见的大规模裁员与组织收缩信号。多位知情人士向《路透社》透露,本轮裁员规模可能最高达到30,000 人;但亚马逊在官方口径中则强调,公司职员(corporate roles)层面将整体净减少约14,000个岗位,最终影响范围仍可能随组织调整持续推进。据悉,裁员波及范围较广,涉及人力资源(PXT)、运营、设备与服务以及云计算(AWS)等关键部门。彼时业内人士认为,这不只是简单的“省钱”,更像是一次把组织“瘦身”的动作:减少管理层级、压缩支持职能,把预算和人力腾出来,去配合后续的自动化建设与流程重构。而近期,这一裁员的执行节奏也进一步明朗。
速卖通298类商品接受韩国安全检查,88%符合标准
AMZ123获悉,近日,韩国电商平台速卖通与韩国进口商协会(KOIMA)合作,对298个海外直购商品品类开展安全检查,重点评估冬季期间在韩国消费者中需求较高的相关商品安全性。此次检查基于速卖通与韩国进口商协会于2024年9月签署的谅解备忘录。根据该协议,双方同意对从中国运往韩国的海外直购商品定期开展联合检查。速卖通方面表示,这一举措超出了其在韩国的法定要求,体现了平台在商品安全管理方面采取的自愿性、预防性措施。按照协议安排,速卖通韩国与包括韩国测试研究院(KTR)、韩国合格实验室(KCL)、韩国测试认证机构(KTC)以及韩国服装检测研究院(KATRI)在内的7家韩国检测和认证机构合作,对选定商品进行每月安全检测。
关停令暂缓,加拿大法院要求政府重新审查TikTok业务
AMZ123获悉,近日,加拿大联邦法院裁定,暂时搁置联邦政府此前要求关闭TikTok加拿大业务的命令,使TikTok可以继续在加拿大运营,并将相关事项发回工业部长梅拉妮·乔利重新审查。这一裁决意味着,原本基于国家安全考量作出的关停决定即刻失效,但并不构成最终结论。根据法院于1月21日作出的裁定,法官撤销了自由党政府此前要求TikTok结束其在加拿大商业运营的行政命令,并要求工业部长重新对该案进行评估。法院并未在简短裁决中给出具体理由。政府方面与TikTok均未披露此前达成协议的具体内容。
溢价15倍的国产塑料盖,被TikTok卖家“炒火了”
上架TikTok才20天,义乌微波炉盖就卖了85万
3月10日开跑,亚马逊欧洲春促定档!
AMZ123获悉,近日欧洲春季流量窗口已被“锁档”。亚马逊全球开店披露,亚马逊欧洲站春季大促将于2026年3月10日至3月16日举行,英国、德国、法国、意大利、西班牙、瑞典、荷兰、波兰、比利时、爱尔兰等欧洲十站将同步开启。作为欧洲站年初的重要促销节点,亚马逊提到:促销活动期间运行促销的产品,销量可能较未参与促销情况下出现明显增长;同时亦指出,部分消费者在因促销产生购买后90天内存在复购行为。在此背景下,官方同步披露了本次春促的部分提报与履约节奏。
土耳其竞争机构突击检查Temu当地办公室
AMZ123获悉,近日,土耳其当局于当地时间2026年1月21日清晨对中国电商平台Temu在土耳其的办公地点进行了突击检查。土耳其竞争管理局(RK)以及Temu方面均证实了此次行动。Temu一名发言人表示,公司将全力配合土耳其有关部门的工作,并称在检查过程中有笔记本电脑和台式电脑被带走,但未说明具体原因。土耳其竞争管理局随后发布声明称,相关行动属于一次“现场检查”,并不意味着已经对Temu正式立案调查。该机构同时否认了Temu关于设备被扣押的说法,称相关表述“并不属实”。竞争管理局还表示,为确保当前审查工作能够顺利进行,现阶段无法对外披露更多信息。不过,据推测,此次突击检查是为了调查Temu反竞争行为。
英国支付平台Acquired推出Visa A2A支付,提升周期性收款效率
Fin123获悉,近日,英国支付基础设施服务商Acquired.com宣布,在英国与Visa达成合作,将Visa A2A这一全新的账户到账户(Account-to-Account)支付解决方案引入市场,重点服务于周期性和可变金额支付场景。该方案旨在为商户和消费者提供除传统直接借记(Direct Debit)和“卡片绑定支付(card-on-file)”之外的另一种选择,用于处理订阅、账单和其他持续性支付需求。Visa A2A通过Visa管理的网络,将商业化的可变周期性支付(Variable Recurring Payments,VRPs)正式推向市场。
eBay禁止AI代理式购物,谷歌购物机器人获例外
AMZ123获悉,近日,eBay宣布更新平台规则,明确禁止用户使用“代理式购物”人工智能技术,并同步调整用户协议中的仲裁条款。新版用户协议已于2026年1月20日生效,而此前已同意旧版协议的用户,新协议将自2026年2月20日起正式适用。eBay长期以来一直试图阻止第三方对其网站进行数据抓取。早在2025年秋季,eBay就已在其robots.txt文件中悄然将“Buy for Me(代购)”类AI代理加入禁止抓取名单。本周,eBay通过电子邮件通知用户,其用户协议已更新,明确禁止使用代理式购物技术,例如亚马逊在2025年4月推出的“Buy for Me”功能。
《2025跨境电商行业年度报告》重磅发布!
跨境仍在狂飙,经营逻辑已变
特朗普表白贺卡爆笑出圈,10天在TikTok卖了55w+!
特拉普表白贺卡成TikTok顶流!上线10天疯狂爆单
四季度报税最后期限!一批跨境卖家还在犹豫
2026年才刚开了个头,跨境卖家们便深感压力山大:一边是税务总局重申境外收入自查范围、击碎不实传言,一边是2025年四季度报税期限已至,双重节点叠加下,卖家们正面临着合规与申报的双重考验。AMZ123获悉,近日,据媒体报道,国家税务总局有关部门再次明确态度:税务机关正持续加强对居民个人境外所得纳税的宣传与辅导,所有中国税收居民个人需对2022年至2024年的境外所得开展自查补报。这已非国家税务总局首次发出自查提醒。早在去年,税务部门便已提醒纳税人对2022年至2024年这三个年度内从境外取得的收入进行自查,以此来引导纳税人主动履行申报义务,提前排查并化解因不了解政策而累积的潜在涉税风险。
亚马逊如何衡量品牌营销效果?新人卖家全链路指导
对于亚马逊新人卖家而言,“做品牌”不再是大型卖家的专属——从搜索结果中的品牌标识,到旗舰店的专属页面,品牌资产正在成为影响流量、转化与复购的核心因素。但多数新人的困惑在于:投入的品牌营销资源,到底有没有效果?是比同行好还是差?接下来该怎么调整?实际上,亚马逊已搭建了一套基于“购物旅程”的品牌效果衡量体系,能从“被看见-被选择-被买单-被留住”四个环节量化品牌价值。本文将结合亚马逊官方指标工具,拆解品牌营销效果的衡量方法、数据解读逻辑与实操原则。
大促节点如何不踩空?“美国春晚”的广告投放指南已送达
每年一度的“美国春晚”——美式橄榄球年度总决赛,不仅是全美体育迷的狂欢,更蕴含巨大的消费商机。 2025年赛事以约1.28亿(1)观众创下赛事收视纪录,球迷们提前筹备观赛派对,带动食品、家庭必需品、派对用品等需求激增。那么,如何通过沃尔玛广告,精准捕捉流量红利?这份全方位广告优化指南,助您高效触达目标客群,销量再创新高!01线上渠道增长13%(2):全民狂欢背后的消费力“美国春晚”的商机远不止比赛当日,球迷早早就开始筹备观赛相关的内容、活动与商品采购,形成持续数周的消费热潮。
790万澳洲家庭参与25年末购物季,运动休闲服饰最受欢迎
AMZ123获悉,近日,澳大利亚邮政的数据显示,2025年11月至12月期间,澳大利亚邮政共处理近1.11亿件包裹,较2024年增长7.6%。本次澳大利亚节日季启动时间明显早于往年,11月线上订单量已出现显著增长,并在12月达到高峰。12月8日(周一)单日包裹投递量超过300万件,创下新的配送纪录。澳大利亚邮政表示,2025年11月至12月期间,,系统平均每分钟处理3,075件包裹,并连续30多天保持每日约200万件包裹的配送量。线上购物的用户基础也在进一步扩大。2025年11月至12月期间,共有约790万澳大利亚家庭参与线上购物,较上一年增加约30万户。这一变化表明,电商消费正在更广泛的消费群体中逐步常态化。
25年TikTok Shop东南亚包裹量超越Shopee
AMZ123获悉,近日,根据Momentum Works发布的最新研究,2025年东南亚电商市场竞争明显加剧,TikTok Shop的快速增长正在重塑区域电商格局,尤其在包裹配送量方面已对 Shopee 形成实质性冲击。报告显示,2025 年第四季度,极兔速递的日均包裹配送量达到 2650 万件,同比增长 73.6%,其中相当大一部分增长来自 TikTok Shop 的发货需求。Momentum Works 援引极兔速递的内部估算指出,目前 TikTok Shop 的包裹数量已超过 Shopee。
TikTok Shop营销逻辑生变,创作者转向系统化运营
AMZ123获悉,近日,随着 TikTok Shop 生态不断成熟,创作者之间的分化正在加剧。一部分创作者已通过该平台实现数千万美元甚至上亿美元级别的销售规模,而另一部分则逐渐被拉开差距。多位创作者表示,推动 TikTok Shop 销售增长的方式正在发生变化,依赖“爆款视频”获得销售增长的方法正在失效,取而代之的是可复制、可持续的内容和销售体系。多位在 2025 年 TikTok Shop Awards 中获奖的创作者指出,持续稳定的销售表现不再依赖于偶然的爆款视频,而是基于清晰的方法论和高频执行。
《2026全球瑜伽服市场洞察报告》PDF下载
在健康意识觉醒与生活方式迭代升级的当下,瑜伽正从一种相对小众的身心练习走向更普及的日常运动。它温和、可持续、能帮助人缓解压力,也因此被更多消费者纳入长期健身计划。这一变化推动瑜伽服从传统的专业装备扩展为兼具功能、设计与场景适配的多元品类,市场边界正在被重新定义。
《2025跨境电商行业年度报告》PDF下载
本报告立足全球视野,系统复盘2025年行业变局,解码市场分化、平台竞合、技术赋能与用户变迁的深层逻辑旨在为跨境企业、投资者提供战略锚点,共同迎接下一个十年的全球化新篇章。
《中国蓄电池行业出海国别机会洞察报告》PDF下载
本报告旨在深入分析中国锂离子电池产品的全球出口机遇与国别差异,通过对行业发展现状、出口趋势及各国政策环境的研究,揭示中国蓄电池企业在国际市场中的竞争优势与面临的潜在挑战。
《东南亚运动户外电商行业市场洞察》PDF下载
中国体育用品业联合会数据显示,2024年我国“户外用品”大类(不含鞋服)出口25.90亿美元,仍处历史高位;其中合成纤维帐篷独占18.9亿美元,占比73.4%。美国、澳大利亚、德国仍是核心市场,但马来西亚、泰国的表现尤为突出,成为行业新亮点,东南亚成为中国企业和品牌出海的热门目的地。据Statista预测,2025年,东南亚户外设备线上市场的收入将达到 2亿美元,2025-2030年复合年增长率为6.34%。
《2025电商榜单价值及影响力洞察报告》PDF下载
当前影响消费决策的形式多样,如搜索推荐、直播带货、达人推荐等,其中通过多维数据筛选后形成的“电商榜单”也受到了更多消费者的关注。调研显示,约有30%的消费者在购物时开始关注“电商榜单”,且这一比例仍在持续增长。有超4成消费者认为“榜单推荐的商品值得优先考虑或进一步了解”。有超7成的消费者认为“电商榜单能找到更优质、安全的商品,同时简化购买流程,减少错误购买的风险”。
《DTC跨境独立站出海研究报告》PDF下载
在全球零售渠道中,电商的渗透率正持续提升。2024年线上零售额占整体零售额的比例首次突破20%,预计到2027年将进一步提升至22.6%,显示出线上消费在全球范围内的稳步普及
《2025中国跨境电商营销行业报告》PDF下载
2020-2024年中国跨境电商市场规模实现了快速增长,从228.0亿美元增至461.7亿美元,五年复合年增长率约为19.3%。这一阶段增长主要得益于新冠肺炎疫情加速全球线上消费习惯养成、国家跨境电商综合试验区持续扩容、海外仓等基础设施完善,以及Shein、Temu等独立站模式的快速崛起。实际数据表明市场规模在2022-2024年加速扩张、年增速保持在19%左右,反映出中国跨境电商出口在全球供应链中的竞争力显著增强,已成为稳外贸的重要新动能。
《2025年AI玩具市场机会洞察报告》PDF下载
全球玩具销售额呈稳步增长态势,从2020年的6773.5亿元增至2024年的7971.3亿元;同期中国玩具销售额同步扩张,增长幅度高于全球市场。同时,中国玩具在全球市场的占比从2020年的16%,提升至2024年的19%。AI玩具是玩具行业的核心高增长细分赛道,全球AI玩具销售额进入高速增长通道,2023年为125亿美元,预计2030年将达250亿美元;对应渗透率随销售额同步攀升,2030年接近20%。
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
AMZ123选品观察员
选品推荐及选品技巧分享。
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
侃侃跨境那些事儿
不侃废话,挣钱要紧!
首页
跨境头条
文章详情
AI|对话Sheet0.com创始人王文锋:Agent下一阶段的关键要素:可解释、造工具和100%确认美学
36氪出海
2025-10-29 17:59
2673


为什么让 Agent「动」起来是下一步的关键因素?



01


行业如今的关键是「谁能造出一个真正有用的 Agent?」


讨论的焦点问题变成「Agent 的认知边界」:有多大的自主性?需要多强的上下文理解?又如何在现实任务中保持稳定?


这背后需要实践者具备四种超强的能力:即对模型的边界预估,对复杂系统的理解力、对产品工程的实践力,以及对商业场景的洞察力。


在 Sheet0.com 的创始人王文锋看来:Agent 本质上是一种「利用模型知识,结合实时信息,使用工具解决问题」的产品形态。


他提出的关键问题是:为什么模型本身已经达到博士水平,但很多Agent 的表现仍停留在实习生阶段?


这中间的 GAP 关键在于在「实时信息」和「工具设计」层并没有很好的适配模型能力。


Sheet0.com 就是他对 Agent 的认知落地:一款在 AI 时代为模型提供可扩展的实时数据获取能力的产品。今年8月中旬,产品上线, 主要面向数据分析师、产品经理、工程师、市场营销人员等在数据收集处理上花超过5个小时的用户。


一个典型的用户场景:一位销售在寻找潜在 AI 行业客户,过去,他要先通过 LinkedIn、X 等社媒,收集公司信息,再分析该公司是否为 AI 行业公司,还需要寻找目标联系人联系方式等等。而搭建这样一个程序,需要一个工程师4-8周的时间。而 Sheet0 只需要30分钟内就可以给用户交付完整的数据表格。


王文锋认为,产品核心解决的问题是让无论是个人、企业还是 Agent 这个新个体,都可以随心所欲的获取数据,解决问题。


「在经济学里面有个概念叫价格弹性,是一个衡量价格/成本发生变化时,需求会如何变化的指标。数据领域往往价格弹性远大于1,这意味着10倍的成本下降,带来的不是需求的10倍增加,而是几十倍甚至上百倍」


图片

王文锋在 SpaceX 的星舰基地


图片

sheet0 日常团建,举着 sheet0 的是王文锋


02


尽管 Sheet0 在数据获取环节已经帮用户做到10倍提效,但王文锋并没有将「省时间」作为产品的核心价值,他认为「准+快」才是 Sheet0 的长期核心价值。即:


1、 必须保证给用户交付的数据100%准确。


2、在单位时间内,尽可能提高数据的交付量。


构建人与 Agent 之间的信任,是一个长期的命题。「这背后是作为工程师也要信任模型。」


Sheet0 所有的系统行为都被分解成可以追踪、可复用的「语义步骤」,Agent 必须理解自己在做什么,并在出错时可以进行自我修复。这是王文锋的设计哲学,「在 Agent 干活之前,先让他变聪明。」


而让 Agent 变得可解释,是 Agent 下一步发展的关键环节。


作为连续创业者,王文锋自2017年毕业后,先是写了四年代码,期间曾负责地平线 AI 数据平台。 2021年和朋友合伙创业,作为 CTO 研发了新一代的 Serverles 消息队列,在 Data Infra、AI 领域积累了近十年的开发经验。2023年加入 AI 浪潮,开始了自己的第二次创业和 CEO 之旅。


AI 闹见到王文锋时,他刚从美国回来,时差还没有完全倒明白,sheet0 现在主攻美国市场,一半的团队在美国,10月将全量上线。


我们的话题围绕在 sheet0 上线两个月后,他对 Agent 的最新思考。实时数据的获取只是第一步,他接下来计划为大模型造更多的工具,他认为让模型自主学会使用工具,是 Agent 未来的竞争关键:「每造出一个新工具,相当于为模型解锁了一个新技能。」


图片

Sheet0 的用户界面


图片

Sheet0 的产品展示


话王文锋


1

1

1

1

可解释

先变聪明再变强


AI 闹:beta 版本8月上线后,用户是否接受这款产品?反馈如何?


王文:从注册用户、付费数据,比我预期要好不少。


现在80%的用户来自于发达国家,第一是美国,第二是日本,其中60%的用户每周在数据工作方面消耗时长超过5个小时。


日本是超出我预期的一个市场,好像是有一个日本博主把我们在美国做推广的帖子搬运后,来了很多日本流量。后来我调研发现日本用户的付费意愿更强,是因为他们的数字化基础比美国落后不少,使用 Excel 等传统数据工具的用户更多。


不过现在的主要目标是先把美国市场做好,美国市场起来后打其他市场可以事半功倍。


AI 闹:中国市场呢?


王文锋:我第一次创业也是做软件,我的经验是,美国竞争很激烈,但都有钱赚。因为能赚到钱,所以大家对做事情更有信心一些。国内软件的商业化土壤一言难尽。


AI 闹:进入真实的用户场景后,现阶段 Agent 需优化的最棘手的问题?


王文锋:如何构建一个合理的反馈闭环,这是非常细致的一个工程,比我想象的难度要大。


解决这个问题给我启发最大的是 Claude Code ,它让我意识到——Agent 要真正聪明,关键不在于「能做多少事」,而在于它能不能「知道自己在干什么」。


Claude Code 系统完全是事件驱动的,每一个动作、每一次变化,它都会自动记录成一条带语义的信息。


比如说,它会在工作过程中发出一种叫 reminder 的内部消息,用来提醒自己注意某个细节,但这条消息用户是看不到的。换句话说,它不仅知道「怎么做」,还知道「为什么要这么做」。


AI 闹:「带语义的信息」具体指什么?


王文锋:举个例子,你让 Agent 去整理一张网页上的表格。它可能要花四五步才能完成:打开网页、识别内容、发现错误、修改数据。但对模型来说,四五步太冗余了。


能不能把这些过程压缩成一句有意义的总结,比如「因为发现数值错误,系统自动调整了这一列」。这样一来,Agent 就不再是机械执行,而是能带着理解去行动。


它的每一步都有清晰的定义,可以被记录、被复用、被优化。


现在,我们架构上基本已经调整成类 Claude Code 的形式。希望 Agent 不只是执行指令,而是能像一个真正的「人」,理解自己为什么要这么做。只有这样,它才能不断进化。


AI 闹:Sheet0 没上线之前,你在一次行业分享中曾说过 Context engineering 是 Agent 成败的关键,这个思考现在有变化吗?


王文锋:没有,反而会觉得更重要了。Agent 想变得更聪明,关键是 Context 要够多、够细。包括用户的使用记录、任务执行过程中的反馈、失败案例等等。


只有积累到一定程度,Agent 才能真正学会在不同场景下该怎么做。


AI 闹:你认为具体需要多少才算积累到位?


王文锋:没有标准答案。因为 context 的类型太多样了。


我们现在有一个做法:当用户任务执行失败,比如某个网页数据没采集下来,我们会记录下失败案例,然后再去找类似任务里那些成功的案例,对比两者的差异。成功的路径,我们提炼出来、结构化保存,放进内部知识库。下次再有类似任务,系统就能直接调用这些经验,成功率会更高。


你可以把它理解成,我们在给 Agent 建记忆——每一次出错、修复、成功,都会变成它下次做得更好的基础。


AI 闹:听起来有点像是给模型建立 bad case 库?


王文锋:可以这么理解。当积累到足够多的经验后,这些数据就能直接拿去微调模型。原来它靠外部经验,慢慢就会变成模型自己的知识。也就是说,Agent 在一次次失败和修复的过程中,逐渐学会了避免犯同样的错误。


AI 闹:这个过程现在能自动化吗?行业有些做法会训练一个小模型去 check?


王文锋:目前还没办法完全自动化,我们是半自动的流程。人还是要参与做一些轻量级的标注或分类。


大家都在讲「端到端」,希望模型从头到尾自己搞定一切,但现实情况是没到那一步。


我觉得我们并没有脱离有多少人工,就有多少智能的阶段,LLM 只是放大了人类工作到 Agent 智能之间的杠杆;另外还有个关键是我们需要知道什么时候可以离开人工。


2

1

1

1

实时数据

从使用工具到创造工具


AI 闹:很多人质疑 sheet0 更像是一个传统的表格工具或者爬虫工具?


王文锋:我知道外界会有这样的印象。原因也挺简单的——因为 Sheet0 现在从能力上来说确实只有一个基础能力:从网页收集数据。


Sheet0 的目标是「在 AI 时代提供可扩展的实时数据获取能力」。


因为 Agent 的目标是 take actions,所以需要做决策,而做决策一方面需要依赖模型知识,另一方面还要依赖实时数据。比如「明天穿什么衣服」这个问题,模型就至少需要知道明天天气、去哪里找实时数据才能作出决策,光有知识还不行。


为了实现目标,Sheet0 采取的方案是 bottom-up 重新为模型构建出一整套的「数据工作环境」,构建这个环境的第一步,是可以将「任意的数据源变为动态的结构化表格」,而我们最先选择的数据源就是网页,因为它受众广,商业化价值也够高,让我们可以在 day 1 就开始赚钱。


所以现在大家说我们像「表格」或「爬虫」工具,有点像我们养狗,在狗子成年前都会有一段尴尬期。而 Sheet0 就在这样的尴尬期。我相信6个月以后大家再来看 Sheet0,就不会这样说了。我们会有更创新的产品形态交付给大家。


AI 闹:现在,你怎么看模型的能力边界和 Sheet0 的分工?


王文锋:其实我更想说模型和 Agent 的区别。


Agent 本质上利用模型知识,结合实时信息,使用工具解决问题的程序。今天我们看到基座模型在多个领域已经达到或接近博士水平;但是在实际的产品表现上面,还停留在实习生。


这里面的核心是实时信息和恰当工具的缺失。


我们讲「工欲善其事必先利」,所以 Sheet0 核心是在围绕数据场景设计一系列的「趁手工具」,并不会过多的去考虑模型的边界,因为我们相信在长期来看,模型是没有能力边界的。


对于模型厂商而言,如果一个工具的复杂性过高,就意味着它们一定不会去做,因为复杂的工具意味着需要 own 一个复杂的 infra。


AI 闹:基于上面的认知,你认为有哪些有巨大商业潜力的方向等待开发?


王文锋:比如最近我们的用户想做一件事情,需要找1000个英国 K12 的家长。传统办法是找当地的社区网站、或脸书的一些用户群组。


但换个角度想,什么样的人完成这个任务最简单,肯定是本身就在英国读书的孩子,假如他们有自己的 Agent,跟他的 Agent 联系一下,让他们收集20个家长联系方式,酬劳100块钱,肯定有人愿意(假设不考虑合规问题)。


现阶段这些数据是离线的,但却是最有价值的,如何更方便的获取这些数据也是我们的主线目标之一。这是让我最兴奋的部分,肯定会想出办法解决。


未来,我希望 sheet0 可以为用户收集整理所有数据,私有的,公开的和个性化的,并以结构化的方式交付。之所以强调结构化,是因为结构化数据天然是带有语义的,而且可以进一步通过类似 SQL 的工具让模型实时创造工具。


AI 闹:你觉得2025下半年到2026年,Agent 行业还有什么新机会?


王文锋:具体我说不上,但是我可以分享一个概念:价格弹性。


这是一个经济学上的概念,用于衡量当解决的问题的成本下降的时候,需求增加或减少的程度。当价格弹性为1的时候,意味着成本下降10倍,需求也会增长10倍。我的建议是可以思考哪些领域的问题是价格弹性大于1的,这些问题都非常值得用 Agent 的方式去解决。


3

1

1

1

100%确认美学

信任是第一要素


AI 闹:现在模型不可避免存在幻觉,以及 Agent 还严重缺乏 Context 的情况下,你为什么格外强调自己100%的准确率?


王文锋:我的理念是做 Agent 首先要让用户信任,信任很重要,背后也是工程师要信任大模型。


模型的「幻觉」由它的底层原理决定的,它的本质上是在「总结信息」——比如说我给它两百个网页,它会自己判断筛选出其中的一百个,然后再去总结内容。但压缩总结这件事是有风险的,它可能会理解错、归纳错,「幻觉」就是这么来的。


但是我们抓数据的逻辑更接近「复制粘贴」,你可以理解成,sheet0 就像一个认真抄笔记的人——网页上是什么,它就一模一样抓下来放进表格,比如说网页上是一张公司信息表,我们抓下来的数据在表格里也是一模一样。


在技术上,我们底层全是动态生成的代码,所以才敢说给用户交付的数据是100%准确的。


AI 闹:初期阶段就追求100%准确会不会导致进度慢?


王文锋:短期内确实会慢,因为我们做了很多 Infar 层面的努力,但我觉得长期来看,这是「慢就是快」。我们尽量避免做消耗动能的事情,而是长期积累势能。

就像我前面提到了,我认为构建 Trust 是人和 AI 之间的终极命题,我们需要在 Day 1 就坚持去做这件事情。


很多人不看好我们,我非常理解,因为相信,所以看见,我不能这么去要求别人。我过去的失败经验告诉我,选择坚持什么非常重要,这个是创始人的品味。


AI 闹:现在你中美两地跑,这一年美国的 AI 创业环境给你什么启发?


王文锋:我和很多美国的创始人交流,发现他们和中国创业者最大的区别是,他们敢于勇敢创新,敢于 bet(下注)。而中国的创业者,今天一上来就会被问「你的用户是谁、他们为什么用你、怎么保持用户粘性、竞品是什么、大厂干了后怎么办」,这其实是很让人难过的事情,因为过早的关注这些问题会扼杀真正的创新。


Lovable 火了以后,人们才发现用的最多是产品经理和销售,而不是程序员;同样在 Manus 诞生之后,人们才发现原来一个人真的可以一周看100个研报。


AI 产品应该从人性角度出发,在恰当的节点「打造出符合大家对未来想象的产品」。I know it when I see it。


图片

王文锋和他的柯基小狗叫「鸡腿」


图片

前景背包是王文锋,他日常热爱徒步,图在美国某国家公园


AI 闹:创业2年,前两个都没推进下去,有没有心理上的至暗时刻?


王文锋:有的。2024年10月份—12月底接近3个月的时间,真的是一片灰暗。那时第一个项目黄了,第二个项目决定不做了,新方向还没定,完全丧失了信心。加上我妈妈那会身体非常不好,应该是有点抑郁。


当时有非常想躺平的感觉,创什么业,为什么这么辛苦这么累;在3月份处理完我妈妈的后事之后,我又回到了北京,开始触底反弹。Sheet0 就是在这种状态下一点一点探索出来的。


加上回过头去看,当时做的第1个产品和第2个产品其实方向都很正确,但是就是因为太在意短期目标,中间没能推进下来。


之前有朋友问我,觉得做 CEO 最关键的能力是什么?我的回答是对痛苦的长期耐受力。而之所以能够忍受痛苦,一定是有一个更强的信念在支撑。所以我想告诉很多创业者,一定要相信自己!

1
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部