AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

AI|对话Sheet0.com创始人王文锋:Agent下一阶段的关键要素:可解释、造工具和100%确认美学

3483
2025-10-29 17:59
2025-10-29 17:59
3483


为什么让 Agent「动」起来是下一步的关键因素?



01


行业如今的关键是「谁能造出一个真正有用的 Agent?」


讨论的焦点问题变成「Agent 的认知边界」:有多大的自主性?需要多强的上下文理解?又如何在现实任务中保持稳定?


这背后需要实践者具备四种超强的能力:即对模型的边界预估,对复杂系统的理解力、对产品工程的实践力,以及对商业场景的洞察力。


在 Sheet0.com 的创始人王文锋看来:Agent 本质上是一种「利用模型知识,结合实时信息,使用工具解决问题」的产品形态。


他提出的关键问题是:为什么模型本身已经达到博士水平,但很多Agent 的表现仍停留在实习生阶段?


这中间的 GAP 关键在于在「实时信息」和「工具设计」层并没有很好的适配模型能力。


Sheet0.com 就是他对 Agent 的认知落地:一款在 AI 时代为模型提供可扩展的实时数据获取能力的产品。今年8月中旬,产品上线, 主要面向数据分析师、产品经理、工程师、市场营销人员等在数据收集处理上花超过5个小时的用户。


一个典型的用户场景:一位销售在寻找潜在 AI 行业客户,过去,他要先通过 LinkedIn、X 等社媒,收集公司信息,再分析该公司是否为 AI 行业公司,还需要寻找目标联系人联系方式等等。而搭建这样一个程序,需要一个工程师4-8周的时间。而 Sheet0 只需要30分钟内就可以给用户交付完整的数据表格。


王文锋认为,产品核心解决的问题是让无论是个人、企业还是 Agent 这个新个体,都可以随心所欲的获取数据,解决问题。


「在经济学里面有个概念叫价格弹性,是一个衡量价格/成本发生变化时,需求会如何变化的指标。数据领域往往价格弹性远大于1,这意味着10倍的成本下降,带来的不是需求的10倍增加,而是几十倍甚至上百倍」


图片

王文锋在 SpaceX 的星舰基地


图片

sheet0 日常团建,举着 sheet0 的是王文锋


02


尽管 Sheet0 在数据获取环节已经帮用户做到10倍提效,但王文锋并没有将「省时间」作为产品的核心价值,他认为「准+快」才是 Sheet0 的长期核心价值。即:


1、 必须保证给用户交付的数据100%准确。


2、在单位时间内,尽可能提高数据的交付量。


构建人与 Agent 之间的信任,是一个长期的命题。「这背后是作为工程师也要信任模型。」


Sheet0 所有的系统行为都被分解成可以追踪、可复用的「语义步骤」,Agent 必须理解自己在做什么,并在出错时可以进行自我修复。这是王文锋的设计哲学,「在 Agent 干活之前,先让他变聪明。」


而让 Agent 变得可解释,是 Agent 下一步发展的关键环节。


作为连续创业者,王文锋自2017年毕业后,先是写了四年代码,期间曾负责地平线 AI 数据平台。 2021年和朋友合伙创业,作为 CTO 研发了新一代的 Serverles 消息队列,在 Data Infra、AI 领域积累了近十年的开发经验。2023年加入 AI 浪潮,开始了自己的第二次创业和 CEO 之旅。


AI 闹见到王文锋时,他刚从美国回来,时差还没有完全倒明白,sheet0 现在主攻美国市场,一半的团队在美国,10月将全量上线。


我们的话题围绕在 sheet0 上线两个月后,他对 Agent 的最新思考。实时数据的获取只是第一步,他接下来计划为大模型造更多的工具,他认为让模型自主学会使用工具,是 Agent 未来的竞争关键:「每造出一个新工具,相当于为模型解锁了一个新技能。」


图片

Sheet0 的用户界面


图片

Sheet0 的产品展示


话王文锋


1

1

1

1

可解释

先变聪明再变强


AI 闹:beta 版本8月上线后,用户是否接受这款产品?反馈如何?


王文:从注册用户、付费数据,比我预期要好不少。


现在80%的用户来自于发达国家,第一是美国,第二是日本,其中60%的用户每周在数据工作方面消耗时长超过5个小时。


日本是超出我预期的一个市场,好像是有一个日本博主把我们在美国做推广的帖子搬运后,来了很多日本流量。后来我调研发现日本用户的付费意愿更强,是因为他们的数字化基础比美国落后不少,使用 Excel 等传统数据工具的用户更多。


不过现在的主要目标是先把美国市场做好,美国市场起来后打其他市场可以事半功倍。


AI 闹:中国市场呢?


王文锋:我第一次创业也是做软件,我的经验是,美国竞争很激烈,但都有钱赚。因为能赚到钱,所以大家对做事情更有信心一些。国内软件的商业化土壤一言难尽。


AI 闹:进入真实的用户场景后,现阶段 Agent 需优化的最棘手的问题?


王文锋:如何构建一个合理的反馈闭环,这是非常细致的一个工程,比我想象的难度要大。


解决这个问题给我启发最大的是 Claude Code ,它让我意识到——Agent 要真正聪明,关键不在于「能做多少事」,而在于它能不能「知道自己在干什么」。


Claude Code 系统完全是事件驱动的,每一个动作、每一次变化,它都会自动记录成一条带语义的信息。


比如说,它会在工作过程中发出一种叫 reminder 的内部消息,用来提醒自己注意某个细节,但这条消息用户是看不到的。换句话说,它不仅知道「怎么做」,还知道「为什么要这么做」。


AI 闹:「带语义的信息」具体指什么?


王文锋:举个例子,你让 Agent 去整理一张网页上的表格。它可能要花四五步才能完成:打开网页、识别内容、发现错误、修改数据。但对模型来说,四五步太冗余了。


能不能把这些过程压缩成一句有意义的总结,比如「因为发现数值错误,系统自动调整了这一列」。这样一来,Agent 就不再是机械执行,而是能带着理解去行动。


它的每一步都有清晰的定义,可以被记录、被复用、被优化。


现在,我们架构上基本已经调整成类 Claude Code 的形式。希望 Agent 不只是执行指令,而是能像一个真正的「人」,理解自己为什么要这么做。只有这样,它才能不断进化。


AI 闹:Sheet0 没上线之前,你在一次行业分享中曾说过 Context engineering 是 Agent 成败的关键,这个思考现在有变化吗?


王文锋:没有,反而会觉得更重要了。Agent 想变得更聪明,关键是 Context 要够多、够细。包括用户的使用记录、任务执行过程中的反馈、失败案例等等。


只有积累到一定程度,Agent 才能真正学会在不同场景下该怎么做。


AI 闹:你认为具体需要多少才算积累到位?


王文锋:没有标准答案。因为 context 的类型太多样了。


我们现在有一个做法:当用户任务执行失败,比如某个网页数据没采集下来,我们会记录下失败案例,然后再去找类似任务里那些成功的案例,对比两者的差异。成功的路径,我们提炼出来、结构化保存,放进内部知识库。下次再有类似任务,系统就能直接调用这些经验,成功率会更高。


你可以把它理解成,我们在给 Agent 建记忆——每一次出错、修复、成功,都会变成它下次做得更好的基础。


AI 闹:听起来有点像是给模型建立 bad case 库?


王文锋:可以这么理解。当积累到足够多的经验后,这些数据就能直接拿去微调模型。原来它靠外部经验,慢慢就会变成模型自己的知识。也就是说,Agent 在一次次失败和修复的过程中,逐渐学会了避免犯同样的错误。


AI 闹:这个过程现在能自动化吗?行业有些做法会训练一个小模型去 check?


王文锋:目前还没办法完全自动化,我们是半自动的流程。人还是要参与做一些轻量级的标注或分类。


大家都在讲「端到端」,希望模型从头到尾自己搞定一切,但现实情况是没到那一步。


我觉得我们并没有脱离有多少人工,就有多少智能的阶段,LLM 只是放大了人类工作到 Agent 智能之间的杠杆;另外还有个关键是我们需要知道什么时候可以离开人工。


2

1

1

1

实时数据

从使用工具到创造工具


AI 闹:很多人质疑 sheet0 更像是一个传统的表格工具或者爬虫工具?


王文锋:我知道外界会有这样的印象。原因也挺简单的——因为 Sheet0 现在从能力上来说确实只有一个基础能力:从网页收集数据。


Sheet0 的目标是「在 AI 时代提供可扩展的实时数据获取能力」。


因为 Agent 的目标是 take actions,所以需要做决策,而做决策一方面需要依赖模型知识,另一方面还要依赖实时数据。比如「明天穿什么衣服」这个问题,模型就至少需要知道明天天气、去哪里找实时数据才能作出决策,光有知识还不行。


为了实现目标,Sheet0 采取的方案是 bottom-up 重新为模型构建出一整套的「数据工作环境」,构建这个环境的第一步,是可以将「任意的数据源变为动态的结构化表格」,而我们最先选择的数据源就是网页,因为它受众广,商业化价值也够高,让我们可以在 day 1 就开始赚钱。


所以现在大家说我们像「表格」或「爬虫」工具,有点像我们养狗,在狗子成年前都会有一段尴尬期。而 Sheet0 就在这样的尴尬期。我相信6个月以后大家再来看 Sheet0,就不会这样说了。我们会有更创新的产品形态交付给大家。


AI 闹:现在,你怎么看模型的能力边界和 Sheet0 的分工?


王文锋:其实我更想说模型和 Agent 的区别。


Agent 本质上利用模型知识,结合实时信息,使用工具解决问题的程序。今天我们看到基座模型在多个领域已经达到或接近博士水平;但是在实际的产品表现上面,还停留在实习生。


这里面的核心是实时信息和恰当工具的缺失。


我们讲「工欲善其事必先利」,所以 Sheet0 核心是在围绕数据场景设计一系列的「趁手工具」,并不会过多的去考虑模型的边界,因为我们相信在长期来看,模型是没有能力边界的。


对于模型厂商而言,如果一个工具的复杂性过高,就意味着它们一定不会去做,因为复杂的工具意味着需要 own 一个复杂的 infra。


AI 闹:基于上面的认知,你认为有哪些有巨大商业潜力的方向等待开发?


王文锋:比如最近我们的用户想做一件事情,需要找1000个英国 K12 的家长。传统办法是找当地的社区网站、或脸书的一些用户群组。


但换个角度想,什么样的人完成这个任务最简单,肯定是本身就在英国读书的孩子,假如他们有自己的 Agent,跟他的 Agent 联系一下,让他们收集20个家长联系方式,酬劳100块钱,肯定有人愿意(假设不考虑合规问题)。


现阶段这些数据是离线的,但却是最有价值的,如何更方便的获取这些数据也是我们的主线目标之一。这是让我最兴奋的部分,肯定会想出办法解决。


未来,我希望 sheet0 可以为用户收集整理所有数据,私有的,公开的和个性化的,并以结构化的方式交付。之所以强调结构化,是因为结构化数据天然是带有语义的,而且可以进一步通过类似 SQL 的工具让模型实时创造工具。


AI 闹:你觉得2025下半年到2026年,Agent 行业还有什么新机会?


王文锋:具体我说不上,但是我可以分享一个概念:价格弹性。


这是一个经济学上的概念,用于衡量当解决的问题的成本下降的时候,需求增加或减少的程度。当价格弹性为1的时候,意味着成本下降10倍,需求也会增长10倍。我的建议是可以思考哪些领域的问题是价格弹性大于1的,这些问题都非常值得用 Agent 的方式去解决。


3

1

1

1

100%确认美学

信任是第一要素


AI 闹:现在模型不可避免存在幻觉,以及 Agent 还严重缺乏 Context 的情况下,你为什么格外强调自己100%的准确率?


王文锋:我的理念是做 Agent 首先要让用户信任,信任很重要,背后也是工程师要信任大模型。


模型的「幻觉」由它的底层原理决定的,它的本质上是在「总结信息」——比如说我给它两百个网页,它会自己判断筛选出其中的一百个,然后再去总结内容。但压缩总结这件事是有风险的,它可能会理解错、归纳错,「幻觉」就是这么来的。


但是我们抓数据的逻辑更接近「复制粘贴」,你可以理解成,sheet0 就像一个认真抄笔记的人——网页上是什么,它就一模一样抓下来放进表格,比如说网页上是一张公司信息表,我们抓下来的数据在表格里也是一模一样。


在技术上,我们底层全是动态生成的代码,所以才敢说给用户交付的数据是100%准确的。


AI 闹:初期阶段就追求100%准确会不会导致进度慢?


王文锋:短期内确实会慢,因为我们做了很多 Infar 层面的努力,但我觉得长期来看,这是「慢就是快」。我们尽量避免做消耗动能的事情,而是长期积累势能。

就像我前面提到了,我认为构建 Trust 是人和 AI 之间的终极命题,我们需要在 Day 1 就坚持去做这件事情。


很多人不看好我们,我非常理解,因为相信,所以看见,我不能这么去要求别人。我过去的失败经验告诉我,选择坚持什么非常重要,这个是创始人的品味。


AI 闹:现在你中美两地跑,这一年美国的 AI 创业环境给你什么启发?


王文锋:我和很多美国的创始人交流,发现他们和中国创业者最大的区别是,他们敢于勇敢创新,敢于 bet(下注)。而中国的创业者,今天一上来就会被问「你的用户是谁、他们为什么用你、怎么保持用户粘性、竞品是什么、大厂干了后怎么办」,这其实是很让人难过的事情,因为过早的关注这些问题会扼杀真正的创新。


Lovable 火了以后,人们才发现用的最多是产品经理和销售,而不是程序员;同样在 Manus 诞生之后,人们才发现原来一个人真的可以一周看100个研报。


AI 产品应该从人性角度出发,在恰当的节点「打造出符合大家对未来想象的产品」。I know it when I see it。


图片

王文锋和他的柯基小狗叫「鸡腿」


图片

前景背包是王文锋,他日常热爱徒步,图在美国某国家公园


AI 闹:创业2年,前两个都没推进下去,有没有心理上的至暗时刻?


王文锋:有的。2024年10月份—12月底接近3个月的时间,真的是一片灰暗。那时第一个项目黄了,第二个项目决定不做了,新方向还没定,完全丧失了信心。加上我妈妈那会身体非常不好,应该是有点抑郁。


当时有非常想躺平的感觉,创什么业,为什么这么辛苦这么累;在3月份处理完我妈妈的后事之后,我又回到了北京,开始触底反弹。Sheet0 就是在这种状态下一点一点探索出来的。


加上回过头去看,当时做的第1个产品和第2个产品其实方向都很正确,但是就是因为太在意短期目标,中间没能推进下来。


之前有朋友问我,觉得做 CEO 最关键的能力是什么?我的回答是对痛苦的长期耐受力。而之所以能够忍受痛苦,一定是有一个更强的信念在支撑。所以我想告诉很多创业者,一定要相信自己!

韩国报告-文章页底部图片
TikTok、Facebook、谷歌、Twitter广告服务,0门槛抢占全球流量!
极速开户+优化投流+风险保障+效果跟踪,仅需4步,轻松撬动亿万海外流量,让品牌销量翻倍增长!
已成功开通5000+账户
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
沃尔玛推出新供应链策略“预付整合”,提升配送效率
沃尔玛推出一项新的供应链策略“Prepaid Consolidation(预付整合)”,旨在通过简化供应商入库物流流程,加快商品从供应端到门店及消费者的流转速度,同时降低整体运营成本,并进一步提升库存稳定性与服务效率。
eBay英国站将实施P&A品类30天免费退货及运费补贴
2026年6月8日起,eBay将在英国站点对符合条件的Parts & Accessories(P&A)商品实施新规,符合要求的商品将必须提供至少30天的免费退货服务和50%退货运费补贴机制。
2个月营收300万美元,TikTok直播拍卖正批量造富
撕开年中流量困局,TikTok开卷直播拍卖
Allegro进军乌克兰市场
波兰电商平台Allegro正计划进入乌克兰市场,并在分阶段推进其跨境电商布局。该项目将首先在2026年6月启动第一阶段。
多类目利润缩水,卖家打法大变天
跨境电商行业,近年来正在陷入“规模向上、利润向下”的怪圈。根据Marketplace Pulse的数据,2026年受调的年收入超20亿美元的181家电商平台卖家中,有高达69%的卖家利润表现不佳,其中有38.1%的卖家收入、利润双双下滑,同时还有30.9%的卖家收入虽有所增长,但利润率却停滞不前、甚至有所下降。图源:Marketplace Pulse在行业整体利润走低的背景下,亚马逊美国站多个核心类目的卖家也都感受到了经营压力。从家居厨房到办公用品,再到玩具品类,“盈利难”已成为诸多跨境卖家面临的共同挑战。
卖家达2.1万,TikTok Shop成西班牙第16大电商平台
数据显示,在2025年11月至2026年4月期间,TikTok Shop平台累计吸引约21,000家本地卖家入驻。
亚马逊品牌推广,如何创建个性化图片素材
亚马逊搜索结果页的注意力竞争已进入毫秒级,用户单次浏览搜索结果的平均停留时间不足3秒。在这一极短时间内,文字信息几乎无法被有效接收,图片素材成为决定用户是否点击广告的唯一决定性因素。多数卖家仍依赖产品白底图作为广告素材,导致广告在同质化的搜索结果中被淹没,点击率长期低于行业平均水平。本文基于亚马逊平台品牌推广广告的投放数据,从视觉设计、内容构建、优化三个维度,提供可直接复用的个性化图片素材创建方法,帮助卖家系统性提升广告点击率与销售额。一、图片素材对广告效果的决定性影响亚马逊品牌推广广告的展示位置集中在搜索结果页顶部与中部,同一页面通常会同时展示4-6组广告素材。
Etsy将实施儿童产品新规,新增多项禁售与安全要求
Etsy最新的“儿童与婴幼儿产品政策”将于2026年6月2日正式生效。该政策旨在进一步强化平台对儿童相关商品的安全管理,并明确部分儿童产品的禁售范围。
流量更贵、转化更难,亚马逊卖家2026全面承压
Jungle Scout发布了《2026年亚马逊基准测试报告》,报告系统性分析了2024年1月1日至2025年12月31日亚马逊美国站整体市场表现与2026年竞争环境,重点围绕美妆个护等品类洞察、竞争格局、广告与转化表现等维度展开。
亚马逊推出新品推荐标签,帮助卖家获取更多曝光
亚马逊将为平台上的部分新品自动添加“New Arrival(新品到货)”或“Notable Arrival(值得关注的新品)”徽章,以帮助消费者更容易发现新上架商品,同时提升新品的曝光度和前期销量表现。
靠“站外 2.0”,亚马逊亿级大卖实现百万美金增量!
ACOS狂飙之下,出海大卖为何转向站外联盟?
2026亚马逊Prime Day定档6月,最后27天运营冲刺手册
Prime Day仅剩27天,促销规则和费用模式全面翻新。本文拆解促销优选、广告分层、库存风控和利润守护四大模块,助你精算每一分钱。
28天卖了50万,中式菜刀在TikTok美区太好赚了!
中国菜刀在TikTok火了,跨境卖家靠其入账上百万
存跌落风险,美国CPSC紧急召回亚马逊在售儿童餐椅
美国消费品安全委员会宣布召回PandaEar品牌两款便携式挂桌儿童餐椅,原因是产品存在严重跌落风险,可能导致婴儿受伤甚至死亡。此次召回涉及约9700件产品,召回日期为2026年5月21日。
运营风向标!亚马逊7大核心品类洞察
本文章为Jungle Scout《2026年亚马逊基准测试报告》下半部分,主要内容为2024年1月1日至2025年12月31日亚马逊美国站,厨房、庭院、办公用品、宠物用品、运动户外、家装改进、玩具与游戏七个核心品类亚马逊市场分析;2026年卖家运营建议。
“多功能”护肤彩妆受欢迎,85%消费者开始关注成分
GlobalData发布的报告显示,将护肤与彩妆结合的“混合美妆”正在全球范围内快速升温。随着消费者开始追求更简单、更高效的个人护理流程,多功能产品正在成为越来越多消费者的新选择。
AMZ123《全球电商市场报告——俄罗斯篇》
全球格局也在分化。新兴市场依靠渗透率提升释放空间,成熟市场则在消费习惯与渠道格局的更迭中重塑增长逻辑。社交化购物、价格敏感度提升、平台多元化交织,使用户行为与市场秩序进入重构周期。
《美国电商领域美妆行业现状》PDF下载
“2025 年是护肤品风靡市场的一年。从去角质产品、精华液到红光美妆仪和韩式美妆热潮,所有人都热衷于追求有光泽的肌肤。消费者希望拥有真正有效的产品,而且喜欢在购买前先试用迷你装或套装。与此同时,A 正在悄然主导一切。
《韩国电商市场数据月报》PDF下载
韩国拥有全球第五大电子商务市场,2024年电商销售额超过千亿美元,预计到2026年将超过1600亿美元。这种快速增长主要得益于韩国高达97%的互联网普及率和对5G技术的早期采用。韩国消费者的购物习惯正迅速向线上转移,2023年线上购买已占总销售额的50.5%。此外,中韩自由贸易协定的签订进一步促进了两国之间的贸易合作,降低了关税壁垒,为中国品牌出海进入韩国市场创造了有利条件。
《出海中东指南》PDF下载
2025年开年以来,美国关税政策持续收紧,中美贸易关系的不确定性加剧,依赖美国市场的中国跨境卖家面临利润压缩与合规风险的双重挑战。在中美贸易摩擦持续深化的背景下,中东电商市场正成为跨境卖家多元化布局的战略要地。
《TikTok Shop 2024-2025西班牙站点报告》PDF下载
在全球社交电商高速发展的时代浪潮中,TikTok已然崛起为品牌与消费者深度互动的重要阵地。TikTok不仅重塑了用户的消费习惯,更开创了"发现式购物"的新模式,为品牌营销带来了前所未有的机遇与挑战
《2026全球女士内衣市场洞察白皮书》PDF下载
全球女士内衣市场正经历从基础功能型向场景驱动型的深刻变革。消费者需求持续向舒适性、功能细分及情感价值融合演变,推动品类创新与市场扩容。传统内衣巨头增长承压,以科技创新为核心的新兴品牌快速崛起,行业竞争格局加速重构。供应链向区域化与敏捷化调整,舒适革新、工艺创新、智能应用与可持续发展成为产品升级与品牌差异化的关键路径。
《TikTok Shop 2026 东南亚跨境出海经营白皮书2.0》PDF下载
在全球电商市场,TikTokShop正展现出强劲的发展活力。依托多场域电商经营模式,众多商家实现了业务的快速增长。白皮书系列依托于系统性梳理成功商家的实践经验与运营策略,希望助力更多商家高效入局,实现可持续发展。
《美客多墨西哥市场趋势洞察》PDF下载
美客多远不止是一个电商平台。这里映射着数百万墨西哥消费者的潮流趋势、喜好变化和日常消费选择。
侃侃跨境那些事儿
不侃废话,挣钱要紧!
AMZ123卖家导航
这个人很懒,还没有自我介绍
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
首页
跨境头条
文章详情
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部