AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

对话豆包前高级总监、Chance AI曾熙:视觉AI的新战场不是识图,而是读心

99
2026-06-16 16:21
2026-06-16 16:21
99


让 AI 看懂人类社会需分几步走?


 01 
打造会思考、懂人的视觉 AI


想象一个场景:你坐在曼谷一家餐厅,手机对准一张泰语菜单:2026年的 AI 不仅能把泰文翻译成中文——这已经像是上个时代的把戏了——它还能记住你是素食主义者,从二十道菜里挑出那三道不含肉的,用标准泰语帮你点单,顺便把附近评分最高的甜品店塞进你的下午行程。


这就像你雇了一个既懂你口味、又精通当地语言、还顺带是美食博主的私人助理。只不过,它在你的手机里,通过拍照即可得到。


这正是2026年很多创业者押注的新方向:不仅让 AI 准确识别事物,还要让它理解「你为什么要拍这个东西」,以及「接下来你想要干嘛」。


Chance AI 就是切入这个方向。创始人曾熙有一个有趣的背景:他在巴塞罗那读认知科学与当代艺术博士,研究的问题是——为什么人类看到毕加索蓝色时期的画会感到忧郁?


这是一个文艺话题,但背后的原理其实非常硬核。


它触及了人类视觉系统的本质:我们的眼睛是摄像头,通过我们的大脑把视觉信号转化成情绪、记忆、意义。


现在,曾熙想让 AI 也学会这套本事:「为 AI 搭建一套视觉推理系统,把视觉信号转化成有价值和判断的解释。」


Chance AI 的产品逻辑很简单:用户拍照,APP 自动识别,然后给出解释,随着 AI 越来越了解你,解释会变得越来越个性化。


比如同样在画展拍毕加索:


  • 一个孩子可能得到:毕加索是谁?回顾下昨天绘画课堂讲的知识点,你晚上可以试着画什么?
  • 一个艺术爱好者可能得到:毕加索和蒙克的异同,城里还有哪个展览适合你?要不要现在帮你订票?

曾熙有一套公式来解释 Chance AI 的核心逻辑:识别视觉信号+个性化上下文+社会共识=价值意义


听起来有点抽象?我们简单拆解一下。


假设你随手拍了一张演唱会海报。对 AI 来说这不只是「一张印着字和图案的纸」,而是待解的工程:


  • 这是什么演唱会?(识别视觉信号)

  • 你是这个歌手的粉丝吗?(个性化上下文)

  • 票好买吗?值得去吗?(社会共识)


然后,推导出行动:


  • 什么时候开票?

  • 要不要帮你加进日历?

  • 开票当天是否设置提醒?


「我们想让 AI 长出一双有思考能力的眼睛。」曾熙说,「See the unseen——看到表面之下的东西。」


曾熙身上有种奇妙的混搭气质。他能用神经科学术语解释视觉皮层的工作原理,也能用黑色幽默讲英国皇室和中国皇室的审美哲学,会用硬件行话聊供应链和 PMF,同时喜欢橘子海,一支只唱英文歌的山东青岛籍乐队。


毕业后,他先后在一加、OPPO 工作,最后一份工作是在字节跳动的 Flow 团队担任高级总监。


2024年,当 GPT-4o 多模态模型出世时,曾熙收到了一个明确的信号——这个技术方向正接近他博士期间研究的问题:人类的视觉系统如何生成意义?


这就是 Chance AI 诞生的故事。


Image

曾熙

Image

展览是常用场景

 02 
以生物视觉重构 AI 推理能力


Chance AI 目前已经积累了20万用户,其中40%在北美。产品的使用门槛很简单:拍照、识别、解释。


在技术底层,曾熙做了一个反共识的选择。「行业现在最大的误区,是试图用一个模型解决复杂的视觉推理,这是不可能的。」


他在工程侧模仿了生物的视觉机制,把推理过程拆成了四步——就像人类大脑处理视觉信息时,会经过初级视觉皮层、形状识别、语义理解、决策规划等多个阶段。


这套方法的效果如何?根据曾熙的说法,在目前最严苛的专业级多模态推理基准 MMMU-Pro 上,Chance AI 跑出了86.07%的分数——这是目前已知的最高分。作为对比:


  • Gemini 3 Pro:81.00%
  • GPT-5.4:78.00%
  • Claude Opus 4.6:75.00%

为了打消外界对「内部测试」的疑虑,团队最近把底层 API 开源,封装成可供其他 Agent 调用的 CLI 工具,希望学术界和开发者亲自跑分验证。


Chance AI 还在非常早期的阶段,曾熙承认 VLM(视觉语言模型)应用类产品大规模爆发还需要等待(或证明)三件事:


第一,「看」不是低频行为。 视觉会成为下一代交互入口——就像十年前触摸屏会取代键盘一样。


第二,把「看」真正转化为「行动」。 识别是第一步,理解是第二步,最终价值在于——AI 能不能帮你完成事情。


第三,在巨头的系统能力之外,自己的不可替代性。


Image




对话曾熙




AI 闹:先问一个 AI 视觉的科普问题。AI 已经能帮我们写论文、做奥数,但仍然很难判断「一杯冒热气的水不能碰」。为什么连婴儿都能理解的事,对 AI 反而是高难度?


曾熙:要先引入一个概念:人类看到的任何一个东西,都不只有表面那一层。


比如为什么一辆布加迪威龙的售价会比同等重量的黄金还要贵?或者一件潮牌 T 恤,可能上面只是多印了一个 logo,就比一件普通 T 贵很多?


所以让 AI 做到真正理解,要拆成三层:


  • 第一层是感知,就是视觉识别。

  • 第二层是上下文,从哪来?经历过什么?为什么重要?

  • 第三层是社会共识。比如开布加迪威龙就释放出一种财富信号。


“感知+上下文+共识”才决定一个事物的价值。


但今天行业大部分产品,只停留在第一层,因为普遍做法是用一个模型来解决复杂的视觉推理,这是完全不可能的。


我们要做的是让 AI 进入第二层第三层,比如理解为什么在人类社会同等重量的布加迪威龙售价会比黄金还要贵。


AI 你之前提过一个很有意思的判断,视觉理解的突破不能只靠更大模型、更强算力,而是要参考人类的生物机制?


曾熙我认为 AI 在下一阶段技术突破的趋势是通过参考其他学科的解决办法,把它们翻译转换过来,这是最难也是最具挑战的部分。


比如 AI 的视觉理解就要参考生物的视觉系统。生物从「看到」到「理解」是分四步的。


  • 第一步是采集——把我们在真实世界里看到的视觉信号映射到视网膜上;

  • 第二步是转化——把视觉信号转化成神经信号;

  • 第三步是传输——把神经信号传到负责思考的大脑里;

  • 第四步才是真正的视觉推理。


我们现在的做法是把四步拆成工程再用不同的技术实现,参考 Unix,把复杂问题拆成很多小模块,每个模块只做好一件事。


  • 采集:获取视觉信号
  • 转化:把视觉信号转化成模型能理解的格式
  • 传输:建立统一的通信协议
  • 推理:基于转化后的信号进行深度理解


以上四步还得串联通信协议,有点像现在流行的 MCP 或者 Skills,相当于我们也要做一部分视觉领域的基础建设。


Image


AI 闹:之前豆包的拍照功能就是你主导的,大厂没有这么干吗?


曾熙大厂倾向选择一个模型解决一切,不是因为它们没有能力,而是因为他们有更大的模型,更多的数据,更强的算力,以及想做更统一的入口。但视觉理解并不是一张更大的参数表就能解决的问题。它更像一条神经链路。比如人的眼睛不负责思考,眼睛只是采集信号。真正理解发生在信号转化、传输和大脑推理之后。


大厂想做的是更强的眼睛,我们想做的是眼睛后面的神经系统。


AI 现在产品刚上线一年就累积20万用户,怎么做到的?


曾熙种子用户是2024年我和朋友探索了一个小项目,给在深圳举办的安迪沃霍尔展览做 AI 导览。展览结束之后,大概还有大几千个用户日常也会用它拍东西,比如名胜古迹、花草,商品、食物。


之后产品正式上线,第一批是针对北美和印度的一些高校做的社群项目。刻意寻找了一批设计系、艺术系的学生,他们本身就是极度视觉导向的年轻人群体。在校园里形成了非常强的口碑自传播。此外,我们还在 Product Hunt 上连续两次拿下了当日最佳产品。


20万用户几乎没有花钱去买量。


Image


AI 闹:用户具体用它做什么?


曾熙:很反常识,我们几乎没有30到45岁的用户。


第一类主力用户是年轻人,大概15到25岁,第二类是45到55岁,甚至更年长一点、接近退休的人。他们有时间也有好奇心。30到45岁的人群反而很难使用一个「跟生产效率无关」的产品。


主要场景有三个:


第一个是旅游,尤其是出国。


第二个是生活场景。让 AI 看一下穿搭,面试穿什么,见男朋友穿什么;和闺蜜喝下午茶看食物的热量、去书店拍书了解核心思想。


第三个是兴趣爱好。有个用户一天拍了300多张石头照片,后来才知道他是个矿物爱好者,收藏了很多石头,兴趣场景粘性最高。


AI 闹:「穿搭」这个场景有意思,其他场景是给信息、给知识,相对客观。穿搭要提供品味建议,相对主观,AI 怎么做到?


曾熙某种程度上成立。但我观察到的更复杂一些。


这是个好问题。我是这么理解的,好品味是由一系列高质量决策组成。


我们无法告诉用户「好看」或者「不好看」,我们是在做决策之前给他提供更多高质量的选项。


比如用户问一件碎花裙,我们马上找来跟碎花裙相关的比较 trending 的图片、社媒讨论热点、公开网络形成的高质量观点。最终穿什么,还是由用户来做。


相当于压缩了形成品味的效率,时间累积,用户自然能形成自己的品味。


AI 闹:我有个疑惑。我们真的需要一个 AI 随时解释眼前的生活吗?怎么避免「过度解说」?


曾熙举个例子,我很喜欢看球赛,Chance AI 有点像我们看球赛时的解说,不同的解说会带给人完全不同的感受。


比如你在逛街,它可能会跟你说:这条蓝色裙子不太适合你,因为家里已经有一条类似的了。为什么不考虑一下那条淡绿色的?最近很流行,显得你皮肤白。而且这条绿裙子,恰好跟你昨天逛过的那家店里的某双鞋子还挺搭的,相当于你拥有了一个实时陪你看世界的「闺蜜」。


它可以帮你解读眼前的生活,给你提供更多选项。让你正在经历的真实世界变得更有意义。


AI 闹:这两年在 VLM 上做应用层的公司不多,第一是因为 LLM 机会非常多,第二是 VLM 应用的确定性不高。为什么创业要切入这个方向?


曾熙:视觉应用是下一个时代最大的入口,没有之一,我无比确定。


第一, Google Lens 在2025年加了 AI mode 之后,带来了70%的用户增长,且全是新用户,这是客观数据。


第二, Z 世代甚至是阿尔法世代的成长就是在 Instagram、TikTok、抖音、小红书这类产品浸染下长大的,他们可以说是「视觉原生一代」,对他们来讲,文字反而是补充。


第三,未来,每个人都需要一个终端来连接自己与虚拟世界。今天的终端是笔记本电脑、手机,或者如智能手表、智能耳机。那未来设备会演化成什么样?目前还不确定。但我笃定的是,它一定是一个能跟你的感官同频的产品——听到你听的,看到你正在看的,同时有自己的运算和通讯能力来补充你的信息。


我们想做的是在下一代 AI 终端没有完全确定之前,先把「视觉大脑」打磨好,等下一代视觉终端来了,直接无缝接进去。


AI 闹你正好回答了我的另外一个疑问。你有过硬件背景,但创业没有从硬件切入?


曾熙:我非常知道其中门道。 iPhone 卖得好并不是因为硬件本身,而是因为它丰富的生态。硬件是最终的结果,只不过大部分人都误会了。


AI 闹:不做垂直场景,也不做硬件,对商业化是怎么思考的?


曾熙:现阶段我们对商业化的判断是先把「入口」做成,再把商业化做深。


Chance AI 不是一个一次性工具,我们更想先让用户形成一种新的习惯——看到一个东西,会下意识地先用 AI 去理解它。如果这件事成立,商业模式其实会比较自然地长出来。


最明确的路径有三条。


第一条是 Premium 订阅,面向高频用户提供更强的能力,比如更深入的 Live 模式、更长链路的视觉记忆、更个性化的理解与判断、以及不同场景下的专业 Visual Agents。


第二条是 B2B/授权合作,艺术展览、博物馆、教育等场景,甚至 AI 硬件厂商,本质上都需要一层「视觉理解系统」。


第三条才是场景内的推荐与交易,但会非常克制地做。不会把用户的好奇心导向广告或购物链接,而是在用户已经完成理解之后,再帮助他做下一步行动,比如订票、预约、到店体验、点菜、购买等。


但一切前提是视觉入口成立,订阅、授权和交易都会有空间;如果不成立,任何商业化都只是短期变现。


AI 闹:很多大厂也在探索视觉 OS 的方向,他们有硬件、有模型、有分发。Chance AI 的壁垒是?


曾熙:大厂提供 VLM 能力,硬件负责采集世界,具体应用负责服务某个场景,Chance AI 的价值是如何理解、组织、解释,并触发下一步行动。


我想做的是中间层,是「神经系统」。可能更像米家生态——无论用户买什么样的小米电器,最终都要返回到米家生态。


Image


AI 闹:跟你做同一方向的创业公司还有哪些?


曾熙暂时没有看到,我们是全球唯一一家,这也是让我有点恐慌的点,但也并不是做早了,比如提前了十年。也许 DeepMind 也在做,只是外界不知道(笑)。

6.24深圳联宇大会-文章页底部
TikTok、Facebook、谷歌、Twitter广告服务,0门槛抢占全球流量!
极速开户+优化投流+风险保障+效果跟踪,仅需4步,轻松撬动亿万海外流量,让品牌销量翻倍增长!
已成功开通5000+账户
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
25年TikTok日本影响力报告:年消费高达3468亿日元
TikTok发布《2026年TikTok日本经济与社会影响报告》。截至2026年5月底,日本市场的月活跃用户数量约为4950万人,2025年通过TikTok产生消费额达到3468亿日元,较2024年的2375亿日元增长46%。
26年欧洲美妆平台报告出炉:亚马逊领跑8国市场
NielsenIQ发布《2026美妆电商:增长新规则》报告。亚马逊已成为欧洲线上美妆市场最具影响力的平台,在欧洲10个主要市场中的8个排名第一。不过,TikTok Shop、Joybuy、Primor、Aroma-Zone等新兴平台和品牌也在快速崛起。
一款能“DIY”的许昌假发片,在TikTok美区爆卖650万
凭钩针接发,TikTok假发商家在“淡季”月销上百万
AMZ123会员专享丨6月第3周资讯汇总
亚马逊随着Prime Day 2026临近,亚马逊印度正在进一步扩大面向平台卖家的人工智能工具布局,以加强对中小企业和商家的支持,帮助其提升运营效率和销售表现。亚马逊澳大利亚将免费当日达服务扩展至吉朗,Prime会员订单满49澳元即可享免费当日达(中午前下单,当日晚上10点前送达),覆盖电子、家居、服装、玩具等超50万种商品。亚马逊宣布,将在美国密苏里州蒙哥马利县(Montgomery County)投资数十亿美元建设先进数据中心园区,以支持云计算和人工智能基础设施发展。
GMV增长近4倍!Lazada越南与菲律宾站6.6大促数据出炉
Lazada公布了其“6.6超级大促”期间的运营数据,越南站的平台整体商品交易总额(GMV)相比日常水平增长近4倍,增幅达到276%,菲律宾站GMV较日常增长260%。
Shopee母公司Sea推出AI聊天机器人Migoo
Sea正在美国等地区推出一款生成式人工智能聊天机器人Migoo。
OpenAI Q1支出37亿美元,亏损规模持续扩大
OpenAI在2026年第一季度消耗资金达37亿美元,而同期营收为57亿美元,难以覆盖成本支出,整体运营压力持续加大。
月销百万美金!10款亚马逊庭院与家居产品需求增长
亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。Pocket Hose品牌的可伸缩花园水管预估销量4.4万,预估月销售额为309万美元。
25年TikTok日本影响力报告:年消费高达3468亿日元
TikTok发布《2026年TikTok日本经济与社会影响报告》。截至2026年5月底,日本市场的月活跃用户数量约为4950万人,2025年通过TikTok产生消费额达到3468亿日元,较2024年的2375亿日元增长46%。
《美客多趋势报告-巴西站》PDF下载
根据Kantar《Media Reactions 2024》数据,86%的巴西网民使用美客多进行购物、寻找优惠信息或比价。同时,拉美地区每10个人中就有8个在美客多进行搜索,充分体现了电商在该地区的主导地位。
《TikTok Shop 墨西哥市场分析报告》PDF下载
在全球社交电商高速发展的时代浪潮中,TikTok已然崛起为品牌与消费者深度互动的重要阵地。TikTok不仅重塑了用户的消费习惯,更开创了"发现式购物"的新模式,为品牌营销带来了前所未有的机遇与挑战。
《2026全球AI眼镜行业战略洞察报告》PDF下载
过去三年,全球 AI 眼镜市场经历了爆发式增长:出货量从 2023 年的 34 万台激增至2025 年的 870 万台,三年增长超过 25 倍。2026 年,这一数字有望突破 1000 万台。苹果、谷歌、三星等科技巨头纷纷入局,资本市场反应同样迅猛。
《2026年世界杯营销白皮书》PDF下载
世界杯是全球数十亿球迷四年一次的集体狂欢,这种强烈的情绪共鸣转化为巨大的消费动力。从球衣、围巾到旗帜、喇叭,每一件商品都承载着球迷对球队的支持与热爱。
《2025中国宠物行业出海蓝皮书》PDF下载
随着全球养宠人群结构持续优化、宠物人性化与高端化趋势深化,以及新兴市场养宠渗透率的不断提升,未来五年全球宠物市场预计将以 5.1% 的年均复合增长率持续增长,呈现出更为健康、可持续的增长态势。
《2025-2026年中国企业出海研究报告》PDF下载
在全球产业格局深度调整与数字技术加速演进的背景下, 中国企业出海正从早期的产品出口阶段迈入以品牌、技 术与产业体系为核心的全球化发展新阶段。
《消费电子行业趋势报告》PDF下载
消费电子行业流量稳定增长,近6个月流量同比增长+5%。地区上日韩/北美/欧洲增长较高,从国家来看,日本、韩国、荷兰、加拿大、意大利以及拉美的巴西,可重点关注。
《美客多趋势报告-阿根廷站》PDF下载
在当今的消费环境中,每一次购物都成为消费者身份的体现,反映出消费者的兴趣、欲望和价值观。这些选择受到时代和文化的影响,不仅展现了消费者的偏好,也塑造了消费者与市场的关系。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
AMZ123卖家导航
这个人很懒,还没有自我介绍
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
首页
跨境头条
文章详情
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部