AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

Chance AI 走红北美年轻用户,重构人与AI交互方式

霞光社
霞光社
159
2026-03-31 21:29
2026-03-31 21:29
159

4月16日深圳,POD卖家必看!AI设计/3D打印/欧洲市场实战拆解,点击报名

“夏日午后,休息时凝视远山或树枝,直到 ‘灵韵降临’,人与景物产生一种神秘共鸣。”


德国哲学家本雅明在代表作《机械复制时代的艺术作品》中,如是形容这种独一无二、物我两忘的审美体验。这是一种难以复刻的独特感受,与AI支配下泥沙俱下、批量生产的虚幻景观大相径庭。

人类如芦苇般孱弱,却因思想而拥有尊严。我们可以听见声音、接收画面、有身体的触感,也可以知道空间感的放大缩小、呼吸的节律,以及细默之处未曾言明的情感表达。这些细腻幽微的情绪,是人类最难以被模拟与替代的部分。

“Technology is an extension of life.(技术是生命的一种延伸)”。凯文凯利在《科技想要什么》一书中曾表达过同样的观点,如果人类与 AI 发展的终极理想,是实现人与技术的共生共舞,让人工智能真正拥有接近人的思考、生命力与表达力,那么一个不容忽视的现实是:时至今日,人与 AI 最主流的交互方式,依然停留在文字层面。

这也成为人机协同路上一道难以绕开的障碍 —— 我们大量的所见、所思、所感,仍无法与 AI 实现真正的身临其境。譬如一位痴迷奇石、对石头怀有极致热爱的人,若想将他眼中万千石头的肌理、气韵与特质传递给 AI,单纯的文字描述远不足够。一个集图像、视觉、声音于一体的 “石头数字馆”,才能真正支撑他与 AI 并肩鉴赏、共情共鸣。

那么,什么才是对于用户来说更自然、更具有粘性的交互方式?

过去半年,一款名为Chance AI的app快速在纽约大学(NYU)、南加州大学(USC)等北美校园风靡,学生们用Chance AI看穿搭、逛展览、比较球鞋和卡牌、记录皮肤状态、观察植物与宠物,甚至看图写诗。其独特性在于,Chance AI 提出了一个新的产品形态,即Visual Agent:在视觉之上建立解释层,让AI不仅看到事物,更参与解释其意义,进而帮助用户形成判断与品味。

在Chance AI看来,视觉不是输入方式,而是人类的认知系统。“对人类来说,视觉才是最直觉的操作系统,而不是输入框。”Chance AI创始人兼CEO曾熙告诉霞光社,“从第一天开始做产品,我们的首页就是没有任何输入框的。在我们的产品里面唯一的输入框就是出现在评论区,但是现在更多人是用语音,点开只有一个拍照按键,进来以后用户不用输入prompt,one tap,因为这才是人类最直觉的方式。”

使用方式也很简单,只需要通过Chance AI拍摄任何图片,Chance AI就会快速将图片内容转为对于图片深层次含义的解读。每一个图片都不只限于“阅读”,更多在于“理解”,即在认识的基础上解释看见事物的意义;

此外,Chance AI也有Live模式,即实时视觉交互系统(Real-time Visual Intelligence System),在Live模式中,用户可以一边看,一边与Chance AI交流,它还会做出对于画面的实时视觉理解(Real-time perception)以及连续推理(Continuous reasoning,而非单次响应)。

巴塞尔艺术周现场,观众使用Chance AI「Visual Agent – Live」,在观看作品的过程中与AI实时交流与理解

Chance AI的交互方式,打破了过去两年间,AI通过输入框提问、随后获得答案的主流形态。曾熙向霞光社表示,产品设计的差异源自年轻人认识世界的底层逻辑不同,对从小使用emoji、meme和缩写沟通的Gen Z来说,他们本身就是visual native:更习惯通过图像和直觉理解世界,而不是先组织语言再提问。也就是说,越来越多的年轻人对于现实世界的认知方式是从“先提问再理解” 转变为“先看见再理解”。

对图像的精准理解离不开Chance AI的技术突破。MMMMU-Pro 是目前最严苛的多模态基准测试之一,它通过过滤纯文本可解题、增加选项干扰,并将问题嵌入图像中,真正考察 AI 是否具备人类级别的视觉理解与跨学科推理能力,而非依赖模式匹配或文字捷径。Chance AI Visual Agent 在 MMMU 相关评测中以 86.07% 的准确率位列世界第一,在艺术理解、结构分析与跨语境解释等任务上表现优秀,甚至超越了人类在2024年的成绩。

实际操作上也可见Chance AI的出色表现,如下图所示,为一块坐标于洛杉矶的市中心的石头,在Chance AI的“看见”里,不只有关于石头的来历故事——即一位艺术家把这个石头从内华达州搬过来花了1300万美金,还有这一故事背后的意义:这场搬运是为了体现美国的种族和阶级对立的问题。

更重要的是,Chance AI真正意义上做到了千人千面地帮助人理解世界。在Chance AI,每个人的页面都是个性化的,因为不同人看见、感受的世界存在差异。而在Chance AI已经布局的不同国家/地区,用户之间的差异化也能反馈出地区的特性,这是Chance AI的独特价值——勾勒用户眼中的世界

在效率工具泛滥的当下,Chance AI的魅力在于,当用户以主动探索的方式理解事物,他会逐渐形成自己的判断:什么是好的,什么是有价值的。也正因此,人们在使用AI过程中常出现的顾虑,如是否会面对更为千篇一律的AI流水线产品、AI是否会让人丧失思考的能力,似乎不再需要犹疑。个性化的反馈、对事物更深的理解,都能让用户开始重新激发好奇心——那些曾经习以为常的东西,会再次变得值得被解读。

一些北美高校学生们表示,“有时候我不是想问什么,我只是想看看它会怎么看。”“I started noticing things I used to ignore”,这或许也符合了Chance AI对于年轻一代认知世界的判断:“视觉让理解更直接,也让好奇心重新成为驱动力。用眼睛理解世界,正在成为一种新的基础行为。”而这一“主动探索”的体验感,形成了用户与Chance AI的持续使用粘性。

事实上,人类对现实的认知,往往始于视觉,先看见,再感受,然后逐渐形成判断。“visual reasoning是帮助你找到它的Perception跟knowledge,然后再加上connection就是它的社会共识,这样组成了今天的产品形态。”曾熙告诉霞光社。

与此同时,行业层面也展现出了年轻用户倾向于使用视觉交互的趋势:其一是,多模态交互(Lens / Circle to Search / AI Overviews)在年轻用户中的增长最快;其二,Google Lens每月产生超过三十五亿次级视觉搜索请求。

截至目前,Chance AI的全球年轻用户已突破20万,在iOS欧美多个国家进入下载榜Top 3,并在Product Hunt上两次获得当日最佳产品(Product of the Day)。在刚刚过去的香港Art Central艺术展上,Chance AI也作为官方创新合作伙伴,深度融入观众的观展体验,这一能力也首次得到了真实场景的验证。

面向未来的可能性,曾熙表示,手机拍照分享目前是图片数据来源最直接、量最大的场景。“现在我们的数据是,每个北美的女生每天会拍2.8次的穿搭,这是非常海量的数据。”而视觉数据本身就创造了价值,“我们想把Visual Agent engine这‘发动机’给搭好,以后我们会有更丰富的数据,会形成视觉的社区,这就是最大的价值。”

曾熙早年在 University of Barcelona 获得博士学位,研究方向集中在认知科学与当代艺术,关注人类如何通过视觉理解世界、形成判断与意义。 随后,他先后在 OnePlus、OPPO 负责产品与设计,并参与构建面向数亿用户的硬件定义与系统体验。 在ByteDance期间,他在Flow担任产品与设计高级总监,参与AI相关产品从0到1的探索(豆包)体系的早期构建。豆包代表了这一代 AI 产品的典型形态:以对话为核心入口。

这段经历让他意识到一个结构性问题:当前AI已经非常擅长“生成语言”和“回答问题”(尤其是大厂的必争之地,因为离LLM很近),但对于人类如何在现实世界中形成理解,尤其是基于视觉的直觉判断——仍然缺乏支持。因为这直接决定了,每一个事物的“意义”。

在他看来,这不是一个功能缺失,而是一个交互范式的空白:AI已经很会“说”,但还不够会“看”。Chance AI正是在这个判断下诞生:如果AI的下一阶段不只是回答问题,而是参与人类理解世界的过程,那么视觉能力可能会成为新的入口。他正在为了下一个时代的AI终端做准备。

我们处在一个科技大发展的时代,无数高速迭代的科技产品快速出现、又快速成为旧闻,科技已经包围、席卷了人的工作与生活。对科技产品的赞叹和恐惧,交织在一起,成为现代人普遍的心理情结。

而在每一场技术的变迁中,一个有趣的现象是:如何落地从来不是由发明者决定的,而是由用户和它如何交互决定。比如作为通信工具的手机,最终演变成了触屏的交互方式,才能变为用户日日、时时无法离身的“肉体外挂”。

AI时代的交互或许也是无处不在的。在谈及“Chance”这一名称的由来时,曾熙表示,这个名字源于他对当下生活方式的一种观察。在高度算法化的环境中,人们越来越习惯沿着被推荐的路径前行,日常经验变得可预测且重复,而真正具有启发性的时刻,往往来自那些未被预设的“偶然”。

4.10 杭州亚马逊大会-文章页底部图片
TikTok、Facebook、谷歌、Twitter广告服务,0门槛抢占全球流量!
极速开户+优化投流+风险保障+效果跟踪,仅需4步,轻松撬动亿万海外流量,让品牌销量翻倍增长!
已成功开通5000+账户
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
SHEIN发布全球循环报告,7 成用户注重性价比
AMZ123获悉,近日,SHEIN 发布2025 年全球循环性报告,调研覆盖21 个国家、约1.5万名用户,系统分析用户购买决策、穿着习惯、衣物处置与循环参与行为,为服装电商的可持续运营、循环服务设计与消费引导提供数据支撑。核心发现如下:一、影响用户购买决策的因素(一)核心决策因素1、性价比是第一决策前提价格是全球用户最统一、最优先的考量项。71.6% 的用户总是将最优价格作为首要考虑,19.2%经常考虑,合计占比高达 90.8%。在 21 个调研市场中,18 个市场将价格列为第一考量,且这些市场中超过 85% 的用户高度关注价格;其中南非、韩国用户价格敏感度最高,近 95% 总是 / 经常关注价格。
26年美国美妆消费者趋势:关税、AI、社媒影响购物决策
AMZ123获悉,随着新技术与平台不断涌现,不同世代美妆消费者的购物行为愈发复杂,不同产品类别对购买决策的影响也存在显著差异。同时,美国近年的关税政策与持续通胀也对市场格局造成影响,使品牌方面临竞争激烈且充满不确定性的环境。因此,Tinuiti发布了《2026年美妆营销研究报告》,从通胀影响到社交媒体趋势全面分析了消费者行为,以更好理解当前美国市场的美妆消费状况。一、市场现状1. 消费者对价格变化的反应数据显示,2025年美国美妆及个护电商市场规模已达到约610亿美元,电商渠道已占据接近一半的市场份额。随着技术进步和平台多样化,美容消费者的购物路径日益复杂。
25年日本家居电商市场达2.56万亿日元,平均单价提升
AMZ123获悉,近日,根据日本经济产业省发布的“2022-2025年电商市场调查”,2025年日本家居电商市场持续扩张,尽管新建住宅数量下降,消费者对线上购物的需求和高价值产品的偏好推动了市场增长。数据显示,近三年来,日本生活杂货、家具、家居类B2C电商市场规模和渗透率均呈稳步上升趋势,从2022年的2.35万亿日元(29.59%),增长至2025年的2.56万亿日元(32.58%%),同比增长3.62%。在商品行业中排名第三,仅次于“图书、视频及音乐软件”(56.45%)和“家用电器、音视频设备、电脑及周边设备等”(43.03%)。
25年全球美妆市场增长10%,AI与社交电商推动增长
AMZ123获悉,近日,根据尼尔森IQ(NielsenIQ)发布的《2026美妆市场报告》,2025年全球美妆市场同比增长10%,其中电商渠道的增速是线下实体店的六倍。对于品牌来说,加快数字化布局已成为赢得美妆市场的关键。从区域表现来看,北美市场增长10%,西欧增长4%,东欧增长8%,拉丁美洲增长14%,非洲和中东增长16%,亚太地区增长14%。这一趋势表明,无论市场成熟度如何,数字化渠道对全球美妆增长的推动作用普遍存在。AI驱动的产品推荐、社交电商以及直播购物正在改变消费者发现和购买产品的路径。超过50%的消费者正在使用AI购物工具,其中49%已经通过生成式AI获得美妆推荐,53%的消费者通过社交平台完成购买。
国产奶瓶刷打入美国母婴圈,在TikTok卖了200多万
给宝宝洗杯子,大概是所有父母最熟悉也最无奈的日常。不同于成人所用的敞口杯,婴幼儿专用杯包含防呛阀门、吸嘴等特殊饮水结构,复杂配件造就的诸多清洁死角,“滋生”的不光有缝隙处的霉菌刺客,更有为人父母对于“哪儿哪儿不干净”的卫生焦虑。近期在TikTok美区,一款能深入各个死角、分区清洁的杯刷工具正是为“绞杀”这番情绪而来,凭借5合1的全能型卖点迅速突围,成为母婴类目的一匹销量黑马。01母婴类目下的“死角克星”数据显示,在TikTok美区母婴用品类目,一款主打5合1的清洁杯刷以2445件的周销量,登上了大类销量榜第2的位置。虽然乍一看这款刷子与常规款无异,但在洗杯子这件事上,它的专业程度却毋庸置疑。
美国Q4电商销售额达3652亿美元,渗透率创新高
AMZ123获悉,近日,根据Digital Commerce 360对美国商务部数据的分析,2025年第四季度,美国电商销售额首次在单个季度突破3500亿美元大关,达到约3650亿美元,比历史数据高出约150亿美元。数据显示,2025年第四季度美国总零售额为1.461万亿美元,同比增长3.6%。其中,线下零售销售增长3%。分析显示,电商在美国零售市场的渗透率创历史新高,占美国总零售总额的25%。若将餐饮服务等零售销售也计入,美国电商占总零售额的比例为16.6%,未经调整的数据显示占比为18.3%。这是自美国商务部 1999年开始追踪在线销售以来,单季度电商渗透率最高的一次。
意大利对Revolut处以1150万欧元罚款
Fin123获悉,近日,意大利反垄断机构对 Revolut 处以 1150 万欧元的罚款。意大利竞争管理局(AGCM)指出,Revolut向客户散布了关于其投资产品的错误信息,同时未能清晰、完整地披露免佣金投资背后的隐性成本与交易限制。此外,意大利方面指出,Revolut在处理用户银行账户时,采用了激进且不透明的操作手法,包括就账户暂停、限制及冻结等事项提供不完整或误导性信息。此次罚款共涉及三项具体处罚:第一,Revolut Securities Europe UAB 与 Revolut Group Holdings Ltd 因投资服务信息披露不足,被罚500万欧元。
年销售额6.7亿美元!25年TikTok Shop美国站美妆标签Top10
AMZ123获悉,近日,根据Charm.io统计,TikTok Shop美国站上10个美妆类标签在过去12个月内创造了超过6.7亿美元的销售额,这些标签不仅描述产品,更直接激发购买行为。2025年超过7000万件美妆产品通过TikTok Shop售出。在TikTok Shop上,标签成为推动消费的基础形式。例如,#skincare护肤标签一年销售额约1.419亿美元,Dr. Melaxin Peel Shot Glow Rice安瓶套装因配方中的水稻提取物与AHA、BHA化学成分,能清理黑头、净化毛孔并防止痘痘,成为#skincare的代表产品。
824个品牌中招?疑WOOT封号名单曝光
AMZ123在此前文章中提到,自3月初起,业内陆续有卖家反映收到亚马逊扫号邮件,而这轮扫号的矛头,大多都指向“WOOT刷单”。随后,卖家圈接连传出小号被封、主账号受牵连、资金被冻结等消息。到了4月,这场风波仍未平息,反而有越查越深的迹象。风声渐紧之下,卖家圈最关心的话题也随之变了——这次到底扫到了谁?就在这样的追问声中,AMZ123了解到,一份疑似与此次WOOT封号潮相关的品牌名单,近日开始在卖家圈流传。从目前流出的截图来看,这份名单共列出824个品牌,PUKAOCK、KUKALY、ITSNGBY、TAOOLP、MYTHSIGHT、HOOROLA、DR.FRESH、CYBERBLAZE等多个品牌名均在其中。
亚马逊再调FBA费用,4月17日起生效!
中东战火延宕至今,仍未有“熄火”之意。当地时间4月2日,特朗普在最新表态中发出警告,称美国将在未来两到三周内对伊朗进行猛烈打击,国际油价应声飙涨。截至当天收盘,5月交货的美国WTI原油价格收于每桶111.54美元,上涨11.41%;6月交货的国际基准布伦特原油价格则收于每桶109.03美元,涨幅高达7.78%。在此背景下,一系列“涨价通知”如同多米诺骨牌,正逐级传导至跨境卖家们的利润表上。全链路合规难题现场答疑,4.17 深圳 | 深圳商务局&行业专家坐镇,落地实操一站获取!点击报名AMZ123了解到,当地时间4月2日,亚马逊美国站发布了一则加征物流相关附加费的通知。
高评分+高销量,10款亚马逊厨房小家电热销产品一览
AMZ123获悉,近日,亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。1. 电热水壶预计销售额:62万美元/月销量:24,200+星级评分:4.5好评数量:47,056+图源:亚马逊产品介绍:这款电热水壶内部无塑料,提升饮用安全性与口感纯净度。产品加热效率较高,可在3分钟内快速烧开一杯水,同时配备自动断电、加热指示灯、防干烧保护功能,保障使用安全。整体外观采用简约设计,宽口壶身与双角度开盖设计便于清洁与加水,精准壶嘴与防烫手柄提升倒水稳定性。
因产品数据质量不佳,印度电商每年损失五百亿卢比
AMZ123获悉,近日,据外媒报道,印度电商与快消行业正因产品数据质量不佳而蒙受巨额损失。据GS1印度公司的最新研究,不一致、不完整或不准确的产品信息每年导致约500亿卢比的资金流失。其中,约200亿卢比表现为毛利率下降,原因包括转化率降低、商品上架受限以及销售速度放缓;另有190亿卢比直接用于退货相关成本,涵盖逆向物流、处理与加工等环节。尤其在时尚服装领域,退货问题更为突出。因尺码不合、款式偏好或实物与描述不符,顾客主动退货率通常占总订单的20%至25%。Unicommerce指出,逆向物流会使订单价值额外增加5%至7%,而这还不含原始运费。放眼全球,时尚与鞋类退货率甚至可达30%至40%。
Tokopedia与TikTok Shop印尼斋月交易量暴涨15倍
AMZ123获悉,近日,Tokopedia与TikTok Shop联合开展的“Ramadan Extra Exciting 2026”活动显示,在伊斯兰教斋月期间,每天天亮前吃sahur(封斋前用餐)的时间段里,平台交易量同比激增15倍。TikTok表示,这一增长主要受到TikTok内容生态的带动,尤其是直播带来的流量转化。在整个斋月期间,共有38亿人次观看了来自卖家及带货创作者的直播内容。从品类表现来看,穆斯林服装成为增长最快的核心品类之一。在TikTok Shop上,该品类交易量较平日增长3倍;与此同时,Tokopedia在斋月大促首日的第一个小时,整体交易量较去年同期活动同样实现3倍增长。
存火灾风险!美国CPSC紧急召回八款插头延长线
AMZ123获悉,近日,美国消费者产品安全委员会(CPSC)发布紧急召回警告,要求消费者立即停止使用“插头延长线”,并已与沃尔玛、eBay和AliExpress等电商平台达成协议,下架相关危险商品。CPSC指出,这类延长线两端均为公头插头,插入电源后裸露插脚可能带电,存在严重触电和火灾风险,因此在任何情况下都不应使用。为防止危险商品继续流入市场,CPSC已推动相关电商平台删除商品链接,同时平台方面承诺将主动识别并下架类似产品。根据CPSC的公告,多家来自中国的卖家和企业涉及销售该类产品,但大多数未回应CPSC关于召回或产品信息的要求。
靠“穿搭”火遍全网,有线耳机在TikTok Shop销量暴涨
重回“顶流”,这个千禧年“赛博配饰”在TikTok爆火
《TikTok Shop突破末次触达归因(LTA)ROAS分析报告》PDF下载
在数字化浪潮中,广告主正面临有效衡量广告支出回报率(ROAS)的挑战。传统未次触达归因(LTA)模型因数据收集难度和归因偏差问题已难以满足广告主的需求,因此,探索新的方法来解决这些问题显得尤为重要。
《未来电商报告:品牌独立站五步升级锁定未来确定性增长》PDF下载
调研显示,出海商家针对家居、时尚及消费电子等品类布局比例均超过30%。独立站凭借其高度品牌化、个性化、场景化及功能性等优势,精准契合上述品类对品牌调性、场景交互及沉浸式体验的核心诉求,正成为商家黑五大促期提升销量、构建品牌竞争壁垒的关键载体。
《TikTok Shop达人真实种草力报告》PDF下载
达人正在将文化内容、社群互动与商业转化深度融合,形成一个高度协同的内容商业生态,其价值早已不再局限于内容带来的直接收入。从更广义的商业视角来看,达人价值的核心在于真实影响力-即其内容对商品与服务产生影响并促成转化所形成的整体商业价值,这一能力正构成达人在内容电商体系中的带货价值基础。
《2026年第2季度儿童时尚品类报告》PDF下载
儿童时尚品类概览 主题选品合辑 巴西站点上新 泰国站点上新 菲律宾站点上新 越南站点上新
《TikTok Shop 2025年度报告》PDF下载
2025年,TikTok Shop进一步加快扩张步伐,在巩固欧美成熟市场的同时,积极开拓新兴市场,先后上线德国、意大利、法国、日本等站点。此举不仅为平台带来新增量,也体现出其多元化市场战略的初步成效,以分散地缘政治风险。
《Shopee2025印尼站点X 汽车摩托品类专题》PDF下载
印尼当地汽车保有量并不高,每一千人的机动车保有量仅96人,未来可提升的空间仍大。空间参照系可以看泰国和马来,2024年泰国汽车保有量为322辆/千人,马来西亚为531辆/千人。
《2026年Shopee运动户外类目自行车爆品分享》PDF下载
巴西骑行爱好群体广泛,但平台上热销品呈现出的国际大牌极少,推测可能原因是国际品牌可能主要通过线下经销或自行渠道销售,未深度参与Shopee等本土电商。因此巴西用户在平台上几乎接触不到这些高端品牌产品。平台上巴西用户更倾向购买本土品牌的自行车,可能出于价格实惠和售后便利考虑。
《2025年TikTok生态发展白皮书》PDF下载
2025年,全球内容电商迈入深度跃迁的新周期。TikTokShop正以前所未有的速度拓展市场版图,完成从高速增长向高质量增长的跃迁。在这一进程中,生态结构重构、参与者多元化、全球政策协同等因素叠加,构成内容电商演进的核心变量。
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
AMZ123卖家导航
这个人很懒,还没有自我介绍
AMZ123选品观察员
选品推荐及选品技巧分享。
跨境学院
跨境电商大小事,尽在跨境学院。
首页
跨境头条
文章详情
Chance AI 走红北美年轻用户,重构人与AI交互方式
霞光社
2026-03-31 21:29
159

“夏日午后,休息时凝视远山或树枝,直到 ‘灵韵降临’,人与景物产生一种神秘共鸣。”


德国哲学家本雅明在代表作《机械复制时代的艺术作品》中,如是形容这种独一无二、物我两忘的审美体验。这是一种难以复刻的独特感受,与AI支配下泥沙俱下、批量生产的虚幻景观大相径庭。

人类如芦苇般孱弱,却因思想而拥有尊严。我们可以听见声音、接收画面、有身体的触感,也可以知道空间感的放大缩小、呼吸的节律,以及细默之处未曾言明的情感表达。这些细腻幽微的情绪,是人类最难以被模拟与替代的部分。

“Technology is an extension of life.(技术是生命的一种延伸)”。凯文凯利在《科技想要什么》一书中曾表达过同样的观点,如果人类与 AI 发展的终极理想,是实现人与技术的共生共舞,让人工智能真正拥有接近人的思考、生命力与表达力,那么一个不容忽视的现实是:时至今日,人与 AI 最主流的交互方式,依然停留在文字层面。

这也成为人机协同路上一道难以绕开的障碍 —— 我们大量的所见、所思、所感,仍无法与 AI 实现真正的身临其境。譬如一位痴迷奇石、对石头怀有极致热爱的人,若想将他眼中万千石头的肌理、气韵与特质传递给 AI,单纯的文字描述远不足够。一个集图像、视觉、声音于一体的 “石头数字馆”,才能真正支撑他与 AI 并肩鉴赏、共情共鸣。

那么,什么才是对于用户来说更自然、更具有粘性的交互方式?

过去半年,一款名为Chance AI的app快速在纽约大学(NYU)、南加州大学(USC)等北美校园风靡,学生们用Chance AI看穿搭、逛展览、比较球鞋和卡牌、记录皮肤状态、观察植物与宠物,甚至看图写诗。其独特性在于,Chance AI 提出了一个新的产品形态,即Visual Agent:在视觉之上建立解释层,让AI不仅看到事物,更参与解释其意义,进而帮助用户形成判断与品味。

在Chance AI看来,视觉不是输入方式,而是人类的认知系统。“对人类来说,视觉才是最直觉的操作系统,而不是输入框。”Chance AI创始人兼CEO曾熙告诉霞光社,“从第一天开始做产品,我们的首页就是没有任何输入框的。在我们的产品里面唯一的输入框就是出现在评论区,但是现在更多人是用语音,点开只有一个拍照按键,进来以后用户不用输入prompt,one tap,因为这才是人类最直觉的方式。”

使用方式也很简单,只需要通过Chance AI拍摄任何图片,Chance AI就会快速将图片内容转为对于图片深层次含义的解读。每一个图片都不只限于“阅读”,更多在于“理解”,即在认识的基础上解释看见事物的意义;

此外,Chance AI也有Live模式,即实时视觉交互系统(Real-time Visual Intelligence System),在Live模式中,用户可以一边看,一边与Chance AI交流,它还会做出对于画面的实时视觉理解(Real-time perception)以及连续推理(Continuous reasoning,而非单次响应)。

巴塞尔艺术周现场,观众使用Chance AI「Visual Agent – Live」,在观看作品的过程中与AI实时交流与理解

Chance AI的交互方式,打破了过去两年间,AI通过输入框提问、随后获得答案的主流形态。曾熙向霞光社表示,产品设计的差异源自年轻人认识世界的底层逻辑不同,对从小使用emoji、meme和缩写沟通的Gen Z来说,他们本身就是visual native:更习惯通过图像和直觉理解世界,而不是先组织语言再提问。也就是说,越来越多的年轻人对于现实世界的认知方式是从“先提问再理解” 转变为“先看见再理解”。

对图像的精准理解离不开Chance AI的技术突破。MMMMU-Pro 是目前最严苛的多模态基准测试之一,它通过过滤纯文本可解题、增加选项干扰,并将问题嵌入图像中,真正考察 AI 是否具备人类级别的视觉理解与跨学科推理能力,而非依赖模式匹配或文字捷径。Chance AI Visual Agent 在 MMMU 相关评测中以 86.07% 的准确率位列世界第一,在艺术理解、结构分析与跨语境解释等任务上表现优秀,甚至超越了人类在2024年的成绩。

实际操作上也可见Chance AI的出色表现,如下图所示,为一块坐标于洛杉矶的市中心的石头,在Chance AI的“看见”里,不只有关于石头的来历故事——即一位艺术家把这个石头从内华达州搬过来花了1300万美金,还有这一故事背后的意义:这场搬运是为了体现美国的种族和阶级对立的问题。

更重要的是,Chance AI真正意义上做到了千人千面地帮助人理解世界。在Chance AI,每个人的页面都是个性化的,因为不同人看见、感受的世界存在差异。而在Chance AI已经布局的不同国家/地区,用户之间的差异化也能反馈出地区的特性,这是Chance AI的独特价值——勾勒用户眼中的世界

在效率工具泛滥的当下,Chance AI的魅力在于,当用户以主动探索的方式理解事物,他会逐渐形成自己的判断:什么是好的,什么是有价值的。也正因此,人们在使用AI过程中常出现的顾虑,如是否会面对更为千篇一律的AI流水线产品、AI是否会让人丧失思考的能力,似乎不再需要犹疑。个性化的反馈、对事物更深的理解,都能让用户开始重新激发好奇心——那些曾经习以为常的东西,会再次变得值得被解读。

一些北美高校学生们表示,“有时候我不是想问什么,我只是想看看它会怎么看。”“I started noticing things I used to ignore”,这或许也符合了Chance AI对于年轻一代认知世界的判断:“视觉让理解更直接,也让好奇心重新成为驱动力。用眼睛理解世界,正在成为一种新的基础行为。”而这一“主动探索”的体验感,形成了用户与Chance AI的持续使用粘性。

事实上,人类对现实的认知,往往始于视觉,先看见,再感受,然后逐渐形成判断。“visual reasoning是帮助你找到它的Perception跟knowledge,然后再加上connection就是它的社会共识,这样组成了今天的产品形态。”曾熙告诉霞光社。

与此同时,行业层面也展现出了年轻用户倾向于使用视觉交互的趋势:其一是,多模态交互(Lens / Circle to Search / AI Overviews)在年轻用户中的增长最快;其二,Google Lens每月产生超过三十五亿次级视觉搜索请求。

截至目前,Chance AI的全球年轻用户已突破20万,在iOS欧美多个国家进入下载榜Top 3,并在Product Hunt上两次获得当日最佳产品(Product of the Day)。在刚刚过去的香港Art Central艺术展上,Chance AI也作为官方创新合作伙伴,深度融入观众的观展体验,这一能力也首次得到了真实场景的验证。

面向未来的可能性,曾熙表示,手机拍照分享目前是图片数据来源最直接、量最大的场景。“现在我们的数据是,每个北美的女生每天会拍2.8次的穿搭,这是非常海量的数据。”而视觉数据本身就创造了价值,“我们想把Visual Agent engine这‘发动机’给搭好,以后我们会有更丰富的数据,会形成视觉的社区,这就是最大的价值。”

曾熙早年在 University of Barcelona 获得博士学位,研究方向集中在认知科学与当代艺术,关注人类如何通过视觉理解世界、形成判断与意义。 随后,他先后在 OnePlus、OPPO 负责产品与设计,并参与构建面向数亿用户的硬件定义与系统体验。 在ByteDance期间,他在Flow担任产品与设计高级总监,参与AI相关产品从0到1的探索(豆包)体系的早期构建。豆包代表了这一代 AI 产品的典型形态:以对话为核心入口。

这段经历让他意识到一个结构性问题:当前AI已经非常擅长“生成语言”和“回答问题”(尤其是大厂的必争之地,因为离LLM很近),但对于人类如何在现实世界中形成理解,尤其是基于视觉的直觉判断——仍然缺乏支持。因为这直接决定了,每一个事物的“意义”。

在他看来,这不是一个功能缺失,而是一个交互范式的空白:AI已经很会“说”,但还不够会“看”。Chance AI正是在这个判断下诞生:如果AI的下一阶段不只是回答问题,而是参与人类理解世界的过程,那么视觉能力可能会成为新的入口。他正在为了下一个时代的AI终端做准备。

我们处在一个科技大发展的时代,无数高速迭代的科技产品快速出现、又快速成为旧闻,科技已经包围、席卷了人的工作与生活。对科技产品的赞叹和恐惧,交织在一起,成为现代人普遍的心理情结。

而在每一场技术的变迁中,一个有趣的现象是:如何落地从来不是由发明者决定的,而是由用户和它如何交互决定。比如作为通信工具的手机,最终演变成了触屏的交互方式,才能变为用户日日、时时无法离身的“肉体外挂”。

AI时代的交互或许也是无处不在的。在谈及“Chance”这一名称的由来时,曾熙表示,这个名字源于他对当下生活方式的一种观察。在高度算法化的环境中,人们越来越习惯沿着被推荐的路径前行,日常经验变得可预测且重复,而真正具有启发性的时刻,往往来自那些未被预设的“偶然”。

咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部