AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

为什么AI的创造力被困在文字?

671
2025-12-23 08:59
2025-12-23 08:59
671

TikTok Shop东南亚开年峰会重磅开启,立即了解


AI 的未来不在聊天框里,而在界面生成器里



文字不是唯一


ChatGPT 自诞生以来已成为史上最快速度突破1亿用户的产品,更重要的是,它为世界带来了一个深刻的影响:AI 终于以一种人人都能理解的方式来到大众生活。


然而,这款现象级产品同时也带来了一个叙事陷阱。让很多人误以为,AI 最好的输出形态是文字。


输入一段文字,得到一段文字结果。这样的交互看似简单、自然,却把丰富的背景信息全部压缩成线性结构:无法展示结构、状态、也无法多步骤协作。


比如一个观鸟爱好者,想了解全年的鸟类迁徙图,但得到的结果是一段文字摘要,一以用户想自驾云南,只得到文字版的推荐清单,但最好的呈现应该是图文并茂的路线规划、地图展示和天气叠加,


不是 ChatBot 这种交互模式有错。而是聊天框本身只能输出文字是有问题的。


人的大脑天生是多模态的,可以接收视觉、语音、手势、眼动、触觉、感知空间,但强如 AI,现在也只能给我们一段文字结果?


AI 输出的结果还有更多的可能性吗?


Anthropic 的 CEO Dario Amodei 两个月前在一次公开对谈中说:AI 这么先进的技术,现在的交互模态有像1970年代一样。他毫不留情地指出,以文本为中心的交互范式,本质上是一种「工业时代的媒介惯性」。


李开复在一次访谈时也表达过类似担忧。他说,人类现在误以为 AI 的能力只有「解释世界」。新一代 AI 产品的突破点不会再出现在模型层,而多会出现在「能让模型行动起来」的界面层。


简而言之,做到输出即交付结果,而不是输出只呈现文字解释。


那什么是用户能接受到的更自然、更高效、更沉浸的交付方式?


业内有三个重要的趋势判断:


1、AI 入口从「文字」走向「多模态」


今年的 CHI、NeurIPS、CVPR 上,多模态论文数量首次超过单模态模型。硅谷各大公司也在探索如何让视觉、语音、环境理解成为 AI 的主交互方式,而不是补充。如输出的结果可以是视频、音频、更结构化的图片。


2、从「被动问答」转向「意图驱动」


意图驱动是今年下半年在业内被讨论最多的话题。什么叫意图驱动?简单说,用户只要说想干嘛,AI 帮你实现。在整个过程中,用户也不需要思考用什么软件,调用什么工具,如何完成,只需要说出意图。


也就是说,把 AI 当成一个真正帮你办事的助手。


3、「交互」必须具备可操作性


AI 闹今年采访过的许多工程师都曾提出一个观点:随着 Vibe Coding 成本下降,为什么 AI 只能给用户生成文字答案,而不能生成一个可以用的工具? 


今年10 月我们采访的前亚马逊科学家Raphael Shu 也说过,文本是最低效的表达方式,「你不会让一个懂编程的员工用写长段文字解释他的工作,而是让他直接去写程序、构建模块、运行任务。」前AWS科学家让 Agent 学会彼此合作、竞争甚至争吵|和OpenAgents创始人 Raphael Shu 聊群体智能


AI 也理应直接帮我们生成一个小应用。


从文字到多模态


这三条趋势放在一起会发现行业正靠近同一个方向:AI 的交互形态正从「文本问答系统」走向「可操作」的界面生成器。


蚂蚁集团最近推出的灵光 App 就是在交互模式上作出了一些创新。


表面看这款产品还是 ChatBot 形态——大众最容易理解——但输出的结果不再是单一文字。


第一种是交付「结构化内容」,不仅是图文,还有卡片面板、3D 模型、多步骤流程图、动态信息结构、可视化分析。


图片


第二种是交付可互动、修改、分享的应用小工具。具体功能点是一句话手搓小程序的闪应用,以及内置 AGI 相机,能看图说话的开眼功能。


换句话说:ChatBot 的本质不变,但「交付方式」正在被重新定义:过去只能提供文字信息,现在提供的是一个「可执行的界面」与「可复用的工具」。


我们认为,这代表了业内最新的工程思考:有别于把产品界面当静态容器,灵光开始意识到界面是模型的「可生成空间」。


这样的交互也直接扩张了 ChatBot 的能力边界:从语言模型变成了结果模型,又进化成了工具生成器。


更通俗点一点解释,灵光打破 ChatBot 给用户强烈的「聊天感」,在交互上的小小创新让用户意识到,AI 产品可以是自己的工作台。


个体的创造力一下溢出了技术的边界。


根据灵光统计,上线以来,用户已经创建出330万个「闪应用」,大多是生活工具,为孩子搓的英语背单词工具,浇花定时提醒器;摸鱼减压小游戏、赛博朋克风小提琴节拍器,小吃盲盒点菜器……甚至有灵光用户脑洞大开,创建属于自己的支付宝、微信、滴滴打车。


图片


那些长尾的、细碎的、高度个性化需求,第一次被用户创造出来,这在移动互联网时代是完全不可能的。


当然,新产品灵光仍是还在进化的阶段性样本,但它已完成了更关键的一步:通过交互创新,让大众意识到,文字不是 AI 的全部,AI 还有更多丰富的玩法、有更优美的信息质感以及更多可能性。


「人」是自我的创造者


技术发展有一个很有趣的现象:如何落地从来不是由发明者决定的,而是由用户和它如何交互决定。


150年前,爱迪生发明留声机时,把它设想成「办公录音工具」和「学术记录工具」—有点像今天的 DIngtalk。直到六十岁时他才肯承认——流行音乐才是留声机的真正用途。大部分年轻人买留声机是为了听音乐,留声机同时推动了唱片行业的繁荣。


手机亦然,它原本是通信工具,但乔布斯把相机、电视机、音乐播放器「偏执」地装到一个终端,用了触摸屏这种交互模式,手机才成为我们思考、决策、接受信息的界面。


如今在行业最新的讨论是,无论是爱迪生的留声机还是乔布斯的手机,都已经不适合承载 AI 了,当 AI 的能力已远超过去,就不该继续沿用工业时代遗留下来的交互范式:屏幕、键盘、通知栏、输入框。


图片


更极端点说,现在我们习惯的所有交互都不是为AI 而生的,而是互联网而生的。


不要把 AI 禁锢在笼子里。


一个创业者曾和我们聊到,他认为未来 AI 的交互应该是无处不在的:「在今天注意力就是一切的时代,用户根本不需要关心后面的工具调用是怎么做的。就应该直接表达意图,然后产品组成一个完美适配的界面,且用合适的呈现方式,多余的东西一点都不该有。用户怎么方便怎么来。」


AI 可以是手机,可以是眼镜,可以是相机,也可以是网页,者是任何新的新媒介。用户表达意图,AI 自动调用资源与工具,并且自行判断以什么方式交付给你:


我们在路边看到一朵花,拍照本身就代表意图,结果以识别卡片呈现。


我们抱怨减肥难,就应该直接生成可以行动的工具,而不是一段文字。


即便是查旅行攻略如此简单常见的需求,也不该只是一串文字,我们对一个地方的感兴趣触发点往往是一张绝美的风景图,或者一段精彩的旅行视频。


未来的可能性还包括:


走在陌生的城市街区,不用打开地图,停下来的一瞬间,AI 已经帮你指明方向;


在商场扫过一件衣服,还在犹豫,AI 立刻呈现「3D 试穿效果」以及家中有什么单品可以配搭;


开会或者学习时,稍许皱眉,AI 就立刻帮你生成一套通俗易懂的脑图,并配合案例讲解。


这些预测和想象指向同一个逻辑:AI 的价值不在于技术炫技,而在于当用户表达一个微弱意图时,产品能以最适合的交互方式响应。


图片


这也正是灵光展现出的产品哲学——并不急于堆砌更多能力,而是克制地探索,希望每一个功能点,随着时间推移都能发挥更高的用户价值。


从这个角度看,2025年的灵光更像是一个小而美的新尝试。它所完成的探索意义明确:既然 AI 已能理解图像、声音与文字,那么我们表达意图的方式也可以是拍一张照片、说一句话,而产品给用户的交付也不止于一次文字作答而是一种交付。


把交付链路尽可能压缩,让交付结果尽可能丰富。从单一文本扩展为界面、结构与工具。


当交互方式一次次被拓宽,人的创造力也会换一种形态涌现:人不再只是提问者,人可以是自我生活的创造者。

3.12 厦门coupang-文章页底部图片
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
美国农业部下调2025年农业收入预期,疲软态势将持续至2026年
美国农业部最新的农业收入预测强化了美国农业面临的艰难现实。
商店页面评分对投放影响
Google Play 页面评分,为什么很重要?很多团队把 Google Play 的评分当成“面子工程”:
Shopee发布紧急通知提醒;越南电商订单剧增,快递不堪重负;金华2025年进出口额首超万亿元
01 Shopee发布紧急通知提醒据外媒消息,面对猖獗的高科技诈骗,Shopee 正式发布紧急警告,提醒用户注意安全“红线”。第一条警告直接针对虚假信息和电子邮件的复杂程度。诈骗分子现在经常冒充 Shopee 发送拼写错误的通知、索取个人信息或提供诱人的工作机会。为了避免落入此类陷阱,用户必须记住,所有合法通知只会出现在 Shopee 应用或经过验证的社交媒体账户(带有蓝色勾号的账户)上。一条黄金法则是:绝对不要点击任何来路不明的链接或下载任何来自未知来源的附件,并立即向客服举报任何异常活动。关于账户安全,Shopee 特别强调了“重置密码”链接的风险。
长江和记:警告马士基
围绕巴拿马运河两端关键集装箱码头的运营权争议持续发酵。2月12日,长江和记实业发布最新声明称,已依据投资保护条约向巴拿马共和国正式发出争端通知并邀请磋商,同时警告马士基旗下APM Terminals(APMT),未经同意接管相关港口将引发法律行动。长和强调,两座码头能否持续运营,“完全取决于巴拿马最高法院和巴拿马政府的行动”,已不在公司控制范围之内。长江和记12日的一份声明称,其正在采取进一步措施,以保障其在这两处巴拿马港口的“权益”。声明称,和记港口集团有限公司已通知马士基航运集团,在未经长江和记同意下,任何由马士基航运集团或其任何联属公司,在任何时期、以任何方式接管这两处港口的管理或运营,将引发“法律行动”。
靠一个睡袋,一年卖出3300万美金?从母婴爆品到品牌闭环,它做对了什么?
Kyte Baby的案例说明,真正有生命力的品牌,并不是靠概念创新突围,而是通过对真实需求的理解建立连接。
《非洲B2C电商与支付2026》报告:即时支付与移动基础设施驱动万亿美元数字商业新时代
最新报告显示非洲电商规模将于2033年突破万亿美元,即时支付与移动金融成为核心驱动力,智能手机普及和数字基础设施升级正重塑大陆商业格局。随着移动互联网、金融科技与即时支付体系的快速发展,非洲数字商业正在进入结构性扩张阶段。最新发布的《Africa B2C E-Commerce & Payments 2026》报告指出,非洲电商与数字支付生态正在经历深刻转型,移动优先与实时支付正成为推动市场增长的关键力量。非洲电商迈向万亿美元规模报告预测,非洲电子商务市场规模将从 2024年的3170亿美元增长至2033年超过1万亿美元,进入长期结构性增长阶段。
美国农业部下调2025年农业收入预期,疲软态势将持续至2026年
美国农业部最新的农业收入预测强化了美国农业面临的艰难现实。
《中企出海美国季度研究报告》PDF下载
近年来,随着全球化进程的深化与中国经济实力的持续提升,越来越多的中国企业将目光投向海外市场。美国作为全球最大经济体创新高地和消费市场,始终是中企出海战略中的关键目标。从制造业到科技领域,从消费品到金融服务,中国企业的国际化步伐不断加快,既彰显了“中国智造”的全球竞争力,也面临复杂的政策环境、文化差异与市场竞争等挑战。
《跨境蓝海拉美市场洞察 - 墨西哥篇》PDF下载
墨西哥位于北美大陆南部,北邻美国,政局稳定,法律健全,是拉丁美洲地区第一贸易大国和重要的外国直接投资目的地。墨西哥拥有 1.28亿人口,是仅次于巴西的拉美第二大经济体,同时也是拉美第三大线上零售市场,无论是互联网的普及率还是使用率在拉美市场都处于佼佼者。
《东南亚出海合规实操指南手册》PDF下载
近年来,东南亚电商市场以迅猛的增长态势成为全球贸易的新蓝海,印尼马来西亚、新加坡等六国凭借庞大的人口基数、持续提升的互联网渗透率吸引着无数中国卖家前来布局。
《2025中国新能源汽车产业链出海洞察报告 - 匈牙利篇》PDF下载
中国汽车市场新能源汽车渗透率已达50%,各主机厂纷纷开启价格战,让利消费者,并承担相应的利润损失,在中国新能源汽车市场逐渐成为红海的的大背景下,海逐渐成为各主机厂主动或被动的选择。
《2024哥伦比亚电商市场概览报告》PDF下载
哥伦比亚位于南美洲西北部,是拉丁美洲第三大国家,北部是加勒比海,东部与委内瑞拉接壤,东南方是巴西,南方是秘鲁和厄瓜多尔,西部是巴拿马和太平洋。

《2026独立站卖家日历》PDF下载
2026 独立站卖家日历 2026 全年营销节奏
《2025中东北非消费者数字经济报告》PDF下载
2025年的报告不仅持续跟踪数字经济的同比增长,也更深入:我们探讨了新兴技术对下一波数字化转型的影响力,还首次将中东北非国家及地区的消费者行为偏好与全球其他市场进行对比。
《2025年终大促旺季AI消费趋势报告》PDF下载
随着人工智能 AI的爆发式增长,如 ChatGPT、Perplexity 和Llama等交互式聊天机器人正在渐渐成为大众研究和推荐的首选工具。根据 AI智能体功能的更新迭代,目前已经可以完成网购下单、预订服务、及交易支付,现已被统称为 AI智能体电商Agentic Commerce,且其采用率正呈现出滚雪球式的增长。
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
跨境学院
跨境电商大小事,尽在跨境学院。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
AMZ123卖家导航
这个人很懒,还没有自我介绍
侃侃跨境那些事儿
不侃废话,挣钱要紧!
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
首页
跨境头条
文章详情
为什么AI的创造力被困在文字?
36氪出海
2025-12-23 08:59
671


AI 的未来不在聊天框里,而在界面生成器里



文字不是唯一


ChatGPT 自诞生以来已成为史上最快速度突破1亿用户的产品,更重要的是,它为世界带来了一个深刻的影响:AI 终于以一种人人都能理解的方式来到大众生活。


然而,这款现象级产品同时也带来了一个叙事陷阱。让很多人误以为,AI 最好的输出形态是文字。


输入一段文字,得到一段文字结果。这样的交互看似简单、自然,却把丰富的背景信息全部压缩成线性结构:无法展示结构、状态、也无法多步骤协作。


比如一个观鸟爱好者,想了解全年的鸟类迁徙图,但得到的结果是一段文字摘要,一以用户想自驾云南,只得到文字版的推荐清单,但最好的呈现应该是图文并茂的路线规划、地图展示和天气叠加,


不是 ChatBot 这种交互模式有错。而是聊天框本身只能输出文字是有问题的。


人的大脑天生是多模态的,可以接收视觉、语音、手势、眼动、触觉、感知空间,但强如 AI,现在也只能给我们一段文字结果?


AI 输出的结果还有更多的可能性吗?


Anthropic 的 CEO Dario Amodei 两个月前在一次公开对谈中说:AI 这么先进的技术,现在的交互模态有像1970年代一样。他毫不留情地指出,以文本为中心的交互范式,本质上是一种「工业时代的媒介惯性」。


李开复在一次访谈时也表达过类似担忧。他说,人类现在误以为 AI 的能力只有「解释世界」。新一代 AI 产品的突破点不会再出现在模型层,而多会出现在「能让模型行动起来」的界面层。


简而言之,做到输出即交付结果,而不是输出只呈现文字解释。


那什么是用户能接受到的更自然、更高效、更沉浸的交付方式?


业内有三个重要的趋势判断:


1、AI 入口从「文字」走向「多模态」


今年的 CHI、NeurIPS、CVPR 上,多模态论文数量首次超过单模态模型。硅谷各大公司也在探索如何让视觉、语音、环境理解成为 AI 的主交互方式,而不是补充。如输出的结果可以是视频、音频、更结构化的图片。


2、从「被动问答」转向「意图驱动」


意图驱动是今年下半年在业内被讨论最多的话题。什么叫意图驱动?简单说,用户只要说想干嘛,AI 帮你实现。在整个过程中,用户也不需要思考用什么软件,调用什么工具,如何完成,只需要说出意图。


也就是说,把 AI 当成一个真正帮你办事的助手。


3、「交互」必须具备可操作性


AI 闹今年采访过的许多工程师都曾提出一个观点:随着 Vibe Coding 成本下降,为什么 AI 只能给用户生成文字答案,而不能生成一个可以用的工具? 


今年10 月我们采访的前亚马逊科学家Raphael Shu 也说过,文本是最低效的表达方式,「你不会让一个懂编程的员工用写长段文字解释他的工作,而是让他直接去写程序、构建模块、运行任务。」前AWS科学家让 Agent 学会彼此合作、竞争甚至争吵|和OpenAgents创始人 Raphael Shu 聊群体智能


AI 也理应直接帮我们生成一个小应用。


从文字到多模态


这三条趋势放在一起会发现行业正靠近同一个方向:AI 的交互形态正从「文本问答系统」走向「可操作」的界面生成器。


蚂蚁集团最近推出的灵光 App 就是在交互模式上作出了一些创新。


表面看这款产品还是 ChatBot 形态——大众最容易理解——但输出的结果不再是单一文字。


第一种是交付「结构化内容」,不仅是图文,还有卡片面板、3D 模型、多步骤流程图、动态信息结构、可视化分析。


图片


第二种是交付可互动、修改、分享的应用小工具。具体功能点是一句话手搓小程序的闪应用,以及内置 AGI 相机,能看图说话的开眼功能。


换句话说:ChatBot 的本质不变,但「交付方式」正在被重新定义:过去只能提供文字信息,现在提供的是一个「可执行的界面」与「可复用的工具」。


我们认为,这代表了业内最新的工程思考:有别于把产品界面当静态容器,灵光开始意识到界面是模型的「可生成空间」。


这样的交互也直接扩张了 ChatBot 的能力边界:从语言模型变成了结果模型,又进化成了工具生成器。


更通俗点一点解释,灵光打破 ChatBot 给用户强烈的「聊天感」,在交互上的小小创新让用户意识到,AI 产品可以是自己的工作台。


个体的创造力一下溢出了技术的边界。


根据灵光统计,上线以来,用户已经创建出330万个「闪应用」,大多是生活工具,为孩子搓的英语背单词工具,浇花定时提醒器;摸鱼减压小游戏、赛博朋克风小提琴节拍器,小吃盲盒点菜器……甚至有灵光用户脑洞大开,创建属于自己的支付宝、微信、滴滴打车。


图片


那些长尾的、细碎的、高度个性化需求,第一次被用户创造出来,这在移动互联网时代是完全不可能的。


当然,新产品灵光仍是还在进化的阶段性样本,但它已完成了更关键的一步:通过交互创新,让大众意识到,文字不是 AI 的全部,AI 还有更多丰富的玩法、有更优美的信息质感以及更多可能性。


「人」是自我的创造者


技术发展有一个很有趣的现象:如何落地从来不是由发明者决定的,而是由用户和它如何交互决定。


150年前,爱迪生发明留声机时,把它设想成「办公录音工具」和「学术记录工具」—有点像今天的 DIngtalk。直到六十岁时他才肯承认——流行音乐才是留声机的真正用途。大部分年轻人买留声机是为了听音乐,留声机同时推动了唱片行业的繁荣。


手机亦然,它原本是通信工具,但乔布斯把相机、电视机、音乐播放器「偏执」地装到一个终端,用了触摸屏这种交互模式,手机才成为我们思考、决策、接受信息的界面。


如今在行业最新的讨论是,无论是爱迪生的留声机还是乔布斯的手机,都已经不适合承载 AI 了,当 AI 的能力已远超过去,就不该继续沿用工业时代遗留下来的交互范式:屏幕、键盘、通知栏、输入框。


图片


更极端点说,现在我们习惯的所有交互都不是为AI 而生的,而是互联网而生的。


不要把 AI 禁锢在笼子里。


一个创业者曾和我们聊到,他认为未来 AI 的交互应该是无处不在的:「在今天注意力就是一切的时代,用户根本不需要关心后面的工具调用是怎么做的。就应该直接表达意图,然后产品组成一个完美适配的界面,且用合适的呈现方式,多余的东西一点都不该有。用户怎么方便怎么来。」


AI 可以是手机,可以是眼镜,可以是相机,也可以是网页,者是任何新的新媒介。用户表达意图,AI 自动调用资源与工具,并且自行判断以什么方式交付给你:


我们在路边看到一朵花,拍照本身就代表意图,结果以识别卡片呈现。


我们抱怨减肥难,就应该直接生成可以行动的工具,而不是一段文字。


即便是查旅行攻略如此简单常见的需求,也不该只是一串文字,我们对一个地方的感兴趣触发点往往是一张绝美的风景图,或者一段精彩的旅行视频。


未来的可能性还包括:


走在陌生的城市街区,不用打开地图,停下来的一瞬间,AI 已经帮你指明方向;


在商场扫过一件衣服,还在犹豫,AI 立刻呈现「3D 试穿效果」以及家中有什么单品可以配搭;


开会或者学习时,稍许皱眉,AI 就立刻帮你生成一套通俗易懂的脑图,并配合案例讲解。


这些预测和想象指向同一个逻辑:AI 的价值不在于技术炫技,而在于当用户表达一个微弱意图时,产品能以最适合的交互方式响应。


图片


这也正是灵光展现出的产品哲学——并不急于堆砌更多能力,而是克制地探索,希望每一个功能点,随着时间推移都能发挥更高的用户价值。


从这个角度看,2025年的灵光更像是一个小而美的新尝试。它所完成的探索意义明确:既然 AI 已能理解图像、声音与文字,那么我们表达意图的方式也可以是拍一张照片、说一句话,而产品给用户的交付也不止于一次文字作答而是一种交付。


把交付链路尽可能压缩,让交付结果尽可能丰富。从单一文本扩展为界面、结构与工具。


当交互方式一次次被拓宽,人的创造力也会换一种形态涌现:人不再只是提问者,人可以是自我生活的创造者。

咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部