AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

遥遥领先的OpenAI慢下来了

1435
2024-05-14 22:01
2024-05-14 22:01
1435

423亿

“如果发布的是 GPT-5,那 OpenAI 依然遥遥领先。如果是 AI Search 或者是语音助手,那就说明 OpenAI 没落了。”

一位 AI 大模型从业者告诉虎嗅,业内对 OpenAI 的期待太高,除非是 GPT-5 这样的颠覆式创新,否则很难满足观众的“胃口”。

虽然 Sam Altman 在 OpenAI 线上直播前,已经预告不会发布 GPT-5(或 GPT-4.5),但外界对 OpenAI 的期待早已是九牛拉不转了。

北京时间 5 月 14 日凌晨,OpenAI 公布了最新的 GPT-4o,o 代表 Omnimodel(全能模型)。20 多分钟的演示直播,展示了远超当前所有语音助手的 AI 交互体验,与外媒此前透露的消息基本重合。

虽然 GPT-4o 的演示效果仍可称得上“炸裂”,但业内人士普遍认为很难配得上 Altman 预告中的“魔法”二字。很多人认为,这些功能性的产品,都是“偏离 OpenAI 使命”的。

OpenAI 的 PR 团队似乎也预料到了这种舆论走向。发布会现场以及会后 Altman 发布的博客中对此解释道:

“我们使命的一个关键部分是将非常强大的人工智能工具免费(或以优惠的价格)提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型,没有广告或类似的东西。 

当我们创办 OpenAI 时,我们最初的想法是我们要创造人工智能并利用它为世界创造各种利益。相反,现在看起来我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,让我们所有人都受益。”

遥遥领先的 GPT-4o

“如果我们必须等待 5 秒钟才能得到‘每个’回复,用户体验就会一落千丈。即使合成音频本身听起来很真实,它也会破坏沉浸感,让人感觉毫无生气。”

在 OpenAI 发布会前夕,英伟达 Embodied AI 负责人 Jim Fan 在 X 上预测了 OpenAI 会发布的语音助手,并提出:

几乎所有的语音 AI 都会经历三个阶段:

1. 语音识别或“ASR”:音频->文本1,例如 Whisper;

2. 计划下一步要说什么的 LLM:text1 -> text2;

3. 语音合成或“TTS”:text2 ->音频,例如 ElevenLabs 或 VALL-E。

经历 3 个阶段会导致巨大的延迟。

GPT-4o 在响应速度方面,几乎解决了延迟问题。GPT-4o 的响应音频输入的最短时长为 232 毫秒,平均响应时长 320 毫秒,几乎与人类相似。没有使用 GPT-4o 的 ChatGPT 语音对话功能平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒(GPT-4)。

GPT-4o 不仅通过缩短延迟极大地提升了体验,还在 GPT-4 的基础上做了很多升级包括:

1、极佳的多模态交互能力,包括语音、视频,以及屏幕共享。

2、可以实时识别和理解人类的表情,文字,以及数学公式。

3、交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌。

4、超低延时,且可以在对话中实时打断 AI,增加信息或开启新话题。

5、所有 ChatGPT 用户均可免费使用(有使用上限)。

6、速度是 GPT-4 Turbo 的 2 倍,API 成本低 50%,速率限制高 5 倍。

“没落”的 OpenAI

“这些局限性的突破都是创新。”

有业内专家认为,GPT-4o 的多模态能力只是“看起来”很好,实际上 OpenAI 并未展示对于视觉多模态来说真正算是“突破”的功能。

这里我们按大模型行业的习惯,对比一下隔壁厂 Anthropic 的 Claude 3。

Claude 3 的技术文档中提到,“虽然 Claude 的图像理解能力是尖端的,但需要注意一些局限性”。

其中包括:

1、人物识别:Claude 不能用于在图像中识别(即姓名)人物,并将拒绝这样做。

2、准确性:Claude 在解释 200 像素以下的低质量、旋转或非常小的图像时,可能会产生幻觉或犯错误。

3、空间推理:克劳德的空间推理能力有限。它可能很难完成需要精确定位或布局的任务,例如读取模拟钟面或描述棋子的确切位置。

4、计数:Claude 可以给出图像中物体的近似计数,但可能并不总是精确准确的,特别是对于大量小物体。

5、AI 生成的图像:Claude 不知道图像是否是人工智能生成的,如果被问到,可能不正确。不要依赖它来检测假图像或合成图像。

6、不适当的内容:Claude 不会处理违反我们可接受使用政策的不适当或露骨的图像。

7、医疗保健应用:虽然 Claude 可以分析一般医学图像,但它不是为解释 CT 或 MRI 等复杂诊断扫描而设计的。Claude 的输出不应被视为专业医疗建议或诊断的替代品。

在 GPT-4o 网站发布的案例中,有一些与“空间推理”有相关的能力,但仍难算得上突破。

此外,从发布会现场演示中 GPT-4o 输出的内容很容易看出,其模型能力与 GPT-4 相差并不大。

GPT-4o 跑分

虽然模型可以在对话中增加语气,甚至即兴演唱,但对话内容还是与 GPT-4 一样缺乏细节和创造力。

此外,发布会后 OpenAI 官网还发布了 GPT-4o 的一系列应用案例探索。包括:照片转漫画风格;会议记录;图片合成;基于图片的 3D 内容生成;手写体、草稿生成;风格化的海报,以及连环画生成;艺术字体生成等。

而这些能力中,照片转漫画风格、会议记录等,也都是一些看起来很普通的文生图或者是AI大模型功能。

能挑战现有的商业模式吗?

“我注册 5 个免费的 ChatGPT 账号,是不是就不需要每月花 20 美元订阅 ChatGPT Plus 呢?”

OpenAI 公布的 GPT-4o 使用政策是 ChatGPT Plus 用户比限制普通用户的流量限制高 5 倍。

GPT-4o 对所有人免费,首先挑战的似乎是 OpenAI 自己的商业模型。

第三方市场分析平台 Sensor Tower 公布的数据显示,过去一个月中,ChatGPT 在全球 App Store 中的下载量为 700 万,订阅收入 1200 万美元;全球 Google Play 市场的下载量为 9000 万,订阅收入 300 万美元。

目前,ChatGPT Plus 在两个应用商店的订阅价格均为 19.99 美元。由订阅数据推断,ChatGPT Plus 过去一个月中,通过应用商店付费的订阅用户数为 75 万。虽然 ChatGPT Plus 还有大量的直接付费用户,但从手机端的收入来看,每年进项才不到 2 亿美元,再翻几倍也很难撑起 OpenAI 近千亿的估值。

由此来看,OpenAI 在个人用户充值方面,其实并不需要考虑太多。

更何况 GPT-4o 主打体验好,如果你跟 AI 聊着聊着就断了,还要换账号重新聊,那你会不会愤然充值呢?

“最初的 ChatGPT 暗示了语言界面的可能性;这个新事物给人的感觉有本质上的不同。它快速、智能、有趣、自然且有帮助。”

Sam Altman 的最新博客中提到了“语言界面的可能性”,这也正是 GPT-4o 接下来可能要做的:挑战所有 GUI(图形交互界面),以及想要在 LUI(语音交互界面)上发力的人。

结合近期外媒透出的 OpenAI 与苹果合作的消息,可以猜测 GPT-4o 可能很快就要对所有 AI PC、AI 手机的厂商“抛橄榄枝”或是“掀桌子”。

不管是哪种语音助手或是 AI 大模型,对于 AIPC、AI 手机来说核心价值都是优化体验,而 GPT-4o 一下把体验优化到了极致。

GPT-4o 很可能会卷到所有已知的 App,甚至是 SaaS 行业。过去一年多时间里,市场上所有已经开发和正在开发的 AI Agent 都会面临威胁。

某位资源聚合类 app 产品经理曾对虎嗅表示,“我的操作流程就是产品的核心,如果操作流程被你 ChatGPT 优化了,那相当于我的 App 没价值了。”

试想,如果订外卖的 App,UI 变成了一句话“给我订餐”,那打开美团还是打开饿了么,对于用户来说就一样了。

厂商的下一步只能是压缩供应链、生态的利润空间,甚至是恶性价格战。

从目前的形式来看,其他厂商要在模型能力上打败 OpenAI 恐怕还需要一段时间。

产品要对标 OpenAI,可能只有通过做更“便宜”的模型了。

对于国内产业的影响

“最近忙死了,没顾上关注他们。”

一位工业 AI 大模型创始人告诉虎嗅,近期一直在忙着沟通战略合作、产品发布、客户交流资本交流,完全没有时间关注 OpenAI 这种发布。

OpenAI 发布前,虎嗅也询问了多位来自各行各业的国内 AI 从业者,他们对 OpenAI 最新发布的预测与看法都很一致:非常期待,但与我无关。

一位从业者表示,从国内目前的进度来看,要在短期内追上 OpenAI 不太现实。所以关心 OpenAI 发布了什么,最多也就是看看最新的技术方向。

目前国内公司在 AI 大模型研发方面,普遍比较关注工程化和垂直模型,这些比较务实、容易变现的方向。

在工程方面,近期蹿红的 Deepseek 就正在国内大模型行业中掀起 Token 的价格战。在垂直模型方面,多位业内人士告诉虎嗅,短期内小模型和垂直模型的研发,基本都不会受到 OpenAI 的裹挟。

“有时候 OpenAI 的技术方向也不是很值得借鉴。”一位模型专家对虎嗅表示,Sora 就是个很好的例子,2024 年 2 月 OpenAI 发布了视频模型 Sora,实现了 60 秒的视频稳定输出。虽然看起来效果很好,但后续的实践几乎没有,落地速度也非常慢。

在 Sora 之前,国内很多在文生视频领域发力的公司和机构已经实现了 15 秒稳定视频生成,而 Sora 出来以后,一些公司的研发、融资、产品节奏都被打乱了,甚至使整个文生视频行业的发展演变成了一场“技术的大跃进”。

所幸,这次 GPT-4o 与 Sora 大有不同。OpenAI CTO Muri Murati 表示,在接下来的几周内,我们将继续我们的迭代部署,为您提供所有功能。

发布会结束不久,GPT-4o 就已经可以上线试用了。

4.9 厦门亚马逊春耕-文章页底部图片
TikTok、Facebook、谷歌、Twitter广告服务,0门槛抢占全球流量!
极速开户+优化投流+风险保障+效果跟踪,仅需4步,轻松撬动亿万海外流量,让品牌销量翻倍增长!
已成功开通5000+账户
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
SHEIN发布全球循环报告,7 成用户注重性价比
AMZ123获悉,近日,SHEIN 发布2025 年全球循环性报告,调研覆盖21 个国家、约1.5万名用户,系统分析用户购买决策、穿着习惯、衣物处置与循环参与行为,为服装电商的可持续运营、循环服务设计与消费引导提供数据支撑。核心发现如下:一、影响用户购买决策的因素(一)核心决策因素1、性价比是第一决策前提价格是全球用户最统一、最优先的考量项。71.6% 的用户总是将最优价格作为首要考虑,19.2%经常考虑,合计占比高达 90.8%。在 21 个调研市场中,18 个市场将价格列为第一考量,且这些市场中超过 85% 的用户高度关注价格;其中南非、韩国用户价格敏感度最高,近 95% 总是 / 经常关注价格。
26年美国美妆消费者趋势:关税、AI、社媒影响购物决策
AMZ123获悉,随着新技术与平台不断涌现,不同世代美妆消费者的购物行为愈发复杂,不同产品类别对购买决策的影响也存在显著差异。同时,美国近年的关税政策与持续通胀也对市场格局造成影响,使品牌方面临竞争激烈且充满不确定性的环境。因此,Tinuiti发布了《2026年美妆营销研究报告》,从通胀影响到社交媒体趋势全面分析了消费者行为,以更好理解当前美国市场的美妆消费状况。一、市场现状1. 消费者对价格变化的反应数据显示,2025年美国美妆及个护电商市场规模已达到约610亿美元,电商渠道已占据接近一半的市场份额。随着技术进步和平台多样化,美容消费者的购物路径日益复杂。
25年日本家居电商市场达2.56万亿日元,平均单价提升
AMZ123获悉,近日,根据日本经济产业省发布的“2022-2025年电商市场调查”,2025年日本家居电商市场持续扩张,尽管新建住宅数量下降,消费者对线上购物的需求和高价值产品的偏好推动了市场增长。数据显示,近三年来,日本生活杂货、家具、家居类B2C电商市场规模和渗透率均呈稳步上升趋势,从2022年的2.35万亿日元(29.59%),增长至2025年的2.56万亿日元(32.58%%),同比增长3.62%。在商品行业中排名第三,仅次于“图书、视频及音乐软件”(56.45%)和“家用电器、音视频设备、电脑及周边设备等”(43.03%)。
25年全球美妆市场增长10%,AI与社交电商推动增长
AMZ123获悉,近日,根据尼尔森IQ(NielsenIQ)发布的《2026美妆市场报告》,2025年全球美妆市场同比增长10%,其中电商渠道的增速是线下实体店的六倍。对于品牌来说,加快数字化布局已成为赢得美妆市场的关键。从区域表现来看,北美市场增长10%,西欧增长4%,东欧增长8%,拉丁美洲增长14%,非洲和中东增长16%,亚太地区增长14%。这一趋势表明,无论市场成熟度如何,数字化渠道对全球美妆增长的推动作用普遍存在。AI驱动的产品推荐、社交电商以及直播购物正在改变消费者发现和购买产品的路径。超过50%的消费者正在使用AI购物工具,其中49%已经通过生成式AI获得美妆推荐,53%的消费者通过社交平台完成购买。
国产奶瓶刷打入美国母婴圈,在TikTok卖了200多万
给宝宝洗杯子,大概是所有父母最熟悉也最无奈的日常。不同于成人所用的敞口杯,婴幼儿专用杯包含防呛阀门、吸嘴等特殊饮水结构,复杂配件造就的诸多清洁死角,“滋生”的不光有缝隙处的霉菌刺客,更有为人父母对于“哪儿哪儿不干净”的卫生焦虑。近期在TikTok美区,一款能深入各个死角、分区清洁的杯刷工具正是为“绞杀”这番情绪而来,凭借5合1的全能型卖点迅速突围,成为母婴类目的一匹销量黑马。01母婴类目下的“死角克星”数据显示,在TikTok美区母婴用品类目,一款主打5合1的清洁杯刷以2445件的周销量,登上了大类销量榜第2的位置。虽然乍一看这款刷子与常规款无异,但在洗杯子这件事上,它的专业程度却毋庸置疑。
美国Q4电商销售额达3652亿美元,渗透率创新高
AMZ123获悉,近日,根据Digital Commerce 360对美国商务部数据的分析,2025年第四季度,美国电商销售额首次在单个季度突破3500亿美元大关,达到约3650亿美元,比历史数据高出约150亿美元。数据显示,2025年第四季度美国总零售额为1.461万亿美元,同比增长3.6%。其中,线下零售销售增长3%。分析显示,电商在美国零售市场的渗透率创历史新高,占美国总零售总额的25%。若将餐饮服务等零售销售也计入,美国电商占总零售额的比例为16.6%,未经调整的数据显示占比为18.3%。这是自美国商务部 1999年开始追踪在线销售以来,单季度电商渗透率最高的一次。
意大利对Revolut处以1150万欧元罚款
Fin123获悉,近日,意大利反垄断机构对 Revolut 处以 1150 万欧元的罚款。意大利竞争管理局(AGCM)指出,Revolut向客户散布了关于其投资产品的错误信息,同时未能清晰、完整地披露免佣金投资背后的隐性成本与交易限制。此外,意大利方面指出,Revolut在处理用户银行账户时,采用了激进且不透明的操作手法,包括就账户暂停、限制及冻结等事项提供不完整或误导性信息。此次罚款共涉及三项具体处罚:第一,Revolut Securities Europe UAB 与 Revolut Group Holdings Ltd 因投资服务信息披露不足,被罚500万欧元。
年销售额6.7亿美元!25年TikTok Shop美国站美妆标签Top10
AMZ123获悉,近日,根据Charm.io统计,TikTok Shop美国站上10个美妆类标签在过去12个月内创造了超过6.7亿美元的销售额,这些标签不仅描述产品,更直接激发购买行为。2025年超过7000万件美妆产品通过TikTok Shop售出。在TikTok Shop上,标签成为推动消费的基础形式。例如,#skincare护肤标签一年销售额约1.419亿美元,Dr. Melaxin Peel Shot Glow Rice安瓶套装因配方中的水稻提取物与AHA、BHA化学成分,能清理黑头、净化毛孔并防止痘痘,成为#skincare的代表产品。
Stripe与Meta合作,FB广告可完成一键结账
Fin123获悉,近日,Stripe宣布,为Facebook广告商推出全新结账体验,使消费者无需离开应用即可完成购买。通过这项功能,使用Stripe的卖家可以将Facebook广告与支付系统直接连接,买家点击广告中的“立即购买”按钮后,可使用Meta钱包中保存的支付凭证完成一键结账。该流程基于《智能体商务协议》,未来将扩展到包括Instagram广告在内的更多Meta平台。卖家可在Stripe管理平台中通过开关选择启用此功能,并关联其Meta广告账户。启用后,购买过程将完全嵌入广告体验,消除了用户在传统跳转浏览器或应用完成交易时的中断,从而提升购买转化率。
亚马逊再调FBA费用,4月17日起生效!
中东战火延宕至今,仍未有“熄火”之意。当地时间4月2日,特朗普在最新表态中发出警告,称美国将在未来两到三周内对伊朗进行猛烈打击,国际油价应声飙涨。截至当天收盘,5月交货的美国WTI原油价格收于每桶111.54美元,上涨11.41%;6月交货的国际基准布伦特原油价格则收于每桶109.03美元,涨幅高达7.78%。在此背景下,一系列“涨价通知”如同多米诺骨牌,正逐级传导至跨境卖家们的利润表上。全链路合规难题现场答疑,4.17 深圳 | 深圳商务局&行业专家坐镇,落地实操一站获取!点击报名AMZ123了解到,当地时间4月2日,亚马逊美国站发布了一则加征物流相关附加费的通知。
高评分+高销量,10款亚马逊厨房小家电热销产品一览
AMZ123获悉,近日,亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。1. 电热水壶预计销售额:62万美元/月销量:24,200+星级评分:4.5好评数量:47,056+图源:亚马逊产品介绍:这款电热水壶内部无塑料,提升饮用安全性与口感纯净度。产品加热效率较高,可在3分钟内快速烧开一杯水,同时配备自动断电、加热指示灯、防干烧保护功能,保障使用安全。整体外观采用简约设计,宽口壶身与双角度开盖设计便于清洁与加水,精准壶嘴与防烫手柄提升倒水稳定性。
因产品数据质量不佳,印度电商每年损失五百亿卢比
AMZ123获悉,近日,据外媒报道,印度电商与快消行业正因产品数据质量不佳而蒙受巨额损失。据GS1印度公司的最新研究,不一致、不完整或不准确的产品信息每年导致约500亿卢比的资金流失。其中,约200亿卢比表现为毛利率下降,原因包括转化率降低、商品上架受限以及销售速度放缓;另有190亿卢比直接用于退货相关成本,涵盖逆向物流、处理与加工等环节。尤其在时尚服装领域,退货问题更为突出。因尺码不合、款式偏好或实物与描述不符,顾客主动退货率通常占总订单的20%至25%。Unicommerce指出,逆向物流会使订单价值额外增加5%至7%,而这还不含原始运费。放眼全球,时尚与鞋类退货率甚至可达30%至40%。
存火灾风险!美国CPSC紧急召回八款插头延长线
AMZ123获悉,近日,美国消费者产品安全委员会(CPSC)发布紧急召回警告,要求消费者立即停止使用“插头延长线”,并已与沃尔玛、eBay和AliExpress等电商平台达成协议,下架相关危险商品。CPSC指出,这类延长线两端均为公头插头,插入电源后裸露插脚可能带电,存在严重触电和火灾风险,因此在任何情况下都不应使用。为防止危险商品继续流入市场,CPSC已推动相关电商平台删除商品链接,同时平台方面承诺将主动识别并下架类似产品。根据CPSC的公告,多家来自中国的卖家和企业涉及销售该类产品,但大多数未回应CPSC关于召回或产品信息的要求。
26年美国美妆消费者趋势:关税、AI、社媒影响购物决策
AMZ123获悉,随着新技术与平台不断涌现,不同世代美妆消费者的购物行为愈发复杂,不同产品类别对购买决策的影响也存在显著差异。同时,美国近年的关税政策与持续通胀也对市场格局造成影响,使品牌方面临竞争激烈且充满不确定性的环境。因此,Tinuiti发布了《2026年美妆营销研究报告》,从通胀影响到社交媒体趋势全面分析了消费者行为,以更好理解当前美国市场的美妆消费状况。一、市场现状1. 消费者对价格变化的反应数据显示,2025年美国美妆及个护电商市场规模已达到约610亿美元,电商渠道已占据接近一半的市场份额。随着技术进步和平台多样化,美容消费者的购物路径日益复杂。
SHEIN发布全球循环报告,7 成用户注重性价比
AMZ123获悉,近日,SHEIN 发布2025 年全球循环性报告,调研覆盖21 个国家、约1.5万名用户,系统分析用户购买决策、穿着习惯、衣物处置与循环参与行为,为服装电商的可持续运营、循环服务设计与消费引导提供数据支撑。核心发现如下:一、影响用户购买决策的因素(一)核心决策因素1、性价比是第一决策前提价格是全球用户最统一、最优先的考量项。71.6% 的用户总是将最优价格作为首要考虑,19.2%经常考虑,合计占比高达 90.8%。在 21 个调研市场中,18 个市场将价格列为第一考量,且这些市场中超过 85% 的用户高度关注价格;其中南非、韩国用户价格敏感度最高,近 95% 总是 / 经常关注价格。
25年全球美妆市场增长10%,AI与社交电商推动增长
AMZ123获悉,近日,根据尼尔森IQ(NielsenIQ)发布的《2026美妆市场报告》,2025年全球美妆市场同比增长10%,其中电商渠道的增速是线下实体店的六倍。对于品牌来说,加快数字化布局已成为赢得美妆市场的关键。从区域表现来看,北美市场增长10%,西欧增长4%,东欧增长8%,拉丁美洲增长14%,非洲和中东增长16%,亚太地区增长14%。这一趋势表明,无论市场成熟度如何,数字化渠道对全球美妆增长的推动作用普遍存在。AI驱动的产品推荐、社交电商以及直播购物正在改变消费者发现和购买产品的路径。超过50%的消费者正在使用AI购物工具,其中49%已经通过生成式AI获得美妆推荐,53%的消费者通过社交平台完成购买。
《TikTok Shop突破末次触达归因(LTA)ROAS分析报告》PDF下载
在数字化浪潮中,广告主正面临有效衡量广告支出回报率(ROAS)的挑战。传统未次触达归因(LTA)模型因数据收集难度和归因偏差问题已难以满足广告主的需求,因此,探索新的方法来解决这些问题显得尤为重要。
《未来电商报告:品牌独立站五步升级锁定未来确定性增长》PDF下载
调研显示,出海商家针对家居、时尚及消费电子等品类布局比例均超过30%。独立站凭借其高度品牌化、个性化、场景化及功能性等优势,精准契合上述品类对品牌调性、场景交互及沉浸式体验的核心诉求,正成为商家黑五大促期提升销量、构建品牌竞争壁垒的关键载体。
《TikTok Shop达人真实种草力报告》PDF下载
达人正在将文化内容、社群互动与商业转化深度融合,形成一个高度协同的内容商业生态,其价值早已不再局限于内容带来的直接收入。从更广义的商业视角来看,达人价值的核心在于真实影响力-即其内容对商品与服务产生影响并促成转化所形成的整体商业价值,这一能力正构成达人在内容电商体系中的带货价值基础。
《2026年第2季度儿童时尚品类报告》PDF下载
儿童时尚品类概览 主题选品合辑 巴西站点上新 泰国站点上新 菲律宾站点上新 越南站点上新
《TikTok Shop 2025年度报告》PDF下载
2025年,TikTok Shop进一步加快扩张步伐,在巩固欧美成熟市场的同时,积极开拓新兴市场,先后上线德国、意大利、法国、日本等站点。此举不仅为平台带来新增量,也体现出其多元化市场战略的初步成效,以分散地缘政治风险。
《Shopee2025印尼站点X 汽车摩托品类专题》PDF下载
印尼当地汽车保有量并不高,每一千人的机动车保有量仅96人,未来可提升的空间仍大。空间参照系可以看泰国和马来,2024年泰国汽车保有量为322辆/千人,马来西亚为531辆/千人。
《2026年Shopee运动户外类目自行车爆品分享》PDF下载
巴西骑行爱好群体广泛,但平台上热销品呈现出的国际大牌极少,推测可能原因是国际品牌可能主要通过线下经销或自行渠道销售,未深度参与Shopee等本土电商。因此巴西用户在平台上几乎接触不到这些高端品牌产品。平台上巴西用户更倾向购买本土品牌的自行车,可能出于价格实惠和售后便利考虑。
《2025年TikTok生态发展白皮书》PDF下载
2025年,全球内容电商迈入深度跃迁的新周期。TikTokShop正以前所未有的速度拓展市场版图,完成从高速增长向高质量增长的跃迁。在这一进程中,生态结构重构、参与者多元化、全球政策协同等因素叠加,构成内容电商演进的核心变量。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
侃侃跨境那些事儿
不侃废话,挣钱要紧!
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
跨境学院
跨境电商大小事,尽在跨境学院。
AMZ123选品观察员
选品推荐及选品技巧分享。
首页
跨境头条
文章详情
遥遥领先的OpenAI慢下来了
白鲸出海
2024-05-14 22:01
1435

“如果发布的是 GPT-5,那 OpenAI 依然遥遥领先。如果是 AI Search 或者是语音助手,那就说明 OpenAI 没落了。”

一位 AI 大模型从业者告诉虎嗅,业内对 OpenAI 的期待太高,除非是 GPT-5 这样的颠覆式创新,否则很难满足观众的“胃口”。

虽然 Sam Altman 在 OpenAI 线上直播前,已经预告不会发布 GPT-5(或 GPT-4.5),但外界对 OpenAI 的期待早已是九牛拉不转了。

北京时间 5 月 14 日凌晨,OpenAI 公布了最新的 GPT-4o,o 代表 Omnimodel(全能模型)。20 多分钟的演示直播,展示了远超当前所有语音助手的 AI 交互体验,与外媒此前透露的消息基本重合。

虽然 GPT-4o 的演示效果仍可称得上“炸裂”,但业内人士普遍认为很难配得上 Altman 预告中的“魔法”二字。很多人认为,这些功能性的产品,都是“偏离 OpenAI 使命”的。

OpenAI 的 PR 团队似乎也预料到了这种舆论走向。发布会现场以及会后 Altman 发布的博客中对此解释道:

“我们使命的一个关键部分是将非常强大的人工智能工具免费(或以优惠的价格)提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型,没有广告或类似的东西。 

当我们创办 OpenAI 时,我们最初的想法是我们要创造人工智能并利用它为世界创造各种利益。相反,现在看起来我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,让我们所有人都受益。”

遥遥领先的 GPT-4o

“如果我们必须等待 5 秒钟才能得到‘每个’回复,用户体验就会一落千丈。即使合成音频本身听起来很真实,它也会破坏沉浸感,让人感觉毫无生气。”

在 OpenAI 发布会前夕,英伟达 Embodied AI 负责人 Jim Fan 在 X 上预测了 OpenAI 会发布的语音助手,并提出:

几乎所有的语音 AI 都会经历三个阶段:

1. 语音识别或“ASR”:音频->文本1,例如 Whisper;

2. 计划下一步要说什么的 LLM:text1 -> text2;

3. 语音合成或“TTS”:text2 ->音频,例如 ElevenLabs 或 VALL-E。

经历 3 个阶段会导致巨大的延迟。

GPT-4o 在响应速度方面,几乎解决了延迟问题。GPT-4o 的响应音频输入的最短时长为 232 毫秒,平均响应时长 320 毫秒,几乎与人类相似。没有使用 GPT-4o 的 ChatGPT 语音对话功能平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒(GPT-4)。

GPT-4o 不仅通过缩短延迟极大地提升了体验,还在 GPT-4 的基础上做了很多升级包括:

1、极佳的多模态交互能力,包括语音、视频,以及屏幕共享。

2、可以实时识别和理解人类的表情,文字,以及数学公式。

3、交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌。

4、超低延时,且可以在对话中实时打断 AI,增加信息或开启新话题。

5、所有 ChatGPT 用户均可免费使用(有使用上限)。

6、速度是 GPT-4 Turbo 的 2 倍,API 成本低 50%,速率限制高 5 倍。

“没落”的 OpenAI

“这些局限性的突破都是创新。”

有业内专家认为,GPT-4o 的多模态能力只是“看起来”很好,实际上 OpenAI 并未展示对于视觉多模态来说真正算是“突破”的功能。

这里我们按大模型行业的习惯,对比一下隔壁厂 Anthropic 的 Claude 3。

Claude 3 的技术文档中提到,“虽然 Claude 的图像理解能力是尖端的,但需要注意一些局限性”。

其中包括:

1、人物识别:Claude 不能用于在图像中识别(即姓名)人物,并将拒绝这样做。

2、准确性:Claude 在解释 200 像素以下的低质量、旋转或非常小的图像时,可能会产生幻觉或犯错误。

3、空间推理:克劳德的空间推理能力有限。它可能很难完成需要精确定位或布局的任务,例如读取模拟钟面或描述棋子的确切位置。

4、计数:Claude 可以给出图像中物体的近似计数,但可能并不总是精确准确的,特别是对于大量小物体。

5、AI 生成的图像:Claude 不知道图像是否是人工智能生成的,如果被问到,可能不正确。不要依赖它来检测假图像或合成图像。

6、不适当的内容:Claude 不会处理违反我们可接受使用政策的不适当或露骨的图像。

7、医疗保健应用:虽然 Claude 可以分析一般医学图像,但它不是为解释 CT 或 MRI 等复杂诊断扫描而设计的。Claude 的输出不应被视为专业医疗建议或诊断的替代品。

在 GPT-4o 网站发布的案例中,有一些与“空间推理”有相关的能力,但仍难算得上突破。

此外,从发布会现场演示中 GPT-4o 输出的内容很容易看出,其模型能力与 GPT-4 相差并不大。

GPT-4o 跑分

虽然模型可以在对话中增加语气,甚至即兴演唱,但对话内容还是与 GPT-4 一样缺乏细节和创造力。

此外,发布会后 OpenAI 官网还发布了 GPT-4o 的一系列应用案例探索。包括:照片转漫画风格;会议记录;图片合成;基于图片的 3D 内容生成;手写体、草稿生成;风格化的海报,以及连环画生成;艺术字体生成等。

而这些能力中,照片转漫画风格、会议记录等,也都是一些看起来很普通的文生图或者是AI大模型功能。

能挑战现有的商业模式吗?

“我注册 5 个免费的 ChatGPT 账号,是不是就不需要每月花 20 美元订阅 ChatGPT Plus 呢?”

OpenAI 公布的 GPT-4o 使用政策是 ChatGPT Plus 用户比限制普通用户的流量限制高 5 倍。

GPT-4o 对所有人免费,首先挑战的似乎是 OpenAI 自己的商业模型。

第三方市场分析平台 Sensor Tower 公布的数据显示,过去一个月中,ChatGPT 在全球 App Store 中的下载量为 700 万,订阅收入 1200 万美元;全球 Google Play 市场的下载量为 9000 万,订阅收入 300 万美元。

目前,ChatGPT Plus 在两个应用商店的订阅价格均为 19.99 美元。由订阅数据推断,ChatGPT Plus 过去一个月中,通过应用商店付费的订阅用户数为 75 万。虽然 ChatGPT Plus 还有大量的直接付费用户,但从手机端的收入来看,每年进项才不到 2 亿美元,再翻几倍也很难撑起 OpenAI 近千亿的估值。

由此来看,OpenAI 在个人用户充值方面,其实并不需要考虑太多。

更何况 GPT-4o 主打体验好,如果你跟 AI 聊着聊着就断了,还要换账号重新聊,那你会不会愤然充值呢?

“最初的 ChatGPT 暗示了语言界面的可能性;这个新事物给人的感觉有本质上的不同。它快速、智能、有趣、自然且有帮助。”

Sam Altman 的最新博客中提到了“语言界面的可能性”,这也正是 GPT-4o 接下来可能要做的:挑战所有 GUI(图形交互界面),以及想要在 LUI(语音交互界面)上发力的人。

结合近期外媒透出的 OpenAI 与苹果合作的消息,可以猜测 GPT-4o 可能很快就要对所有 AI PC、AI 手机的厂商“抛橄榄枝”或是“掀桌子”。

不管是哪种语音助手或是 AI 大模型,对于 AIPC、AI 手机来说核心价值都是优化体验,而 GPT-4o 一下把体验优化到了极致。

GPT-4o 很可能会卷到所有已知的 App,甚至是 SaaS 行业。过去一年多时间里,市场上所有已经开发和正在开发的 AI Agent 都会面临威胁。

某位资源聚合类 app 产品经理曾对虎嗅表示,“我的操作流程就是产品的核心,如果操作流程被你 ChatGPT 优化了,那相当于我的 App 没价值了。”

试想,如果订外卖的 App,UI 变成了一句话“给我订餐”,那打开美团还是打开饿了么,对于用户来说就一样了。

厂商的下一步只能是压缩供应链、生态的利润空间,甚至是恶性价格战。

从目前的形式来看,其他厂商要在模型能力上打败 OpenAI 恐怕还需要一段时间。

产品要对标 OpenAI,可能只有通过做更“便宜”的模型了。

对于国内产业的影响

“最近忙死了,没顾上关注他们。”

一位工业 AI 大模型创始人告诉虎嗅,近期一直在忙着沟通战略合作、产品发布、客户交流资本交流,完全没有时间关注 OpenAI 这种发布。

OpenAI 发布前,虎嗅也询问了多位来自各行各业的国内 AI 从业者,他们对 OpenAI 最新发布的预测与看法都很一致:非常期待,但与我无关。

一位从业者表示,从国内目前的进度来看,要在短期内追上 OpenAI 不太现实。所以关心 OpenAI 发布了什么,最多也就是看看最新的技术方向。

目前国内公司在 AI 大模型研发方面,普遍比较关注工程化和垂直模型,这些比较务实、容易变现的方向。

在工程方面,近期蹿红的 Deepseek 就正在国内大模型行业中掀起 Token 的价格战。在垂直模型方面,多位业内人士告诉虎嗅,短期内小模型和垂直模型的研发,基本都不会受到 OpenAI 的裹挟。

“有时候 OpenAI 的技术方向也不是很值得借鉴。”一位模型专家对虎嗅表示,Sora 就是个很好的例子,2024 年 2 月 OpenAI 发布了视频模型 Sora,实现了 60 秒的视频稳定输出。虽然看起来效果很好,但后续的实践几乎没有,落地速度也非常慢。

在 Sora 之前,国内很多在文生视频领域发力的公司和机构已经实现了 15 秒稳定视频生成,而 Sora 出来以后,一些公司的研发、融资、产品节奏都被打乱了,甚至使整个文生视频行业的发展演变成了一场“技术的大跃进”。

所幸,这次 GPT-4o 与 Sora 大有不同。OpenAI CTO Muri Murati 表示,在接下来的几周内,我们将继续我们的迭代部署,为您提供所有功能。

发布会结束不久,GPT-4o 就已经可以上线试用了。

1
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部