Item 1 of 1

遥遥领先的OpenAI慢下来了

白鲸出海

1808

2024-05-14 22:01

1808

白鲸出海

一键完成百千笔付款，超低费率+极速到账，一年轻松帮你省下数十万。

“如果发布的是 GPT-5，那 OpenAI 依然遥遥领先。如果是 AI Search 或者是语音助手，那就说明 OpenAI 没落了。”

一位 AI 大模型从业者告诉虎嗅，业内对 OpenAI 的期待太高，除非是 GPT-5 这样的颠覆式创新，否则很难满足观众的“胃口”。

虽然 Sam Altman 在 OpenAI 线上直播前，已经预告不会发布 GPT-5（或 GPT-4.5），但外界对 OpenAI 的期待早已是九牛拉不转了。

北京时间 5 月 14 日凌晨，OpenAI 公布了最新的 GPT-4o，o 代表 Omnimodel（全能模型）。20 多分钟的演示直播，展示了远超当前所有语音助手的 AI 交互体验，与外媒此前透露的消息基本重合。

虽然 GPT-4o 的演示效果仍可称得上“炸裂”，但业内人士普遍认为很难配得上 Altman 预告中的“魔法”二字。很多人认为，这些功能性的产品，都是“偏离 OpenAI 使命”的。

OpenAI 的 PR 团队似乎也预料到了这种舆论走向。发布会现场以及会后 Altman 发布的博客中对此解释道：

“我们使命的一个关键部分是将非常强大的人工智能工具免费（或以优惠的价格）提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型，没有广告或类似的东西。

当我们创办 OpenAI 时，我们最初的想法是我们要创造人工智能并利用它为世界创造各种利益。相反，现在看起来我们将创造人工智能，然后其他人将使用它来创造各种令人惊奇的事物，让我们所有人都受益。”

遥遥领先的 GPT-4o

“如果我们必须等待 5 秒钟才能得到‘每个’回复，用户体验就会一落千丈。即使合成音频本身听起来很真实，它也会破坏沉浸感，让人感觉毫无生气。”

在 OpenAI 发布会前夕，英伟达 Embodied AI 负责人 Jim Fan 在 X 上预测了 OpenAI 会发布的语音助手，并提出：

几乎所有的语音 AI 都会经历三个阶段：

1. 语音识别或“ASR”：音频->文本1，例如 Whisper；

2. 计划下一步要说什么的 LLM：text1 -> text2;

3. 语音合成或“TTS”：text2 ->音频，例如 ElevenLabs 或 VALL-E。

经历 3 个阶段会导致巨大的延迟。

GPT-4o 在响应速度方面，几乎解决了延迟问题。GPT-4o 的响应音频输入的最短时长为 232 毫秒，平均响应时长 320 毫秒，几乎与人类相似。没有使用 GPT-4o 的 ChatGPT 语音对话功能平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒（GPT-4)。

GPT-4o 不仅通过缩短延迟极大地提升了体验，还在 GPT-4 的基础上做了很多升级包括：

1、极佳的多模态交互能力，包括语音、视频，以及屏幕共享。

2、可以实时识别和理解人类的表情，文字，以及数学公式。

3、交互语音感情丰富，可以变换语音语调、风格，还可以模仿，甚至“即兴”唱歌。

4、超低延时，且可以在对话中实时打断 AI，增加信息或开启新话题。

5、所有 ChatGPT 用户均可免费使用（有使用上限）。

6、速度是 GPT-4 Turbo 的 2 倍，API 成本低 50%，速率限制高 5 倍。

“没落”的 OpenAI

“这些局限性的突破都是创新。”

有业内专家认为，GPT-4o 的多模态能力只是“看起来”很好，实际上 OpenAI 并未展示对于视觉多模态来说真正算是“突破”的功能。

这里我们按大模型行业的习惯，对比一下隔壁厂 Anthropic 的 Claude 3。

Claude 3 的技术文档中提到，“虽然 Claude 的图像理解能力是尖端的，但需要注意一些局限性”。

其中包括：

1、人物识别：Claude 不能用于在图像中识别（即姓名）人物，并将拒绝这样做。

2、准确性：Claude 在解释 200 像素以下的低质量、旋转或非常小的图像时，可能会产生幻觉或犯错误。

3、空间推理：克劳德的空间推理能力有限。它可能很难完成需要精确定位或布局的任务，例如读取模拟钟面或描述棋子的确切位置。

4、计数：Claude 可以给出图像中物体的近似计数，但可能并不总是精确准确的，特别是对于大量小物体。

5、AI 生成的图像：Claude 不知道图像是否是人工智能生成的，如果被问到，可能不正确。不要依赖它来检测假图像或合成图像。

6、不适当的内容：Claude 不会处理违反我们可接受使用政策的不适当或露骨的图像。

7、医疗保健应用：虽然 Claude 可以分析一般医学图像，但它不是为解释 CT 或 MRI 等复杂诊断扫描而设计的。Claude 的输出不应被视为专业医疗建议或诊断的替代品。

在 GPT-4o 网站发布的案例中，有一些与“空间推理”有相关的能力，但仍难算得上突破。

此外，从发布会现场演示中 GPT-4o 输出的内容很容易看出，其模型能力与 GPT-4 相差并不大。

GPT-4o 跑分

虽然模型可以在对话中增加语气，甚至即兴演唱，但对话内容还是与 GPT-4 一样缺乏细节和创造力。

此外，发布会后 OpenAI 官网还发布了 GPT-4o 的一系列应用案例探索。包括：照片转漫画风格；会议记录；图片合成；基于图片的 3D 内容生成；手写体、草稿生成；风格化的海报，以及连环画生成；艺术字体生成等。

而这些能力中，照片转漫画风格、会议记录等，也都是一些看起来很普通的文生图或者是AI大模型功能。

能挑战现有的商业模式吗？

“我注册 5 个免费的 ChatGPT 账号，是不是就不需要每月花 20 美元订阅 ChatGPT Plus 呢？”

OpenAI 公布的 GPT-4o 使用政策是 ChatGPT Plus 用户比限制普通用户的流量限制高 5 倍。

GPT-4o 对所有人免费，首先挑战的似乎是 OpenAI 自己的商业模型。

第三方市场分析平台 Sensor Tower 公布的数据显示，过去一个月中，ChatGPT 在全球 App Store 中的下载量为 700 万，订阅收入 1200 万美元；全球 Google Play 市场的下载量为 9000 万，订阅收入 300 万美元。

目前，ChatGPT Plus 在两个应用商店的订阅价格均为 19.99 美元。由订阅数据推断，ChatGPT Plus 过去一个月中，通过应用商店付费的订阅用户数为 75 万。虽然 ChatGPT Plus 还有大量的直接付费用户，但从手机端的收入来看，每年进项才不到 2 亿美元，再翻几倍也很难撑起 OpenAI 近千亿的估值。

由此来看，OpenAI 在个人用户充值方面，其实并不需要考虑太多。

更何况 GPT-4o 主打体验好，如果你跟 AI 聊着聊着就断了，还要换账号重新聊，那你会不会愤然充值呢？

“最初的 ChatGPT 暗示了语言界面的可能性；这个新事物给人的感觉有本质上的不同。它快速、智能、有趣、自然且有帮助。”

Sam Altman 的最新博客中提到了“语言界面的可能性”，这也正是 GPT-4o 接下来可能要做的：挑战所有 GUI（图形交互界面），以及想要在 LUI（语音交互界面）上发力的人。

结合近期外媒透出的 OpenAI 与苹果合作的消息，可以猜测 GPT-4o 可能很快就要对所有 AI PC、AI 手机的厂商“抛橄榄枝”或是“掀桌子”。

不管是哪种语音助手或是 AI 大模型，对于 AIPC、AI 手机来说核心价值都是优化体验，而 GPT-4o 一下把体验优化到了极致。

GPT-4o 很可能会卷到所有已知的 App，甚至是 SaaS 行业。过去一年多时间里，市场上所有已经开发和正在开发的 AI Agent 都会面临威胁。

某位资源聚合类 app 产品经理曾对虎嗅表示，“我的操作流程就是产品的核心，如果操作流程被你 ChatGPT 优化了，那相当于我的 App 没价值了。”

试想，如果订外卖的 App，UI 变成了一句话“给我订餐”，那打开美团还是打开饿了么，对于用户来说就一样了。

厂商的下一步只能是压缩供应链、生态的利润空间，甚至是恶性价格战。

从目前的形式来看，其他厂商要在模型能力上打败 OpenAI 恐怕还需要一段时间。

产品要对标 OpenAI，可能只有通过做更“便宜”的模型了。

对于国内产业的影响

“最近忙死了，没顾上关注他们。”

一位工业 AI 大模型创始人告诉虎嗅，近期一直在忙着沟通战略合作、产品发布、客户交流资本交流，完全没有时间关注 OpenAI 这种发布。

OpenAI 发布前，虎嗅也询问了多位来自各行各业的国内 AI 从业者，他们对 OpenAI 最新发布的预测与看法都很一致：非常期待，但与我无关。

一位从业者表示，从国内目前的进度来看，要在短期内追上 OpenAI 不太现实。所以关心 OpenAI 发布了什么，最多也就是看看最新的技术方向。

目前国内公司在 AI 大模型研发方面，普遍比较关注工程化和垂直模型，这些比较务实、容易变现的方向。

在工程方面，近期蹿红的 Deepseek 就正在国内大模型行业中掀起 Token 的价格战。在垂直模型方面，多位业内人士告诉虎嗅，短期内小模型和垂直模型的研发，基本都不会受到 OpenAI 的裹挟。

“有时候 OpenAI 的技术方向也不是很值得借鉴。”一位模型专家对虎嗅表示，Sora 就是个很好的例子，2024 年 2 月 OpenAI 发布了视频模型 Sora，实现了 60 秒的视频稳定输出。虽然看起来效果很好，但后续的实践几乎没有，落地速度也非常慢。

在 Sora 之前，国内很多在文生视频领域发力的公司和机构已经实现了 15 秒稳定视频生成，而 Sora 出来以后，一些公司的研发、融资、产品节奏都被打乱了，甚至使整个文生视频行业的发展演变成了一场“技术的大跃进”。

所幸，这次 GPT-4o 与 Sora 大有不同。OpenAI CTO Muri Murati 表示，在接下来的几周内，我们将继续我们的迭代部署，为您提供所有功能。

发布会结束不久，GPT-4o 就已经可以上线试用了。

ChatGPT 直播 Google

TikTok、Facebook、谷歌、Twitter广告服务，0门槛抢占全球流量！

极速开户+优化投流+风险保障+效果跟踪，仅需4步，轻松撬动亿万海外流量，让品牌销量翻倍增长！

已成功开通5000+账户

免责声明

本文链接:

本文经作者许可发布在AMZ123跨境头条，如有疑问，请联系客服。

品牌扎堆起诉侵权，上千卖家冻结账户！

亚马逊大量清理VC，VC的时代终结了吗？

最新热门报告作者标签

Ozon计划26年新增15个物流中心，投资超300亿卢布

俄罗斯电商平台Ozon表示，2026年计划在俄罗斯新增15个物流综合设施，其中包括大型全流程履约中心以及用于存储和处理大件商品的物流设施。

26年巴西情人节消费达220亿雷亚尔，服饰美妆成热门品类

2026年巴西情人节（Dia dos Namorados）消费超过220亿雷亚尔，服装、化妆品、香水和鞋类成为最受关注的消费品类。

每15秒售出一件，TikTok Shop英国宠物品类快速增长

TikTok Shop公布数据显示，2025年平台宠物护理品类销售额同比增长超过60%，宠物用品正在成为平台增长较快的消费类别之一。在英国市场，TikTok Shop平均每15秒售出一件宠物产品，宠物食品相关内容也持续增加，其中猫粮相关帖子数量超过82.5万条，狗粮相关帖子数量超过57.2万条。

26年1-4月美国玩具市场销售额增长13%，女性成为主力

2026年1月至4月期间，美国玩具行业超过一半的增长来自女性消费者。同时，18岁及以上成年消费者贡献了整个玩具行业35%的增长，成人消费正在成为推动市场扩张的重要因素。

AMZ123会员专享丨7月第2周资讯汇总

亚马逊亚马逊宣布与MyFlexBox达成战略合作，其德国所有智能快递柜将接入亚马逊配送体系，并成为欧洲首个向亚马逊开放的大规模中立柜机网络。用户在结账时可选24/7自提点，提升取件灵活性。合作旨在共建共享末端基础设施，覆盖零售点、加油站等场景，减少重复配送、提高效率。7月6日曝光的官方文件显示，亚马逊在华盛顿州新一轮裁撤57个岗位，涉及多条业务线，其中包含总监、高级经理等中高层管理岗。7月7日，亚马逊宣布，亚马逊全球智能枢纽仓正式落地华东地区，上海、宁波双仓正式启用。这是继GWD深圳首仓全面运营后，亚马逊在完善跨境物流网络上的又一关键布局。

TikTok美区推行三级架构保证金，风险保证金最高$10000

重磅！TikTok美区新增保证金，卖家速查后台

紧急调整！美国CPSC法规给卖家暂时“松绑”了

在跨境电商迈入升级赛道的当下，合规化浪潮正以迅雷不及掩耳之势席卷整个行业。一系列政策法规如同多米诺骨牌般接连落地，逐渐渗透到跨境电商产品质检、税务申报、物流清关等流程。其中在近期讨论热度最高的，莫过于美国最新生效的CPSC法规。进入7月以来，CPSC电子申报（eFiling）新规在业内被高频提及。据业内消息，按原定计划，自7月8日起，美国消费品安全委员会（CPSC）将联合美国海关与边境保护局（CBP）全面施行电子申报（eFiling）新规，所有受CPSC监管的进口消费品需在清关前完成GCC/CPC合格证书电子申报，未按要求申报可能导致清关延误或货件被拒、退运。

TikTok Shop美区保证金大改！金额不再统一，速查后台应缴额！

告别“多类目叠加”，卖家该如何应对？

紧急调整！美国CPSC法规给卖家暂时“松绑”了

AMZ123会员专享丨7月第2周资讯汇总

每15秒售出一件，TikTok Shop英国宠物品类快速增长

26年1-4月美国玩具市场销售额增长13%，女性成为主力

Ozon计划26年新增15个物流中心，投资超300亿卢布

俄罗斯电商平台Ozon表示，2026年计划在俄罗斯新增15个物流综合设施，其中包括大型全流程履约中心以及用于存储和处理大件商品的物流设施。

26年巴西情人节消费达220亿雷亚尔，服饰美妆成热门品类

2026年巴西情人节（Dia dos Namorados）消费超过220亿雷亚尔，服装、化妆品、香水和鞋类成为最受关注的消费品类。

TikTok美区推行三级架构保证金，风险保证金最高$10000

重磅！TikTok美区新增保证金，卖家速查后台

《全球宠物行业趋势与中国增长机遇报告》PDF下载

宠物行业全年的销售额为660亿美元与去年同期相比增长了2.1%。

《TikTok Shop 2024-2025 西班牙站点报告》PDF下载

在全球社交电商高速发展的时代浪潮中，TikTok已然崛起为品牌与消费者深度互动的重要阵地。TikTok不仅重塑了用户的消费习惯，更开创了"发现式购物"的新模式，为品牌营销带来了前所未有的机遇与挑战。

《2026年全球电商行业趋势洞察报告》PDF下载

报告深度解读 2026 年全球电商行业发展趋势，全面剖析移动端与网页端市场格局、各区域网站流量增长动态，以及综合电商、服饰电商、美妆电商等核心赛道的细分趋势与头部玩家表现。报告同步收录标杆案例，拆解Nykaa、0live Young、UNIQLO 等区域头部电商的业务亮点、广告策略与用户画像，为品牌制定精准市场策略提供决策参考。

《2026年电子元器件行业趋势与策略解读》PDF下载

据世界半导体贸易统计组织(WSTS)预测报告显示，2025年全球半导体营收将同比增长22.5%至7720亿美元，2026年将再度增长26.3%至9750亿美元，逼近1万亿美元大关;

《2025-Q1亚马逊沃尔玛全球电商CPC数据报告》PDF下载

我们整合了Pacvue和Helium 10的专有数据库，全方位展示行业内范围最广的电商数据。这份报告包括数万家大中小型规模，不同品类广告主的数据，以及几个主要品类的详细分析。

《男装休闲服装品类2026秋冬趋势报告》PDF现在

服装买家高度关注市场趋势，具有高频复购的特点，对趋势品的诉求相对更高，对于新品至少提前2-3个月进行采购且主要通过社媒获取服装趋势;

《美客多趋势报告-智利站》PDF下载

在当今的消费环境中，每一次购物都成为消费者身份的体现，反映出消费者的兴趣、欲望和价值观。这些选择受到时代和文化的影响，不仅展现了消费者的偏好，也塑造了消费者与市场的关系。

《拉美八国经贸与投资概览》PDF下载

中国与古巴1960年建立外交关系，正式开启了中国与拉美地区合作的新纪元。截至目前，中国已与26个拉美和加勒比国家建立外交关系，并同其中22个国家签署了共建“一带一路”合作文件，关系不断深化。

跨境数据中心

聚合海量跨境数据，输出跨境研究智慧。