AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

遥遥领先的OpenAI慢下来了

1121
2024-05-14 22:01
2024-05-14 22:01
1121

想系统掌握亚马逊广告的投放逻辑与底层闭环?点击免费学习《亚马逊广告基础逻辑》

“如果发布的是 GPT-5,那 OpenAI 依然遥遥领先。如果是 AI Search 或者是语音助手,那就说明 OpenAI 没落了。”

一位 AI 大模型从业者告诉虎嗅,业内对 OpenAI 的期待太高,除非是 GPT-5 这样的颠覆式创新,否则很难满足观众的“胃口”。

虽然 Sam Altman 在 OpenAI 线上直播前,已经预告不会发布 GPT-5(或 GPT-4.5),但外界对 OpenAI 的期待早已是九牛拉不转了。

北京时间 5 月 14 日凌晨,OpenAI 公布了最新的 GPT-4o,o 代表 Omnimodel(全能模型)。20 多分钟的演示直播,展示了远超当前所有语音助手的 AI 交互体验,与外媒此前透露的消息基本重合。

虽然 GPT-4o 的演示效果仍可称得上“炸裂”,但业内人士普遍认为很难配得上 Altman 预告中的“魔法”二字。很多人认为,这些功能性的产品,都是“偏离 OpenAI 使命”的。

OpenAI 的 PR 团队似乎也预料到了这种舆论走向。发布会现场以及会后 Altman 发布的博客中对此解释道:

“我们使命的一个关键部分是将非常强大的人工智能工具免费(或以优惠的价格)提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型,没有广告或类似的东西。 

当我们创办 OpenAI 时,我们最初的想法是我们要创造人工智能并利用它为世界创造各种利益。相反,现在看起来我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,让我们所有人都受益。”

遥遥领先的 GPT-4o

“如果我们必须等待 5 秒钟才能得到‘每个’回复,用户体验就会一落千丈。即使合成音频本身听起来很真实,它也会破坏沉浸感,让人感觉毫无生气。”

在 OpenAI 发布会前夕,英伟达 Embodied AI 负责人 Jim Fan 在 X 上预测了 OpenAI 会发布的语音助手,并提出:

几乎所有的语音 AI 都会经历三个阶段:

1. 语音识别或“ASR”:音频->文本1,例如 Whisper;

2. 计划下一步要说什么的 LLM:text1 -> text2;

3. 语音合成或“TTS”:text2 ->音频,例如 ElevenLabs 或 VALL-E。

经历 3 个阶段会导致巨大的延迟。

GPT-4o 在响应速度方面,几乎解决了延迟问题。GPT-4o 的响应音频输入的最短时长为 232 毫秒,平均响应时长 320 毫秒,几乎与人类相似。没有使用 GPT-4o 的 ChatGPT 语音对话功能平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒(GPT-4)。

GPT-4o 不仅通过缩短延迟极大地提升了体验,还在 GPT-4 的基础上做了很多升级包括:

1、极佳的多模态交互能力,包括语音、视频,以及屏幕共享。

2、可以实时识别和理解人类的表情,文字,以及数学公式。

3、交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌。

4、超低延时,且可以在对话中实时打断 AI,增加信息或开启新话题。

5、所有 ChatGPT 用户均可免费使用(有使用上限)。

6、速度是 GPT-4 Turbo 的 2 倍,API 成本低 50%,速率限制高 5 倍。

“没落”的 OpenAI

“这些局限性的突破都是创新。”

有业内专家认为,GPT-4o 的多模态能力只是“看起来”很好,实际上 OpenAI 并未展示对于视觉多模态来说真正算是“突破”的功能。

这里我们按大模型行业的习惯,对比一下隔壁厂 Anthropic 的 Claude 3。

Claude 3 的技术文档中提到,“虽然 Claude 的图像理解能力是尖端的,但需要注意一些局限性”。

其中包括:

1、人物识别:Claude 不能用于在图像中识别(即姓名)人物,并将拒绝这样做。

2、准确性:Claude 在解释 200 像素以下的低质量、旋转或非常小的图像时,可能会产生幻觉或犯错误。

3、空间推理:克劳德的空间推理能力有限。它可能很难完成需要精确定位或布局的任务,例如读取模拟钟面或描述棋子的确切位置。

4、计数:Claude 可以给出图像中物体的近似计数,但可能并不总是精确准确的,特别是对于大量小物体。

5、AI 生成的图像:Claude 不知道图像是否是人工智能生成的,如果被问到,可能不正确。不要依赖它来检测假图像或合成图像。

6、不适当的内容:Claude 不会处理违反我们可接受使用政策的不适当或露骨的图像。

7、医疗保健应用:虽然 Claude 可以分析一般医学图像,但它不是为解释 CT 或 MRI 等复杂诊断扫描而设计的。Claude 的输出不应被视为专业医疗建议或诊断的替代品。

在 GPT-4o 网站发布的案例中,有一些与“空间推理”有相关的能力,但仍难算得上突破。

此外,从发布会现场演示中 GPT-4o 输出的内容很容易看出,其模型能力与 GPT-4 相差并不大。

GPT-4o 跑分

虽然模型可以在对话中增加语气,甚至即兴演唱,但对话内容还是与 GPT-4 一样缺乏细节和创造力。

此外,发布会后 OpenAI 官网还发布了 GPT-4o 的一系列应用案例探索。包括:照片转漫画风格;会议记录;图片合成;基于图片的 3D 内容生成;手写体、草稿生成;风格化的海报,以及连环画生成;艺术字体生成等。

而这些能力中,照片转漫画风格、会议记录等,也都是一些看起来很普通的文生图或者是AI大模型功能。

能挑战现有的商业模式吗?

“我注册 5 个免费的 ChatGPT 账号,是不是就不需要每月花 20 美元订阅 ChatGPT Plus 呢?”

OpenAI 公布的 GPT-4o 使用政策是 ChatGPT Plus 用户比限制普通用户的流量限制高 5 倍。

GPT-4o 对所有人免费,首先挑战的似乎是 OpenAI 自己的商业模型。

第三方市场分析平台 Sensor Tower 公布的数据显示,过去一个月中,ChatGPT 在全球 App Store 中的下载量为 700 万,订阅收入 1200 万美元;全球 Google Play 市场的下载量为 9000 万,订阅收入 300 万美元。

目前,ChatGPT Plus 在两个应用商店的订阅价格均为 19.99 美元。由订阅数据推断,ChatGPT Plus 过去一个月中,通过应用商店付费的订阅用户数为 75 万。虽然 ChatGPT Plus 还有大量的直接付费用户,但从手机端的收入来看,每年进项才不到 2 亿美元,再翻几倍也很难撑起 OpenAI 近千亿的估值。

由此来看,OpenAI 在个人用户充值方面,其实并不需要考虑太多。

更何况 GPT-4o 主打体验好,如果你跟 AI 聊着聊着就断了,还要换账号重新聊,那你会不会愤然充值呢?

“最初的 ChatGPT 暗示了语言界面的可能性;这个新事物给人的感觉有本质上的不同。它快速、智能、有趣、自然且有帮助。”

Sam Altman 的最新博客中提到了“语言界面的可能性”,这也正是 GPT-4o 接下来可能要做的:挑战所有 GUI(图形交互界面),以及想要在 LUI(语音交互界面)上发力的人。

结合近期外媒透出的 OpenAI 与苹果合作的消息,可以猜测 GPT-4o 可能很快就要对所有 AI PC、AI 手机的厂商“抛橄榄枝”或是“掀桌子”。

不管是哪种语音助手或是 AI 大模型,对于 AIPC、AI 手机来说核心价值都是优化体验,而 GPT-4o 一下把体验优化到了极致。

GPT-4o 很可能会卷到所有已知的 App,甚至是 SaaS 行业。过去一年多时间里,市场上所有已经开发和正在开发的 AI Agent 都会面临威胁。

某位资源聚合类 app 产品经理曾对虎嗅表示,“我的操作流程就是产品的核心,如果操作流程被你 ChatGPT 优化了,那相当于我的 App 没价值了。”

试想,如果订外卖的 App,UI 变成了一句话“给我订餐”,那打开美团还是打开饿了么,对于用户来说就一样了。

厂商的下一步只能是压缩供应链、生态的利润空间,甚至是恶性价格战。

从目前的形式来看,其他厂商要在模型能力上打败 OpenAI 恐怕还需要一段时间。

产品要对标 OpenAI,可能只有通过做更“便宜”的模型了。

对于国内产业的影响

“最近忙死了,没顾上关注他们。”

一位工业 AI 大模型创始人告诉虎嗅,近期一直在忙着沟通战略合作、产品发布、客户交流资本交流,完全没有时间关注 OpenAI 这种发布。

OpenAI 发布前,虎嗅也询问了多位来自各行各业的国内 AI 从业者,他们对 OpenAI 最新发布的预测与看法都很一致:非常期待,但与我无关。

一位从业者表示,从国内目前的进度来看,要在短期内追上 OpenAI 不太现实。所以关心 OpenAI 发布了什么,最多也就是看看最新的技术方向。

目前国内公司在 AI 大模型研发方面,普遍比较关注工程化和垂直模型,这些比较务实、容易变现的方向。

在工程方面,近期蹿红的 Deepseek 就正在国内大模型行业中掀起 Token 的价格战。在垂直模型方面,多位业内人士告诉虎嗅,短期内小模型和垂直模型的研发,基本都不会受到 OpenAI 的裹挟。

“有时候 OpenAI 的技术方向也不是很值得借鉴。”一位模型专家对虎嗅表示,Sora 就是个很好的例子,2024 年 2 月 OpenAI 发布了视频模型 Sora,实现了 60 秒的视频稳定输出。虽然看起来效果很好,但后续的实践几乎没有,落地速度也非常慢。

在 Sora 之前,国内很多在文生视频领域发力的公司和机构已经实现了 15 秒稳定视频生成,而 Sora 出来以后,一些公司的研发、融资、产品节奏都被打乱了,甚至使整个文生视频行业的发展演变成了一场“技术的大跃进”。

所幸,这次 GPT-4o 与 Sora 大有不同。OpenAI CTO Muri Murati 表示,在接下来的几周内,我们将继续我们的迭代部署,为您提供所有功能。

发布会结束不久,GPT-4o 就已经可以上线试用了。

12.18东莞亚马逊-文章页底部
TikTok、Facebook、谷歌、Twitter广告服务,0门槛抢占全球流量!
极速开户+优化投流+风险保障+效果跟踪,仅需4步,轻松撬动亿万海外流量,让品牌销量翻倍增长!
已成功开通5000+账户
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
电商同比增长31%!拉美市场正成为高机遇市场
AMZ123获悉,根据Antom的2025年拉美市场趋势报告,拉丁美洲正从“潜力市场”向“高机会市场”加速演进。凭借约6.62亿的人口基数、超过84%的互联网渗透率、持续增长的消费能力等多重优势,拉美市场正展现出超越东南亚的潜在发展机遇。本报告将从拉美市场现状、市场趋势、跨境电商机遇与挑战等方面,全面解析拉丁美洲电商的发展趋势,为卖家提供决策参考。一、拉丁美洲市场概况1. 人口优势拉丁美洲电商市场正处于快速成长阶段。目前,拉美市场拥有约6.62亿人口,形成了规模庞大的消费基数,且人均GDP已突破1万美元,显著高于多数东南亚国家。
日本时尚电商购物趋势:气候变化推动销售季节调整
AMZ123获悉,近日,日本电商平台ZOZOTOWN发布了《日本时尚电商购物趋势》报告,报告基于2004年至2025年的20年购物数据,对日本在线时尚消费行为进行了系统分析。报告对日本超过9亿件商品的购买数据进行整合分析,不仅呈现了时尚消费的演变,也映射出社会、经济和生活方式的变化。报告显示,气候、物价、生活方式多样化和经济波动等环境因素在过去20年间持续影响消费者行为,使时尚购买呈现出更灵活、个性化和区域化的特征,为品牌营销、库存管理及产品策划提供了重要参考。报告指出,气候变化对服装销售季节性产生了直接影响。根据气象厅数据,过去20年间日本平均气温上升约1℃,夏季高温天数增加。
电商平台影响英国人网购决策,30%高价商品在平台下单
AMZ123获悉,近日,根据Akeneo对来自八个国家的1800名英国消费者的调查,电商平台在英国消费者购买决策的各个环节中占据主导地位,尤其是在高价值商品的购买中表现突出。调查显示,超过90欧元的高价商品中,约30%的英国消费者选择通过电商平台完成购买,高于实体店和其他网站的比例。此前ChannelEngine的研究也显示,54%的英国在线购物者在寻找商品时首先会访问电商平台,这一比例高于欧洲平均水平的47%。调查结果显示,电商平台已成为英国消费者的“默认橱窗”,同时兼具比价工具、评价中心和结算平台的功能。
法国黑五周消费结构变化:销量降3%,销售额升0.4%
AMZ123获悉,近日,根据购物应用Joko提供的研究数据,法国今年黑五周(Black Week)期间的平均消费继续小幅上涨。数据统计范围涵盖11月 21 日至 12 月 1 日,基于超过一百万名消费者的线上与线下银行交易记录,以及其应用上 6 万名用户的问卷反馈,对四大品类(时尚、美妆、数码、家居)做出总结。数据显示,法国消费者在11月下旬的促销周内平均花费达到236欧元,比去年多3欧元。得益于线上渠道,整体销售额同比增长0.4%,但销售量下降3%。在时尚品类中,二手平台Vinted登上第一,而去年排名第一的Shein跌至第九。在美妆品类中,丝芙兰排在法国品牌 Nocibé 前面。
一周年报告出炉!TikTok Shop爱尔兰黑五销售增长190%
AMZ123获悉,近日,根据TikTok Shop的数据,自2024年12月正式登陆爱尔兰以来,爱尔兰卖家数量在一年内实现三位数增长,月活跃用户超240万。TikTok Shop将“本地增长”作为爱尔兰站第一年运营的核心,通过与Guaranteed Irish建立合作,帮助其成员企业扩大受众并提升运营能力。2025年双方联合举办多场线下与线上培训,累计吸引数百名卖家参与。随着合作成效显现,双方将续约至2026年,并计划扩大培训规模,让更多爱尔兰企业入驻TikTok Shop。过去一年中,地方城市卖家受益尤为明显。
我在TikTok卖游戏手柄,30天入账300万
“这是12月的行情吗?”数据显示,TikTok美区12月截至11日GMV达到了9.64亿美元,按照“进度条”,美区12月业绩已经完成由黑五大促注入超强buff的11月总GMV的43.4%,日均销售额环比保持18.44%的高增速。炸裂的数据与圣诞红相互映照,卖家这边更是干着急,欠消费者的,只待物流运力加码才能还上。图源:TT123美区卖家交流群临近圣诞,美国人的采购方向依旧保持3大主线:仪式感、娱乐整活、实用主义,任意“混装”2-3点体感则更佳。近期,TikTok美区又有卖家借着这一思路打造出了爆款,为平台久未冒头的游戏类目, 注入了一丝未来发展的可能性。01凭复古成为爆款近一周的视频带货销量榜又多了些许新面孔。
不止支付,更是增长引擎:交易额破5000亿美元,万里汇成150万企业出海首选
十二月的杭州,2025亚马逊全球开店跨境峰会如期而至。会场内人头攒动,数万名跨境卖家与服务商从五湖四海奔赴而来。他们中,有人带着黑五爆单的余温,回味着峰值时刻的酣畅;有人刚熬过淡季的蛰伏,在迷茫中求索破局之道;有人正摩拳擦掌,全力筹备新站点的全球开拓;也有人深耕合规布局,为全球业务探寻最优解法。所有出海人,都在为未来寻找一条更具确定性的增长路径。当全球经济步入深度调整期,地缘政治格局持续演变,消费市场呈现结构性分化,“不确定性” 已成为跨境行业的常态。如何在风浪中锚定方向、于变局中开拓新机,已成为所有跨境电商从业者必须共同面对的战略课题。
黑五网一卖爆近2亿,湖南跑出鞋类大卖!
中国湖南长沙,悄悄冒出了一匹鞋界“黑马”——美迈科技。今年黑五网一,这家来自长沙的跨境企业全渠道总GMV近2亿元,打出了一套几乎完美的“组合拳”:不仅在亚马逊实现业绩突破,更在TikTok Shop、美客多等新兴平台多点成功爆发增长。公开信息显示,美迈科技主营鞋履出海业务,旗下品牌矩阵包括Dream Pairs、Dream Pairs Kids、Bruno Marc、NORTIV 8以及ALLSWIFIT等,覆盖女鞋、商务男鞋、户外机能鞋、运动鞋等多个细分品类,其topshoes us店铺常年位居亚马逊美国站全品类店铺前10名,并且自2021年起,公司每年保持30%左右的营收增长。
欠中国工厂超20亿元,美国知名大卖濒临破产!
商业江湖,从来不乏优胜劣汰,成王败寇的故事。消费电子行业尤其如此,其技术和市场偏好的迭代速度远超传统行业,潮起潮落只在一瞬间。曾被誉为扫地机器人“鼻祖”的iRobot,如今就站在了悬崖边缘。AMZ123获悉,近日,美国知名品牌、亚马逊扫地机器人大卖iRobot被曝正深陷财务危机。财报数据显示,2025年第三季度,iRobot营收仅为1.46亿美元,同比下滑25%;净亏损为1770万美元,这已经是其连续第11个季度亏损。截至2025年9月27日,公司总资产4.81亿美元,总负债金额高达5.08亿美元,现金余额仅剩2480万美元。
黑五网一卖爆近2亿,湖南跑出鞋类大卖!
中国湖南长沙,悄悄冒出了一匹鞋界“黑马”——美迈科技。今年黑五网一,这家来自长沙的跨境企业全渠道总GMV近2亿元,打出了一套几乎完美的“组合拳”:不仅在亚马逊实现业绩突破,更在TikTok Shop、美客多等新兴平台多点成功爆发增长。公开信息显示,美迈科技主营鞋履出海业务,旗下品牌矩阵包括Dream Pairs、Dream Pairs Kids、Bruno Marc、NORTIV 8以及ALLSWIFIT等,覆盖女鞋、商务男鞋、户外机能鞋、运动鞋等多个细分品类,其topshoes us店铺常年位居亚马逊美国站全品类店铺前10名,并且自2021年起,公司每年保持30%左右的营收增长。
广告从0.9加价到1.55美金竞价,6天只有1个点击?新品前期的广告应该这样玩......
mrwait我的C位新品上架后,在11月1号晚开了一组自动紧密匹配广告,固定竞价策略,预算20美金,这一组广告跑了6天,现在的曝光是1078,竞价现在是1.55当时创建者这组广告时,系统没有提供可供参考的建议竞价,我是从最开始的0.9美金通过这几天观察调整上来的,搜索结果首页的竞价现在是25%(前两天这个参数没有设置,昨天从20%调整到了25%),今天出现了一个点击,相关数据如下:1.这一次的点击费用是0.45美金,我的竞价是1.55,为什么单次的点击费用和我的竞价不一致,小白头一次开广告不懂,求大佬解惑2.在创建的自动广告中,我发现有一个广告组默认竞价,在该广告组合中我所投放的定向组也有一个竞价(紧密匹配竞价1
亚马逊老卖家,为什么都在重新学竞品分析?
本质上是在找"真正抢你订单的对手"。
电商同比增长31%!拉美市场正成为高机遇市场
AMZ123获悉,根据Antom的2025年拉美市场趋势报告,拉丁美洲正从“潜力市场”向“高机会市场”加速演进。凭借约6.62亿的人口基数、超过84%的互联网渗透率、持续增长的消费能力等多重优势,拉美市场正展现出超越东南亚的潜在发展机遇。本报告将从拉美市场现状、市场趋势、跨境电商机遇与挑战等方面,全面解析拉丁美洲电商的发展趋势,为卖家提供决策参考。一、拉丁美洲市场概况1. 人口优势拉丁美洲电商市场正处于快速成长阶段。目前,拉美市场拥有约6.62亿人口,形成了规模庞大的消费基数,且人均GDP已突破1万美元,显著高于多数东南亚国家。
欧盟突击检查Temu欧洲总部,涉嫌接受外国补贴
AMZ123获悉,上周,欧盟监管机构依据《外国补贴条例》(Foreign Subsidies Regulation, FSR)对 Temu 设在爱尔兰都柏林的欧洲总部进行了突击检查。知情人士称,此次行动主要围绕 Temu 是否受到来自中国的潜在政府补贴展开调查。Temu方面目前尚未对此作出回应。根据规定,如果企业违反 FSR,欧盟最高可处以其年度全球营业额 10% 的罚款。通常情况下,只有当监管机构掌握了来自内部员工或调查所得的证据信息后,才会启动此类突击行动,这类案件最终可能以企业让步或合作换取罚金减免的方式收场。Temu 于 2023 年 4 月进入欧洲市场,目前在欧盟平均月活跃用户已达到 1.16 亿。
法国黑五周消费结构变化:销量降3%,销售额升0.4%
AMZ123获悉,近日,根据购物应用Joko提供的研究数据,法国今年黑五周(Black Week)期间的平均消费继续小幅上涨。数据统计范围涵盖11月 21 日至 12 月 1 日,基于超过一百万名消费者的线上与线下银行交易记录,以及其应用上 6 万名用户的问卷反馈,对四大品类(时尚、美妆、数码、家居)做出总结。数据显示,法国消费者在11月下旬的促销周内平均花费达到236欧元,比去年多3欧元。得益于线上渠道,整体销售额同比增长0.4%,但销售量下降3%。在时尚品类中,二手平台Vinted登上第一,而去年排名第一的Shein跌至第九。在美妆品类中,丝芙兰排在法国品牌 Nocibé 前面。
我在TikTok卖游戏手柄,30天入账300万
“这是12月的行情吗?”数据显示,TikTok美区12月截至11日GMV达到了9.64亿美元,按照“进度条”,美区12月业绩已经完成由黑五大促注入超强buff的11月总GMV的43.4%,日均销售额环比保持18.44%的高增速。炸裂的数据与圣诞红相互映照,卖家这边更是干着急,欠消费者的,只待物流运力加码才能还上。图源:TT123美区卖家交流群临近圣诞,美国人的采购方向依旧保持3大主线:仪式感、娱乐整活、实用主义,任意“混装”2-3点体感则更佳。近期,TikTok美区又有卖家借着这一思路打造出了爆款,为平台久未冒头的游戏类目, 注入了一丝未来发展的可能性。01凭复古成为爆款近一周的视频带货销量榜又多了些许新面孔。
《亚马逊生活日用品类攻略手册》PDF下载
作为日常生活不可或缺的重要组成,生活百货品类覆盖范围广泛,包括家居用品、家具、车用配件、户外装备、园艺 工具、运动器材、家装用品、厨房、玩具以及宠物用品等众多领域。这类产品不仅是满足基本生活所需,更体现了人们对美好生活的向往和追求。
《掘金泰国-市场洞察与战略机遇报告2025》PDF下载
随着全球经济一体化的加速,泰国作为东盟的核心枢纽,凭借其独特的地缘优势庞大的消费市场以及持续优化的营商环境,成为众多企业战略布局的重要目标。本报告深入剖析泰国市场的政策红利、消费趋势、产业机遇以及合规挑战,旨在为有志于开拓泰国市场的中国企业提供行动指南,助力企业在东盟这片充满活力的土地上把握机遇、应对挑战、!实现可持续发展。
《2025欧美假日购物季营销指南》PDF下载
2025年美国假日购物季零售额预计同比仅增长1.2%,总销售额约1.359万亿美元,虽仍保持正增长,但为2009年以来最低增速,市场正在步入低增长的新常态。
《2025年跨境电商东南亚市场进入战略白皮书》PDF下载
东南亚电商,正以惊人的速度复刻中国电商高速增长的黄金时代。2024年东南亚电商GMV达到1284亿美元,短短5年涨幅超过3倍。全球电商2024年GMV增幅最快的十大市场中,东南亚独占四席。东南亚是拥有约6.7亿人口的广阔市场,在现今全球关税的不确定性大格局下,因其电商基建完善,利好的贸易政策,和更高的年轻人口占比,成为跨境卖家生意拓张焦点之一。
《2025年TikTok Shop玩具品类行业报告(欧美站)》PDF下载
分析TikTok Shop美国市场、英国市场、西班牙市场、墨西哥市场等主流市场点短视频及直播电商数据,选取TikTok与玩具爱好品类相关的内容进行分析报告。
《2025 洗护品类趋势与创新洞察》PDF下载
本报告独特价值:将消费者的“行为结果”据),揭示消费者深层心理动机、并能精准预判未来增长机会
《亚马逊双轨增长指南》PDF下载
亚马逊以“以客户为中心”为核心理念,通过整合B2B与B2C的全渠道服务,帮助卖家实现“一店双拓”-- 一次上架,同步触达个人消费者与企业买家,获得双重收益。同时,基于Direct to Buyer(直接触达买家)的模式,更能有效减少中间环节,提升利润空间与品牌掌控力。
《亚马逊全球线上商采趋势与区域洞察》PDF下载
随着全球企业数字化转型的深入推进,B2B商采有望成为下一个万亿级别的蓝海市场然而,中国卖家在开拓海外企业商采市场时往往面临着一个关键挑战:难以准确把握海外企业买家的商采行为和决策模式。这种认知偏差不仅影响了产品开发方向,也制约了市场拓展策略的制定。
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
跨境学院
跨境电商大小事,尽在跨境学院。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
AMZ123卖家导航
这个人很懒,还没有自我介绍
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
AMZ123选品观察员
选品推荐及选品技巧分享。
首页
跨境头条
文章详情
遥遥领先的OpenAI慢下来了
白鲸出海
2024-05-14 22:01
1120

“如果发布的是 GPT-5,那 OpenAI 依然遥遥领先。如果是 AI Search 或者是语音助手,那就说明 OpenAI 没落了。”

一位 AI 大模型从业者告诉虎嗅,业内对 OpenAI 的期待太高,除非是 GPT-5 这样的颠覆式创新,否则很难满足观众的“胃口”。

虽然 Sam Altman 在 OpenAI 线上直播前,已经预告不会发布 GPT-5(或 GPT-4.5),但外界对 OpenAI 的期待早已是九牛拉不转了。

北京时间 5 月 14 日凌晨,OpenAI 公布了最新的 GPT-4o,o 代表 Omnimodel(全能模型)。20 多分钟的演示直播,展示了远超当前所有语音助手的 AI 交互体验,与外媒此前透露的消息基本重合。

虽然 GPT-4o 的演示效果仍可称得上“炸裂”,但业内人士普遍认为很难配得上 Altman 预告中的“魔法”二字。很多人认为,这些功能性的产品,都是“偏离 OpenAI 使命”的。

OpenAI 的 PR 团队似乎也预料到了这种舆论走向。发布会现场以及会后 Altman 发布的博客中对此解释道:

“我们使命的一个关键部分是将非常强大的人工智能工具免费(或以优惠的价格)提供给人们。我非常自豪我们在 ChatGPT 中免费提供了世界上最好的模型,没有广告或类似的东西。 

当我们创办 OpenAI 时,我们最初的想法是我们要创造人工智能并利用它为世界创造各种利益。相反,现在看起来我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,让我们所有人都受益。”

遥遥领先的 GPT-4o

“如果我们必须等待 5 秒钟才能得到‘每个’回复,用户体验就会一落千丈。即使合成音频本身听起来很真实,它也会破坏沉浸感,让人感觉毫无生气。”

在 OpenAI 发布会前夕,英伟达 Embodied AI 负责人 Jim Fan 在 X 上预测了 OpenAI 会发布的语音助手,并提出:

几乎所有的语音 AI 都会经历三个阶段:

1. 语音识别或“ASR”:音频->文本1,例如 Whisper;

2. 计划下一步要说什么的 LLM:text1 -> text2;

3. 语音合成或“TTS”:text2 ->音频,例如 ElevenLabs 或 VALL-E。

经历 3 个阶段会导致巨大的延迟。

GPT-4o 在响应速度方面,几乎解决了延迟问题。GPT-4o 的响应音频输入的最短时长为 232 毫秒,平均响应时长 320 毫秒,几乎与人类相似。没有使用 GPT-4o 的 ChatGPT 语音对话功能平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒(GPT-4)。

GPT-4o 不仅通过缩短延迟极大地提升了体验,还在 GPT-4 的基础上做了很多升级包括:

1、极佳的多模态交互能力,包括语音、视频,以及屏幕共享。

2、可以实时识别和理解人类的表情,文字,以及数学公式。

3、交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌。

4、超低延时,且可以在对话中实时打断 AI,增加信息或开启新话题。

5、所有 ChatGPT 用户均可免费使用(有使用上限)。

6、速度是 GPT-4 Turbo 的 2 倍,API 成本低 50%,速率限制高 5 倍。

“没落”的 OpenAI

“这些局限性的突破都是创新。”

有业内专家认为,GPT-4o 的多模态能力只是“看起来”很好,实际上 OpenAI 并未展示对于视觉多模态来说真正算是“突破”的功能。

这里我们按大模型行业的习惯,对比一下隔壁厂 Anthropic 的 Claude 3。

Claude 3 的技术文档中提到,“虽然 Claude 的图像理解能力是尖端的,但需要注意一些局限性”。

其中包括:

1、人物识别:Claude 不能用于在图像中识别(即姓名)人物,并将拒绝这样做。

2、准确性:Claude 在解释 200 像素以下的低质量、旋转或非常小的图像时,可能会产生幻觉或犯错误。

3、空间推理:克劳德的空间推理能力有限。它可能很难完成需要精确定位或布局的任务,例如读取模拟钟面或描述棋子的确切位置。

4、计数:Claude 可以给出图像中物体的近似计数,但可能并不总是精确准确的,特别是对于大量小物体。

5、AI 生成的图像:Claude 不知道图像是否是人工智能生成的,如果被问到,可能不正确。不要依赖它来检测假图像或合成图像。

6、不适当的内容:Claude 不会处理违反我们可接受使用政策的不适当或露骨的图像。

7、医疗保健应用:虽然 Claude 可以分析一般医学图像,但它不是为解释 CT 或 MRI 等复杂诊断扫描而设计的。Claude 的输出不应被视为专业医疗建议或诊断的替代品。

在 GPT-4o 网站发布的案例中,有一些与“空间推理”有相关的能力,但仍难算得上突破。

此外,从发布会现场演示中 GPT-4o 输出的内容很容易看出,其模型能力与 GPT-4 相差并不大。

GPT-4o 跑分

虽然模型可以在对话中增加语气,甚至即兴演唱,但对话内容还是与 GPT-4 一样缺乏细节和创造力。

此外,发布会后 OpenAI 官网还发布了 GPT-4o 的一系列应用案例探索。包括:照片转漫画风格;会议记录;图片合成;基于图片的 3D 内容生成;手写体、草稿生成;风格化的海报,以及连环画生成;艺术字体生成等。

而这些能力中,照片转漫画风格、会议记录等,也都是一些看起来很普通的文生图或者是AI大模型功能。

能挑战现有的商业模式吗?

“我注册 5 个免费的 ChatGPT 账号,是不是就不需要每月花 20 美元订阅 ChatGPT Plus 呢?”

OpenAI 公布的 GPT-4o 使用政策是 ChatGPT Plus 用户比限制普通用户的流量限制高 5 倍。

GPT-4o 对所有人免费,首先挑战的似乎是 OpenAI 自己的商业模型。

第三方市场分析平台 Sensor Tower 公布的数据显示,过去一个月中,ChatGPT 在全球 App Store 中的下载量为 700 万,订阅收入 1200 万美元;全球 Google Play 市场的下载量为 9000 万,订阅收入 300 万美元。

目前,ChatGPT Plus 在两个应用商店的订阅价格均为 19.99 美元。由订阅数据推断,ChatGPT Plus 过去一个月中,通过应用商店付费的订阅用户数为 75 万。虽然 ChatGPT Plus 还有大量的直接付费用户,但从手机端的收入来看,每年进项才不到 2 亿美元,再翻几倍也很难撑起 OpenAI 近千亿的估值。

由此来看,OpenAI 在个人用户充值方面,其实并不需要考虑太多。

更何况 GPT-4o 主打体验好,如果你跟 AI 聊着聊着就断了,还要换账号重新聊,那你会不会愤然充值呢?

“最初的 ChatGPT 暗示了语言界面的可能性;这个新事物给人的感觉有本质上的不同。它快速、智能、有趣、自然且有帮助。”

Sam Altman 的最新博客中提到了“语言界面的可能性”,这也正是 GPT-4o 接下来可能要做的:挑战所有 GUI(图形交互界面),以及想要在 LUI(语音交互界面)上发力的人。

结合近期外媒透出的 OpenAI 与苹果合作的消息,可以猜测 GPT-4o 可能很快就要对所有 AI PC、AI 手机的厂商“抛橄榄枝”或是“掀桌子”。

不管是哪种语音助手或是 AI 大模型,对于 AIPC、AI 手机来说核心价值都是优化体验,而 GPT-4o 一下把体验优化到了极致。

GPT-4o 很可能会卷到所有已知的 App,甚至是 SaaS 行业。过去一年多时间里,市场上所有已经开发和正在开发的 AI Agent 都会面临威胁。

某位资源聚合类 app 产品经理曾对虎嗅表示,“我的操作流程就是产品的核心,如果操作流程被你 ChatGPT 优化了,那相当于我的 App 没价值了。”

试想,如果订外卖的 App,UI 变成了一句话“给我订餐”,那打开美团还是打开饿了么,对于用户来说就一样了。

厂商的下一步只能是压缩供应链、生态的利润空间,甚至是恶性价格战。

从目前的形式来看,其他厂商要在模型能力上打败 OpenAI 恐怕还需要一段时间。

产品要对标 OpenAI,可能只有通过做更“便宜”的模型了。

对于国内产业的影响

“最近忙死了,没顾上关注他们。”

一位工业 AI 大模型创始人告诉虎嗅,近期一直在忙着沟通战略合作、产品发布、客户交流资本交流,完全没有时间关注 OpenAI 这种发布。

OpenAI 发布前,虎嗅也询问了多位来自各行各业的国内 AI 从业者,他们对 OpenAI 最新发布的预测与看法都很一致:非常期待,但与我无关。

一位从业者表示,从国内目前的进度来看,要在短期内追上 OpenAI 不太现实。所以关心 OpenAI 发布了什么,最多也就是看看最新的技术方向。

目前国内公司在 AI 大模型研发方面,普遍比较关注工程化和垂直模型,这些比较务实、容易变现的方向。

在工程方面,近期蹿红的 Deepseek 就正在国内大模型行业中掀起 Token 的价格战。在垂直模型方面,多位业内人士告诉虎嗅,短期内小模型和垂直模型的研发,基本都不会受到 OpenAI 的裹挟。

“有时候 OpenAI 的技术方向也不是很值得借鉴。”一位模型专家对虎嗅表示,Sora 就是个很好的例子,2024 年 2 月 OpenAI 发布了视频模型 Sora,实现了 60 秒的视频稳定输出。虽然看起来效果很好,但后续的实践几乎没有,落地速度也非常慢。

在 Sora 之前,国内很多在文生视频领域发力的公司和机构已经实现了 15 秒稳定视频生成,而 Sora 出来以后,一些公司的研发、融资、产品节奏都被打乱了,甚至使整个文生视频行业的发展演变成了一场“技术的大跃进”。

所幸,这次 GPT-4o 与 Sora 大有不同。OpenAI CTO Muri Murati 表示,在接下来的几周内,我们将继续我们的迭代部署,为您提供所有功能。

发布会结束不久,GPT-4o 就已经可以上线试用了。

1
咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部