AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

AI|MiniMax和月之暗面:中国AI创业公司的两种路径和共同难题

2284
2025-11-26 17:58
2025-11-26 17:58
2284


一时的技术成果或者用户增长,很难成为 AI 公司的竞争优势。



本文经授权转自《晚点LatePost》(ID:postlate)

作者:王与桐,编辑:贺乾明


大会结束,月之暗面创始人杨植麟被观众层层围住,有人举着手机想加他微信,有人追到茶歇区要签名。投资这家公司的机构,拉一整大巴的投资人去拜访他,“让一线投资人见见好的创业者是什么样子”。


MiniMax 创始人闫俊杰很少公开露面,网上能搜到的照片没几张。这无碍他在投资行业的热度。MiniMax 估值长期排在中国大模型创业公司前列,投资人要靠 “抢” 才能拿到份额。


这一切发生在 DeepSeek 爆火前。今年初,两家明星创业公司一起被挤到聚光灯边缘。


春节后的第一个工作周,两家公司的二号位各自召开了内部会议,讨论 DeepSeek 之后该怎么做增长。月之暗面在长达6个小时的会议后,决定暂缓投放,回归产品和技术本身。在 MiniMax,DAU 被称为 “虚荣指标”。


两家公司有员工觉得,这是一种 “解脱”:不用再绝望地消耗资源与字节等巨头竞争,也无需拼命证明 “中国能诞生 OpenAI”。问题已经失去意义。


在这之后,两家公司取得更好的技术进展。MiniMax 的视频生成模型,宣称在一些场景超过 Google 的 Veo3;其开源的 M2 文本模型,在部分测评中位列全球开源模型第一。月之暗面的 K2 模型,被称为 “中国又一个 DeepSeek”;近期发布的 K2 Thinking,宣称部分基准测试得分超过 GPT-5。


他们的压力并没有消失。MiniMax 和月之暗面曾用较少的资源证明过增长潜力。两家公司因此拿到中国大模型创投领域大多数资金,总计超过200亿元人民币。


这笔钱很少,让他们难与字节、阿里,甚至是 DeepSeek 正面竞争,或者是对标 OpenAI、Anthropic 这些海外同行。但这笔钱又足够多,让他们无法收敛野心。


闫俊杰和杨植麟是中国大模型领域的 “双子星”。他们几乎在同一时间走进公众视野,讲着相似的理想——相信技术,追求 AGI;也都在融资、流量、争议与期待中长期被同一个问题拷问:中国的 OpenAI,会诞生在哪?


两人的相同之处并不多。闫俊杰崇尚 “系统理性”,想要在庞杂的约束中寻找最优解。他把公司视作可以设计和优化的函数,坚信组织的力量能够催生创新与增长。


他敢于决断,然后接受冲突,迅速迭代。他创办的 MiniMax,在技术路线上选择多模态模型,是中国最早推出 MoE 模型的团队之一。


杨植麟则相信人才的力量,公司的核心产品 “Kimi” 也是他的英文名,个人光环与公司品牌深度绑定。


他看重 “共识驱动”,相信少数精英能引领方向。与 MiniMax 不同,他创办的月之暗面更执着于无损的语言模型本身的力量,一度不怎么在意 MoE。


现在他们要解决的问题是一样的。之前三年过山车般的经历表明,一时的技术成果或者用户增长,很难成为竞争优势。他们还要建立让技术和用户增长持续产生的组织能力。



技术 CEO、管家二号位


2017年,在商汤担任 CEO 助理的贠烨祎,就向云启资本合伙人、也是她在约翰霍普金斯的师兄陈昱提出过创业设想,但因为缺合伙人没能推进。四年后,她再次找到陈昱:“我终于找到创业搭子了。”


这个搭子,就是闫俊杰。


闫俊杰是典型的 “系统内优胜者”。他出生于1989年,在河南的县城长大,博士就读于中国科学院自动化所。


2014年博士毕业后,闫俊杰加入商汤,在这家核心成员大多来自香港中文大学和海外高校博士生的公司中,他只用了五年时间,就从算法工程师一路做到最年轻的副总裁、研究院副院长,负责智慧城市、游戏等多个业务。他参与了商汤底层算法到工程落地的体系建设,发表上百篇论文。


闫俊杰第一次见陈昱,就给对方留下深刻印象:一是光头,“一看就是绝顶聪明”;二是闫俊杰跟他讲,可以用基础模型,解决更加通用和泛化的问题。


“现在看来当然是常识,但在行业都还在讲用若干小模型解决复杂问题的2021年,令人耳目一新。” 陈昱说。


2021年底,闫俊杰离职创办 MiniMax。闫俊杰负责技术,贠烨祎负责技术之外的产品、融资等事务。一位 MiniMax 早期人士说:“闫俊杰想要做全世界最伟大的技术,贠烨祎想做全世界最伟大的公司。”


闫俊杰把 AGI 视为 “普通人每天都会用的一个产品、一个服务”。一位 MiniMax 前员工说,他加入 MiniMax,是被会议室墙上的一行字打动——Intelligence for Everyone。


MiniMax 的第一轮融资印证了这套故事的吸引力:闫俊杰在与高瓴创始人张磊聊过后,高瓴直接取代云启,拿下首轮2000万美元融资的领投。MiniMax 投后估值达到2亿美元。


月之暗面起步没那么顺利。2023年初,刚成立的月之暗面想融资2000万美元还不顺利。在投资人眼里,杨植麟只有 “技术” 标签,缺少产品、管理、融资经验。


出生于1992年的杨植麟是广东汕头人,头发茂密,他在卡耐基梅隆读博期间,发布的大语言模型相关论文 XLNet 和 Transformer-XL,现在引用接近两万。


同样在读博士期间,27岁的杨植麟参与创办 AI 公司循环智能。他在自己的个人主页上写道:“我所有工作的目标,包括研究和商业,都是最大化人工智能的价值。”


月之暗面的起点,是杨植麟在循环智能负责的团队。2021年,杨植麟主导了华为云合作的千亿级盘古大模型,团队就叫 “Moonshot”。两年后,他推动 “Moonshot” 从循环独立,成立月之暗面。他认为要 “专门建一家公司,而不是从别的业务里拐出一条支线。”


起步融资遇挫,杨植麟想到循环智能的投资人、也是他的清华学姐张予彤。在2019年,还在金沙江创投的张予彤就主导投资了循环智能。


在张予彤的推动下,月之暗面最终在2023年上半年完成第一笔融资,红杉、真格、Monolith 的下注让杨植麟赶上了窗口期。张予彤如今在月之暗面的角色是二号位,与贠烨祎在 MiniMax 类似,负责融资、增长等业务。不过张予彤的加入,后来也让月之暗面陷入潜在的利益冲突与仲裁风波


虽然起步方式不同,两位创始人在公司的发展上做出了类似的选择:用大半年时间研发基础模型后,尝试做 C 端产品,并迎来了第一个爆发点。


2022年中,MiniMax 投入数名员工,用一个月的时间做出了 AI 对话产品 Glow,用户可以在这个产品上自由创建角色,并和角色对话。他们本想用游戏化的方式收集数据,“没人想到这个产品会一炮而红”。Glow 上线4个月后注册用户超过五百万。


“Glow 出乎意料的成功让公司的重心转向了 C 端产品。” 一位 MiniMax 员工说。2023年底,MiniMax 有约300名员工,其中近200人在产品线,远超同类大模型创业公司。


月之暗面的故事类似。2023年8月,他们第一个模型训练到后期,开始立项做 AI 助理 Kimi,当时整个公司只有50人,预期只是 “展示模型能力”。上线之后,Kimi 连续数月月活用户环比增长超过100%。


“用了最少的钱,最少的人,最少的卡,做到了最好的状态。” Monolith 创始合伙人曹曦曾如此评价月之暗面,他的基金跟进了月之暗面三轮融资。


到2023年底再融资时,月之暗面成为资本追捧的对象。小红书投前9亿美元估值的价格很快被阿里压过:投资近8亿美元,将月之暗面的估值抬升到23.4亿美元。


这让它的估值与2021年就成立的 MiniMax 并驾齐驱,膨胀速度远超上一代 AI 公司。同一时间,MiniMax 也拿到阿里投资的6亿美元资源,估值又超过月之暗面。


两笔融资2024年初完成,合计超14亿美元(100亿元人民币),超过中国大模型创投领域上一年公开融资总额,改写了行业格局。



早期增长吸引大额投资,也成了竞争中的弱点


大额资本的注入放大了两位创始人的野心。2024年初,闫俊杰定下激进目标:技术达到 GPT-4 的水平,把产品用户规模翻十倍,单个产品能突破千万 DAU。


这一年的 MiniMax 很像字节跳动:同时推进多条产品线,从 Talkie、星野到海螺 AI,还有几个没有上线过就放弃的产品。年中,MiniMax 员工总数增长到400左右。


公司成立刚一年,杨植麟定下覆盖多个方向的目标:技术上深入无损长文本、视频生成、多阶段推理;产品上追求 DAU 增长、出海;并加大商业化力度。到年中,信奉精英策略的月之暗面,员工也翻了一番。


问题跟着爆发。MiniMax 陷入纠结与摇摆,这年1月,MiniMax 视觉模型团队开始押注视频模型;3月,他们抽调星野 /Talkie 和开放平台的一部分研发人员,做产品形态类似即梦的视频生成项目;5月,他们放弃这个产品形态项目。


到了8月,高层要求在一周内让模型 “能用”,要赶上公司的 Open Day。一位员工回忆,那时模型生成的人物 “手脚还在乱飞”,而承载视频模型的产品项目早已放弃。


最终团队先做了网页版上线,让用户测试,移动端往后延,嫁接到原本主打语音交互的海螺 AI 上。不过就像 Glow 一样,他们对这个产品期望不高。但第二个月,其网页端访问量就接近500万。


一位 MiniMax 员工回忆,2024年的大部分时间,他们都被这种 “既要又要” 的气氛影响——公司既想增长,又不想将模型往 “软色情” 方向调整,但 “一健康就不增长”。高层一度要求暂停在 Talkie、星野等产品上增加广告位,但收入下滑后又陷入焦虑。


闫俊杰说,他经历过技术被资本裹挟的过程:“如果一家企业必须靠不断融资才能前进,那它优化的就不再是产品,而是如何说服投资人继续给钱。”


月之暗面的精英策略也没有在新方向上发挥太多效果。他们想要复现 Sora 的视频模型,但效果一直未及预期,唯一的 “亮相”,是几位联合创始人在朋友圈里发布的几条视频,称由自家视频模型生成;月之暗面低调上线的两款出海产品 Ohai 和 Noisee,几个月后便停止运营。


在这期间,月之暗面创始团队出售股份,迅速在创投领域引发风波。关键不在于卖股份,而在于月之暗面背后的叙事失调。产品未定型、格局未稳固的时刻,创始团队出售股份,很容易被理解为 “急于落袋为安”。


风波之中,我们曾问他此事,他以一句 “Fake news” 简短作答。


2024年中,“大模型进展放缓” 的论调开始流行。当技术可能很难带来巨大突破时,市场和投资人衡量公司增长潜力的指标,转向最直接的 DAU 数据。


在月之暗面,张予彤主导大规模投流,拉高了 B 站等平台的 AI 产品投流价格。MiniMax 也在高层反复的纠结后,最终决定跟进。


他们再一次被资本看好。MiniMax 拿到腾讯等机构的投资;8月,月之暗面获得腾讯、高榕创投等3亿美元融资。资本意志开始更深地介入公司经营,部分投资人频繁给他们提供增长 “建议”:哪些海外 AI 应用公司增长更快,哪些投流策略更高效,哪类产品功能更能带来留存。


可一同出现的还有更强的对手。字节跳动发动了饱和式进攻:产品线覆盖一切,从生产力到娱乐,从助手到硬件。我们了解到,字节还严格控制外部 AI 产品在抖音上的投放,而豆包等作为字节系产品,还能享受折扣。


一位月之暗面员工回忆,那是公司的士气低谷,“面对字节这样的敌人,是打不过的。” 一位投资人称,如果不推动公司转型,“除了硬着头皮跟字节拼消耗,似乎别无他法”。


到这一年10月,一场数位投了大模型的投资人参加的聚会中,他们开始讨论 “如何能卖掉部分手里的大模型创业公司股份?”



追求技术可以是一种选择,但空间越来越小


DeepSeek “解救” 了 MiniMax 和月之暗面。他们靠着远超市场预期的模型,没花一分钱投流,就在一周内吸引了数千万用户,制造了中国自己的 ChatGPT 时刻。


“如果你在对手更强的赛道,那你就没有胜的可能。” 一位月之暗面员工说,DeepSeek 带来的热潮,让他明显感觉到公司内部情绪有了好转,“只要技术够强,就有机会逆天改命。”


月之暗面不再更新 K1 系列的模型,集中资源投入基础算法与新模型 K2。这个新模型被寄予厚望,月之暗面研发团队几乎全员参与,杨植麟本人也亲自下场写代码。


张予彤在社交平台上写道,“小伙伴为了这次发布直接睡在公司里”,配图是一个带有 “离发布还有0天” 标语的图片,标语下是一张沙发床。


几个月高强度开发后,月之暗面在7月发布并开源万亿参数的 MoE 模型 Kimi K2,宣称在自主编程、工具调用和数学推理等维度上超过 DeepSeek-V3 和阿里 Qwen3。在这之前,杨植麟相信 “闭源是正确的路”。《自然》杂志网站的一篇文章称其为 “中国的又一个 DeepSeek 时刻”。


MiniMax 也完成了类似的聚焦。他们将重点从 “模型与产品并重” 收缩到 “模型优先”。视频、语音等多模态模型依然在研究,这是他们有优势的方向。我们了解到,闫俊杰还把一部分产品的员工转到模型团队,并为文本模型重新分配算力,核心资源集中到语言模型的基础能力上,增加数学与编程数据的比重。他之前说,MiniMax 没必要为了一篇新闻稿,就训练一个类似 o1 那样的推理模型。


他们10月开源语言模型 M2 时,强调它的编程和推理能力突出,使用量在 OpenRouter 上已经增长到了前五。“应该创业第一天就开源。” 闫俊杰年初说。


两家公司似乎回到了刚创业时的状态,都把提升模型的能力当作主线,投资方也不再过多给公司提建议。公司的经营依赖创业者本身管理能力。


闫俊杰看上去温和,但一旦做出决定,执行起来极为坚决。在 MiniMax 创业初期,团队曾尝试过 3D 数字人方向。项目尚未上线,闫俊杰判断这条路与公司长期技术路线不符,就立即叫停。项目解散,刚组建的团队经历第一轮震荡。


2024年起,MiniMax 的中层开始密集流动:产品负责人、商务负责人、数据科学负责人、增长负责人、战投负责人等陆续离开。比如 MiniMax 对齐团队两年内换了三任负责人——第一任因与闫俊杰激烈争论技术进展,被降为普通工程师;第二任由下属提拔,半年后离职。MiniMax 早期的一百名员工,如今已走了一半。


“不是同路人的这些同事,我会请他们离开。我已经请走了几位。” 闫俊杰曾在公司全员会上说。


在他看来,好的成果不是某个人灵光一现的产物,而是科学方法和团队配合下的必然发现,哪怕个人能力不算顶尖,只要能让团队跑得更快,就是合适的人才。


闫俊杰认为,管理公司就是优化函数,目标是商业化效率、调用量等变量,管理的核心任务就是找到 “梯度下降最快的方向”,不断逼近最优解。


MiniMax 的很多决策,比如不做 3D、选择 MoE 架构、做视频模型,都属于 “算出来的结果”。甚至 MiniMax 每两周一次的全员分享会,也叫 “CD”(Coordinate Decent 算法)。 


杨植麟相信那些能提出新想法的人才,“因为在这个领域,创新本身最有价值”。他愿意为了招揽一名自己欣赏的技术人才,从北京飞到深圳,聊上十个小时,第二天赶早班机返回;也会让优秀的研究者自己一个人在异地自由工作。


他倾向于先达成共识,再迅速行动。月之暗面的第一款模型亮相时,主打20万长文本上下文。但一开始,核心团队有人并不看好这个方向。一位月之暗面早期员工回忆,2023年5月公司就有人提过做长文本,却被其他人否决,理由是算法视角里,这只是压缩问题,是工程活,不是技术突破。这个方向就没有推进。


两个月后,Anthropic 发布处理50万文本的 Claude 模型,引发行业震动。长文本成为月之暗面内部共识。“Lossless long context is everything” 成了杨植麟经常提的一句话。


但如今 AI 公司把追求模型能力当做公司经营的核心变得愈发困难。早期的 OpenAI 是一个参考答案。他们的团队延续了 “学术式” 的工作节奏,用实验和试错推动技术研究,领先技术成果诞生后加上山姆·阿尔特曼(Sam Altman)从 YC 带来的增长策略,推动公司持续发展。DeepSeek 的 “学术循环” 模式——批判性思考、原子化创新、推动科学边界——也是一种策略,但它不用太过于关注商业化和用户增长。


MiniMax 和月之暗面很难找到这样的空间和资源。这场资本密集游戏里,资金、算力和生态支持至关重要。OpenAI 的估值已达到5000亿美元,要顶着万亿美元估值上市;xAI 和 Anthropic 的估值也都逼近2000亿美元。而 MiniMax 和月之暗面的估值都在40亿美元左右。这让谁能成为中国 OpenAI 的问题变得没有意义。


体量较大的美元基金退潮后,中国拥有大规模资金的巨头不愿为创业公司持续输血,反而成为 AI 公司的竞争对手。阿里、字节、腾讯,甚至是 DeepSeek,研发基础模型都有主营业务(电商、广告、量化)供血,短期没有盈利压力。


MiniMax 和月之暗面都在尝试用更专业的功能(月之暗面的 OK Computer、深度研究;MiniMax 的专业模式)吸引用户付费订阅。但只要字节等公司的同类产品免费,去年下半年的竞争问题必然会再次出现。


他们还在继续找钱。市场消息称,MiniMax 正筹备赴港上市。月之暗面又开了一轮新融资。


大模型注定是需要几百亿美元,甚至上千亿美元投入的游戏。创业公司想要走完这条路,创始人们必须证明,这是一场需要他们参与的长期探索,才能获得更多的理解和支持。


这是一道更难的证明题:在巨头林立、算力稀缺、资本收缩的市场中,是否还有空间容纳一种既做基础研究、又不属于任何巨头的 AI 公司?


这不仅需要更多技术突破,也需要一种在当前中国环境下罕见的能力——靠投资机构和业务收入,维持一支高密度的研究团队持续产出。

3.26 宁波wayfair沙龙-文章页底部
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
全球电商平台占比将达36%,澳洲市场竞争加剧
AMZ123获悉,近日,根据 Shippit 发布的《2026年电商配送报告》,随着亚马逊、Temu 和 Shein 等全球电商平台加速扩张,澳大利亚本土品牌正面临日益加剧的竞争压力,配送速度、履约效率以及退货体验方面的运营差距正在被不断放大。报告指出,预计到 2026 年,全球电商平台将占据澳大利亚电商市场 36% 的份额。这一变化与消费者对配送速度、稳定性以及售后服务便捷性的期望密切相关。报告显示,澳大利亚整体市场的配送速度已有明显提升,当前包裹平均送达时间为 1.7 天,但品牌在结账页面向消费者承诺的平均配送时间仍为 5.2 天,两者之间存在 3.5 天的差距。
全球支付平台Waffo完成3000万美元融资
Fin123获悉,2月4日,全球支付平台Waffo完成3000万美元融资,其最新一轮A轮融资规模超过1500万美元。本轮融资由总部位于伦敦的金融科技投资公司Illuminate Financial与现有投资者高榕创投共同领投,汇丰与BAI Capital参与投资。值得关注的是,Illuminate Financial的背后战略支持者包括纽约梅隆银行、摩根大通、花旗集团、巴克莱银行等全球顶尖金融机构。据悉,Waffo的核心业务是为游戏、人工智能(AI)、SaaS和数字产品领域的企业提供现代化、可扩展的全球支付与变现基础设施。
50%消费者使用AI网购,AI正重塑英国品牌运营方式
AMZ123获悉,近日,智能配送平台Metapack 联合 Retail Economics 发布《2026年电商配送基准报告》。报告显示,英国品牌普遍预计2026年线上销售增速将进一步加快,人工智能(AI)在购物体验和配送环节的广泛应用,被视为推动转化率提升、履约效率改善以及客户忠诚度增强的关键动力。本次研究基于对超过 8,000 名消费者和 400 家品牌的调研结果,系统分析了 AI 如何重塑消费者购物路径,以及品牌如何将 AI 投资直接与转化率、配送表现和线上销售增长挂钩,并将其视为 2026 年及以后增长的重要驱动因素。报告指出,消费者行为正在快速变化。
好市多1月营收达213亿美元,电商收入同比增长34%
AMZ123获悉,近日,好市多(Costco)发布了截至2026年2月1日的2026财年1月销售业绩报告。在宏观环境仍具挑战的背景下,好市多整体销售保持稳健增长,美国、加拿大及国际市场均实现正向增长,数字化相关销售表现尤为突出。以下为1月财务亮点:①净销售额为213.3亿美元,同比增长9.3%,去年同期为195.1亿美元。②美国同店销售增长5.8%。③加拿大同店销售增长11.4%。④其他国际市场同店销售增长9.5%。⑤公司整体同店销售增长7.1%。⑥电商销售增长34.4%。以下为2026财年前22周财务亮点:①前22周净销售额为1231.6亿美元,同比增长8.5%,去年同期为1135.5亿美元。
东莞过亿大卖遭TRO,400万资金被冻结!
跨境圈里,TRO最狠的地方不在“官司输赢”,而在“先把生意按停”。TRO落到谁头上,体验其实都差不多:链接出状态、回款受限、运营动作被迫停一停。区别在于承受力:小卖家是“伤筋动骨”,一年白干;头部卖家更像“主引擎熄火”,一旦头部链接和资金链同时被卡,损失会按天放大。近期AMZ123从业内听闻,东莞亿级大卖赵先生就经历了这样一次“被按停”,险些一夜之间破产后起死回生的两个月。为还原事件的关键节点,AMZ123随后联系并采访了当事人赵先生及其代理律师团队。赵先生在采访中回忆称,这次“被按停”的经历,几乎让他第一次真正体会到:跨境卖家对TRO/PI的恐惧,很多时候来自后台,而不是法庭。赵先生的遭遇始于2025年10月。
沃尔玛计划推出跨境发货,美国商品可直达墨西哥和加拿大
AMZ123获悉,近日,据外媒报道,沃尔玛正准备在2026年初推出一项名为“Walmart Exports”的跨境发货计划,以进一步吸引使用其第三方履约服务的卖家。根据沃尔玛发给卖家的邮件信息,该项目将允许符合条件的商品从美国直接配送给墨西哥和加拿大的消费者,并计划在后续逐步拓展至更多国家。按照安排,符合条件的沃尔玛履约服务(Walmart Fulfillment Services,WFS)商品将自动加入该计划,卖家无需额外操作。与现有履约服务一致,商品的拣货、包装和运输将由沃尔玛负责完成。
速存!小规模跨境电商出口免税+备案+申报全指引(多地区实操对照表)
做跨境的小规模老板们注意了!出口货物能享受增值税免税政策但这并非“自动生效”备案要求、申报表填报、权限开通各环节藏着不少实操细节不同地区政策还存在差异今天AMZCFO这篇干货把小规模出口免税的核心政策、全国多地区实操细则、申报避坑要点一次性讲透从备案到填报全程拆解让你合规享受免税跨境经营更省心!作为跨境电商中小卖家·小规模纳税人出口货物能不能免税?·要不要做退(免)税备案?·申报表第13栏填不了怎么办? 一、核心政策定调:小规模出口货物,增值税能免税很多小规模外贸企业会混淆“出口免税”和“出口退税”先把核心规则记牢从源头避开认知误区:小规模纳税人出口货物符合条件可享受增值税免税政策但不适用出口退税政策这是国家税务
26年美国情人节宠物消费创新高,支出将达21亿美元
AMZ123获悉,近日,NRF(美国全国零售联合会)的数据显示,2026年消费者在情人节为宠物购买礼物的支出预计将达到创纪录的21亿美元。相比朋友或同事,人们更有可能为自己的宠物购买情人节礼物。今年,计划在情人节为宠物购买礼物的人群比例已超过三分之一,而十年前这一比例仅为19%,人均相关支出在此期间增长了三倍以上。围绕宠物情人节消费,市场提供了丰富的选择,从宠物巧克力造型玩具、心形毛绒玩具,到面向小型宠物的主题活动盒、鸟类玩具等,覆盖不同宠物类型。同时,一些消费者还会为宠物选择节日造型用品,例如粉色宠物指甲油或临时毛发染色产品,让宠物更具节日氛围。情人节并非个例,宠物正被越来越多地纳入各类节日和纪念日中。
今年4月,亚马逊或继续裁员!
裁员、重组、压预算,亚马逊的“紧日子”并没有结束。亚马逊的裁员潮已持续数月。路透社报道称,自2025年10月以来,亚马逊企业端累计宣布/推进的岗位调整规模约3万人,其中2026年1月下旬公开确认的一轮约1.6万人。而进入2月,裁撤开始从“总量口径”走向“执行清单”。AMZ123获悉,多份美国地方 WARN 文件与媒体披露显示,亚马逊下一轮裁撤的落地信息进一步明朗:相关裁撤的执行节点主要落在2026年4月28日前后,并将延续至6月下旬。从披露细节看,本轮裁撤呈现出两个关键词:技术岗位居多、区域集中落地。
亚马逊如何找到你的竞争对手?
竞争对手分析是亚马逊精细化运营的核心环节,精准定位竞品能够帮助你明确市场边界、优化产品策略、制定高效推广计划。本文将从判定标准、实操途径、核心原则三个维度,为你提供一套可直接落地的竞品挖掘方法。一、明确竞争对手只有先界定“谁是你的竞争对手”,后续的分析才有意义。判定的核心逻辑是:满足同一客户群体需求,具备高度可替代性。具体可通过以下4个维度精准筛选:相同的类目节点:优先选择与你的产品共享2-3级核心类目的ASIN。类目节点越精准,竞争相关性越强。相仿的外观设计:产品视觉呈现高度相似(如同款型、同材质外观),容易被消费者视为直接替代选项。近似的功能属性:核心功能与你的产品匹配,能够解决同一用户痛点。
物流危机来袭!欧洲超20个港口或罢工
跨境物流的状况向来讲究“天时地利人和”。此前,美国暴风雨天气袭来,严重受“天时”影响,导致美西航线大面积延误。最近物流圈的一个消息迅速席卷欧洲,这次缺失的却是至关重要的“人和”。近日,据外媒报道,欧洲基层码头工人工会联合会发布消息,地中海地区21个主要港口的工人计划于2月6日举行为期24小时的协调大罢工。AMZ123获悉,此次活动主要是由意大利热那亚的基层工会USB组织发起。热那亚港是意大利和欧盟在地中海的关键航运枢纽,2023年处理了274万个标准集装箱。作为罢工的发起地与核心枢纽,热那亚港的动向将对整个地中海航运产生重要影响。
30天卖了4万单,它凭借“回忆杀”成TikTok销量王
我在TikTok上卖“情侣年鉴”已月入400万+
全网独家首个走通两次 KYC + 两次视频验证的账号在这里
三角鹿跨境,陪你走好跨境每一步。这轮亚马逊欧洲站扫号KYC中,三角鹿已经有账号完成了二次KYC并通过视频验证,流程已实际走通。接下来,下文将结合已经走通的案例,把这次扫号KYC的真实情况、关键变化,以及卖家该如何应对,完整地拆解给大家看。卖家们到底要如何应对这场“扫号风波”?在亚马逊进行KYC审核时,不同的账号会有不同的审核要求。理解这些KYC的类型,能帮助大家更好地准备和应对每一轮审核。下面是亚马逊常见的几种KYC类型(按提交的资料分),大家可以看看自己可能会遇到哪种情况:1、普通KYC需要提交的资料:公司注册证明、公司章程、法人地址证明(比如水电账单、银行账单等)。
中国电商平台增速放缓,1月韩国电商市场出现新变化
AMZ123获悉,近日,近期,韩国电商市场出现多重变化。一方面,中国电商平台跨境直购交易增速明显放缓;另一方面,受数据泄露事件影响,1月韩国本土电商平台用户流动加剧,市场格局出现新的调整迹象。据韩国国家数据机构2月3日公布的数据,截至2025年第四季度,中国跨境电商平台的直购交易规模为1.4737万亿韩元,同比增长6.3%。这是自2020年第一季度新冠疫情初期以来,时隔23个季度,中国跨境电商平台的直购交易增速首次降至个位数。2020年第一季度,中国跨境电商平台直购交易增速曾为9.6%。在AliExpress、Temu等中国跨境电商平台持续加大对韩国市场投入的背景下,交易增长却出现放缓,引发市场关注。
25年法国居民消费谨慎,Temu等低价平台受欢迎
AMZ123获悉,近日,根据Joko发布的《2025年法国人消费最多的TOP100商店》报告,该报告对2025年150万法国消费者银行交易进行了分析。2025年,法国居民在支出上更加谨慎,但并未放弃日常购物、时尚和休闲活动。报告显示,在整体预算紧张的背景下,低价仍然是驱动消费的核心因素,Shein、Vinted、Temu和Action在消费榜单中表现突出,同时大型平台依然在家庭支出中占据重要位置。根据Joko数据,E.Leclerc、家乐福、Intermarché和Système U等大型超市分别位列前四名。市场结构正在调整,Casino和Cora的门店收购增强了这些品牌的覆盖范围和吸引力。
Ozon将下调物流费,简化物流费用计算方式
AMZ123获悉,近日,Ozon宣布将于2026年4月6日起下调物流费用,并同步简化物流费用的计算方式。本次调整将同时适用于两种主要履约模式:商品存储和处理在平台仓库完成的FBO模式,以及由卖家自行存储和发货的FBS模式。Ozon将转向固定运输价格体系,费用将根据运输方向和商品体积区分,这一变化有助于提升物流成本的透明度和可预测性。在新方案下,物流费用整体将有所下降。对于FBO模式,5升及以上体积的商品配送成本将降低;对于FBS模式,几乎所有体积段的商品都将享受到更低的配送价格。与此同时,相关调整也将覆盖退货等逆向物流环节。
《2026独立站卖家日历》PDF下载
2026 独立站卖家日历 2026 全年营销节奏
《2025中东北非消费者数字经济报告》PDF下载
2025年的报告不仅持续跟踪数字经济的同比增长,也更深入:我们探讨了新兴技术对下一波数字化转型的影响力,还首次将中东北非国家及地区的消费者行为偏好与全球其他市场进行对比。
《2025年终大促旺季AI消费趋势报告》PDF下载
随着人工智能 AI的爆发式增长,如 ChatGPT、Perplexity 和Llama等交互式聊天机器人正在渐渐成为大众研究和推荐的首选工具。根据 AI智能体功能的更新迭代,目前已经可以完成网购下单、预订服务、及交易支付,现已被统称为 AI智能体电商Agentic Commerce,且其采用率正呈现出滚雪球式的增长。
《2025年全球二手奢侈品行业消费者洞察报告》PDF下载
当今,二手奢侈品时尚行业的商业格局不可忽视!从贝雷帽到高跟鞋,二手奢侈品正在改变消费者对奢侈品及自身购买力的看法。未来 10 年内,二手奢侈品市场预计将达到952亿美元。您的公司或品牌是否已做好充分准备,应对市场的变化?
《2025海外消费者数字经济报告》PDF下载
这份报告基于 YouGov 对全球 16 个市场18,000 名消费者的调研,探讨了信任如何影响电商经济中的消费行为(这是一个庞大的全球生态系统,每天通过数十亿次线上支付购买商品和服务)。该报告还参考了Checkout.com 自身的网络数据--数十亿个反映了资金如何在全球范围内 24 小时流动的数据点所展示的支付趋势。
《TikTok2026年趋势报告》PDF下载
在这份报告中,TikTok将这些变化提炼为三大关键趋势——真实(Reali-TEA)、探索(Curiosity Detours)与情绪回报(Emotional ROI),它们正共同推动用户增长方式与品牌营销逻辑的转变。
《2025 TikTok Shop 年度调研报告》PDF下载
在2025年,TikTok Shop“一站式卖全球”的愿景,正以内容场为战略支点,依托品牌托管等营运模式、AI驱动、达人带货和内容激励机制,系统性建构起一套全球化增长范式。基于此,TT123制作了这份《2025 TikTok Shop 年度调研报告》,旨在通过对2025年的深度复盘,帮助卖家把握短期波动的机会,锁定2026年的确定性方向。
《中国通用机械出海国别机会洞察报告》PDF下载
在全球制造业向智能化、绿色化深度转型与国内产业升级加速共振背景下,通用机械作为工业体系基础支撑,其技术创新与产业生态演化研究对强化产业链韧性、推动经济高质量发展具有重要战略意义。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
亚马逊全球开店
亚马逊全球开店官方公众号,致力于为中国跨境卖家提供最新,最全亚马逊全球开店资讯,运营干货分享及开店支持。
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
侃侃跨境那些事儿
不侃废话,挣钱要紧!
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
跨境学院
跨境电商大小事,尽在跨境学院。
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
首页
跨境头条
文章详情
AI|MiniMax和月之暗面:中国AI创业公司的两种路径和共同难题
36氪出海
2025-11-26 17:58
2285


一时的技术成果或者用户增长,很难成为 AI 公司的竞争优势。



本文经授权转自《晚点LatePost》(ID:postlate)

作者:王与桐,编辑:贺乾明


大会结束,月之暗面创始人杨植麟被观众层层围住,有人举着手机想加他微信,有人追到茶歇区要签名。投资这家公司的机构,拉一整大巴的投资人去拜访他,“让一线投资人见见好的创业者是什么样子”。


MiniMax 创始人闫俊杰很少公开露面,网上能搜到的照片没几张。这无碍他在投资行业的热度。MiniMax 估值长期排在中国大模型创业公司前列,投资人要靠 “抢” 才能拿到份额。


这一切发生在 DeepSeek 爆火前。今年初,两家明星创业公司一起被挤到聚光灯边缘。


春节后的第一个工作周,两家公司的二号位各自召开了内部会议,讨论 DeepSeek 之后该怎么做增长。月之暗面在长达6个小时的会议后,决定暂缓投放,回归产品和技术本身。在 MiniMax,DAU 被称为 “虚荣指标”。


两家公司有员工觉得,这是一种 “解脱”:不用再绝望地消耗资源与字节等巨头竞争,也无需拼命证明 “中国能诞生 OpenAI”。问题已经失去意义。


在这之后,两家公司取得更好的技术进展。MiniMax 的视频生成模型,宣称在一些场景超过 Google 的 Veo3;其开源的 M2 文本模型,在部分测评中位列全球开源模型第一。月之暗面的 K2 模型,被称为 “中国又一个 DeepSeek”;近期发布的 K2 Thinking,宣称部分基准测试得分超过 GPT-5。


他们的压力并没有消失。MiniMax 和月之暗面曾用较少的资源证明过增长潜力。两家公司因此拿到中国大模型创投领域大多数资金,总计超过200亿元人民币。


这笔钱很少,让他们难与字节、阿里,甚至是 DeepSeek 正面竞争,或者是对标 OpenAI、Anthropic 这些海外同行。但这笔钱又足够多,让他们无法收敛野心。


闫俊杰和杨植麟是中国大模型领域的 “双子星”。他们几乎在同一时间走进公众视野,讲着相似的理想——相信技术,追求 AGI;也都在融资、流量、争议与期待中长期被同一个问题拷问:中国的 OpenAI,会诞生在哪?


两人的相同之处并不多。闫俊杰崇尚 “系统理性”,想要在庞杂的约束中寻找最优解。他把公司视作可以设计和优化的函数,坚信组织的力量能够催生创新与增长。


他敢于决断,然后接受冲突,迅速迭代。他创办的 MiniMax,在技术路线上选择多模态模型,是中国最早推出 MoE 模型的团队之一。


杨植麟则相信人才的力量,公司的核心产品 “Kimi” 也是他的英文名,个人光环与公司品牌深度绑定。


他看重 “共识驱动”,相信少数精英能引领方向。与 MiniMax 不同,他创办的月之暗面更执着于无损的语言模型本身的力量,一度不怎么在意 MoE。


现在他们要解决的问题是一样的。之前三年过山车般的经历表明,一时的技术成果或者用户增长,很难成为竞争优势。他们还要建立让技术和用户增长持续产生的组织能力。



技术 CEO、管家二号位


2017年,在商汤担任 CEO 助理的贠烨祎,就向云启资本合伙人、也是她在约翰霍普金斯的师兄陈昱提出过创业设想,但因为缺合伙人没能推进。四年后,她再次找到陈昱:“我终于找到创业搭子了。”


这个搭子,就是闫俊杰。


闫俊杰是典型的 “系统内优胜者”。他出生于1989年,在河南的县城长大,博士就读于中国科学院自动化所。


2014年博士毕业后,闫俊杰加入商汤,在这家核心成员大多来自香港中文大学和海外高校博士生的公司中,他只用了五年时间,就从算法工程师一路做到最年轻的副总裁、研究院副院长,负责智慧城市、游戏等多个业务。他参与了商汤底层算法到工程落地的体系建设,发表上百篇论文。


闫俊杰第一次见陈昱,就给对方留下深刻印象:一是光头,“一看就是绝顶聪明”;二是闫俊杰跟他讲,可以用基础模型,解决更加通用和泛化的问题。


“现在看来当然是常识,但在行业都还在讲用若干小模型解决复杂问题的2021年,令人耳目一新。” 陈昱说。


2021年底,闫俊杰离职创办 MiniMax。闫俊杰负责技术,贠烨祎负责技术之外的产品、融资等事务。一位 MiniMax 早期人士说:“闫俊杰想要做全世界最伟大的技术,贠烨祎想做全世界最伟大的公司。”


闫俊杰把 AGI 视为 “普通人每天都会用的一个产品、一个服务”。一位 MiniMax 前员工说,他加入 MiniMax,是被会议室墙上的一行字打动——Intelligence for Everyone。


MiniMax 的第一轮融资印证了这套故事的吸引力:闫俊杰在与高瓴创始人张磊聊过后,高瓴直接取代云启,拿下首轮2000万美元融资的领投。MiniMax 投后估值达到2亿美元。


月之暗面起步没那么顺利。2023年初,刚成立的月之暗面想融资2000万美元还不顺利。在投资人眼里,杨植麟只有 “技术” 标签,缺少产品、管理、融资经验。


出生于1992年的杨植麟是广东汕头人,头发茂密,他在卡耐基梅隆读博期间,发布的大语言模型相关论文 XLNet 和 Transformer-XL,现在引用接近两万。


同样在读博士期间,27岁的杨植麟参与创办 AI 公司循环智能。他在自己的个人主页上写道:“我所有工作的目标,包括研究和商业,都是最大化人工智能的价值。”


月之暗面的起点,是杨植麟在循环智能负责的团队。2021年,杨植麟主导了华为云合作的千亿级盘古大模型,团队就叫 “Moonshot”。两年后,他推动 “Moonshot” 从循环独立,成立月之暗面。他认为要 “专门建一家公司,而不是从别的业务里拐出一条支线。”


起步融资遇挫,杨植麟想到循环智能的投资人、也是他的清华学姐张予彤。在2019年,还在金沙江创投的张予彤就主导投资了循环智能。


在张予彤的推动下,月之暗面最终在2023年上半年完成第一笔融资,红杉、真格、Monolith 的下注让杨植麟赶上了窗口期。张予彤如今在月之暗面的角色是二号位,与贠烨祎在 MiniMax 类似,负责融资、增长等业务。不过张予彤的加入,后来也让月之暗面陷入潜在的利益冲突与仲裁风波


虽然起步方式不同,两位创始人在公司的发展上做出了类似的选择:用大半年时间研发基础模型后,尝试做 C 端产品,并迎来了第一个爆发点。


2022年中,MiniMax 投入数名员工,用一个月的时间做出了 AI 对话产品 Glow,用户可以在这个产品上自由创建角色,并和角色对话。他们本想用游戏化的方式收集数据,“没人想到这个产品会一炮而红”。Glow 上线4个月后注册用户超过五百万。


“Glow 出乎意料的成功让公司的重心转向了 C 端产品。” 一位 MiniMax 员工说。2023年底,MiniMax 有约300名员工,其中近200人在产品线,远超同类大模型创业公司。


月之暗面的故事类似。2023年8月,他们第一个模型训练到后期,开始立项做 AI 助理 Kimi,当时整个公司只有50人,预期只是 “展示模型能力”。上线之后,Kimi 连续数月月活用户环比增长超过100%。


“用了最少的钱,最少的人,最少的卡,做到了最好的状态。” Monolith 创始合伙人曹曦曾如此评价月之暗面,他的基金跟进了月之暗面三轮融资。


到2023年底再融资时,月之暗面成为资本追捧的对象。小红书投前9亿美元估值的价格很快被阿里压过:投资近8亿美元,将月之暗面的估值抬升到23.4亿美元。


这让它的估值与2021年就成立的 MiniMax 并驾齐驱,膨胀速度远超上一代 AI 公司。同一时间,MiniMax 也拿到阿里投资的6亿美元资源,估值又超过月之暗面。


两笔融资2024年初完成,合计超14亿美元(100亿元人民币),超过中国大模型创投领域上一年公开融资总额,改写了行业格局。



早期增长吸引大额投资,也成了竞争中的弱点


大额资本的注入放大了两位创始人的野心。2024年初,闫俊杰定下激进目标:技术达到 GPT-4 的水平,把产品用户规模翻十倍,单个产品能突破千万 DAU。


这一年的 MiniMax 很像字节跳动:同时推进多条产品线,从 Talkie、星野到海螺 AI,还有几个没有上线过就放弃的产品。年中,MiniMax 员工总数增长到400左右。


公司成立刚一年,杨植麟定下覆盖多个方向的目标:技术上深入无损长文本、视频生成、多阶段推理;产品上追求 DAU 增长、出海;并加大商业化力度。到年中,信奉精英策略的月之暗面,员工也翻了一番。


问题跟着爆发。MiniMax 陷入纠结与摇摆,这年1月,MiniMax 视觉模型团队开始押注视频模型;3月,他们抽调星野 /Talkie 和开放平台的一部分研发人员,做产品形态类似即梦的视频生成项目;5月,他们放弃这个产品形态项目。


到了8月,高层要求在一周内让模型 “能用”,要赶上公司的 Open Day。一位员工回忆,那时模型生成的人物 “手脚还在乱飞”,而承载视频模型的产品项目早已放弃。


最终团队先做了网页版上线,让用户测试,移动端往后延,嫁接到原本主打语音交互的海螺 AI 上。不过就像 Glow 一样,他们对这个产品期望不高。但第二个月,其网页端访问量就接近500万。


一位 MiniMax 员工回忆,2024年的大部分时间,他们都被这种 “既要又要” 的气氛影响——公司既想增长,又不想将模型往 “软色情” 方向调整,但 “一健康就不增长”。高层一度要求暂停在 Talkie、星野等产品上增加广告位,但收入下滑后又陷入焦虑。


闫俊杰说,他经历过技术被资本裹挟的过程:“如果一家企业必须靠不断融资才能前进,那它优化的就不再是产品,而是如何说服投资人继续给钱。”


月之暗面的精英策略也没有在新方向上发挥太多效果。他们想要复现 Sora 的视频模型,但效果一直未及预期,唯一的 “亮相”,是几位联合创始人在朋友圈里发布的几条视频,称由自家视频模型生成;月之暗面低调上线的两款出海产品 Ohai 和 Noisee,几个月后便停止运营。


在这期间,月之暗面创始团队出售股份,迅速在创投领域引发风波。关键不在于卖股份,而在于月之暗面背后的叙事失调。产品未定型、格局未稳固的时刻,创始团队出售股份,很容易被理解为 “急于落袋为安”。


风波之中,我们曾问他此事,他以一句 “Fake news” 简短作答。


2024年中,“大模型进展放缓” 的论调开始流行。当技术可能很难带来巨大突破时,市场和投资人衡量公司增长潜力的指标,转向最直接的 DAU 数据。


在月之暗面,张予彤主导大规模投流,拉高了 B 站等平台的 AI 产品投流价格。MiniMax 也在高层反复的纠结后,最终决定跟进。


他们再一次被资本看好。MiniMax 拿到腾讯等机构的投资;8月,月之暗面获得腾讯、高榕创投等3亿美元融资。资本意志开始更深地介入公司经营,部分投资人频繁给他们提供增长 “建议”:哪些海外 AI 应用公司增长更快,哪些投流策略更高效,哪类产品功能更能带来留存。


可一同出现的还有更强的对手。字节跳动发动了饱和式进攻:产品线覆盖一切,从生产力到娱乐,从助手到硬件。我们了解到,字节还严格控制外部 AI 产品在抖音上的投放,而豆包等作为字节系产品,还能享受折扣。


一位月之暗面员工回忆,那是公司的士气低谷,“面对字节这样的敌人,是打不过的。” 一位投资人称,如果不推动公司转型,“除了硬着头皮跟字节拼消耗,似乎别无他法”。


到这一年10月,一场数位投了大模型的投资人参加的聚会中,他们开始讨论 “如何能卖掉部分手里的大模型创业公司股份?”



追求技术可以是一种选择,但空间越来越小


DeepSeek “解救” 了 MiniMax 和月之暗面。他们靠着远超市场预期的模型,没花一分钱投流,就在一周内吸引了数千万用户,制造了中国自己的 ChatGPT 时刻。


“如果你在对手更强的赛道,那你就没有胜的可能。” 一位月之暗面员工说,DeepSeek 带来的热潮,让他明显感觉到公司内部情绪有了好转,“只要技术够强,就有机会逆天改命。”


月之暗面不再更新 K1 系列的模型,集中资源投入基础算法与新模型 K2。这个新模型被寄予厚望,月之暗面研发团队几乎全员参与,杨植麟本人也亲自下场写代码。


张予彤在社交平台上写道,“小伙伴为了这次发布直接睡在公司里”,配图是一个带有 “离发布还有0天” 标语的图片,标语下是一张沙发床。


几个月高强度开发后,月之暗面在7月发布并开源万亿参数的 MoE 模型 Kimi K2,宣称在自主编程、工具调用和数学推理等维度上超过 DeepSeek-V3 和阿里 Qwen3。在这之前,杨植麟相信 “闭源是正确的路”。《自然》杂志网站的一篇文章称其为 “中国的又一个 DeepSeek 时刻”。


MiniMax 也完成了类似的聚焦。他们将重点从 “模型与产品并重” 收缩到 “模型优先”。视频、语音等多模态模型依然在研究,这是他们有优势的方向。我们了解到,闫俊杰还把一部分产品的员工转到模型团队,并为文本模型重新分配算力,核心资源集中到语言模型的基础能力上,增加数学与编程数据的比重。他之前说,MiniMax 没必要为了一篇新闻稿,就训练一个类似 o1 那样的推理模型。


他们10月开源语言模型 M2 时,强调它的编程和推理能力突出,使用量在 OpenRouter 上已经增长到了前五。“应该创业第一天就开源。” 闫俊杰年初说。


两家公司似乎回到了刚创业时的状态,都把提升模型的能力当作主线,投资方也不再过多给公司提建议。公司的经营依赖创业者本身管理能力。


闫俊杰看上去温和,但一旦做出决定,执行起来极为坚决。在 MiniMax 创业初期,团队曾尝试过 3D 数字人方向。项目尚未上线,闫俊杰判断这条路与公司长期技术路线不符,就立即叫停。项目解散,刚组建的团队经历第一轮震荡。


2024年起,MiniMax 的中层开始密集流动:产品负责人、商务负责人、数据科学负责人、增长负责人、战投负责人等陆续离开。比如 MiniMax 对齐团队两年内换了三任负责人——第一任因与闫俊杰激烈争论技术进展,被降为普通工程师;第二任由下属提拔,半年后离职。MiniMax 早期的一百名员工,如今已走了一半。


“不是同路人的这些同事,我会请他们离开。我已经请走了几位。” 闫俊杰曾在公司全员会上说。


在他看来,好的成果不是某个人灵光一现的产物,而是科学方法和团队配合下的必然发现,哪怕个人能力不算顶尖,只要能让团队跑得更快,就是合适的人才。


闫俊杰认为,管理公司就是优化函数,目标是商业化效率、调用量等变量,管理的核心任务就是找到 “梯度下降最快的方向”,不断逼近最优解。


MiniMax 的很多决策,比如不做 3D、选择 MoE 架构、做视频模型,都属于 “算出来的结果”。甚至 MiniMax 每两周一次的全员分享会,也叫 “CD”(Coordinate Decent 算法)。 


杨植麟相信那些能提出新想法的人才,“因为在这个领域,创新本身最有价值”。他愿意为了招揽一名自己欣赏的技术人才,从北京飞到深圳,聊上十个小时,第二天赶早班机返回;也会让优秀的研究者自己一个人在异地自由工作。


他倾向于先达成共识,再迅速行动。月之暗面的第一款模型亮相时,主打20万长文本上下文。但一开始,核心团队有人并不看好这个方向。一位月之暗面早期员工回忆,2023年5月公司就有人提过做长文本,却被其他人否决,理由是算法视角里,这只是压缩问题,是工程活,不是技术突破。这个方向就没有推进。


两个月后,Anthropic 发布处理50万文本的 Claude 模型,引发行业震动。长文本成为月之暗面内部共识。“Lossless long context is everything” 成了杨植麟经常提的一句话。


但如今 AI 公司把追求模型能力当做公司经营的核心变得愈发困难。早期的 OpenAI 是一个参考答案。他们的团队延续了 “学术式” 的工作节奏,用实验和试错推动技术研究,领先技术成果诞生后加上山姆·阿尔特曼(Sam Altman)从 YC 带来的增长策略,推动公司持续发展。DeepSeek 的 “学术循环” 模式——批判性思考、原子化创新、推动科学边界——也是一种策略,但它不用太过于关注商业化和用户增长。


MiniMax 和月之暗面很难找到这样的空间和资源。这场资本密集游戏里,资金、算力和生态支持至关重要。OpenAI 的估值已达到5000亿美元,要顶着万亿美元估值上市;xAI 和 Anthropic 的估值也都逼近2000亿美元。而 MiniMax 和月之暗面的估值都在40亿美元左右。这让谁能成为中国 OpenAI 的问题变得没有意义。


体量较大的美元基金退潮后,中国拥有大规模资金的巨头不愿为创业公司持续输血,反而成为 AI 公司的竞争对手。阿里、字节、腾讯,甚至是 DeepSeek,研发基础模型都有主营业务(电商、广告、量化)供血,短期没有盈利压力。


MiniMax 和月之暗面都在尝试用更专业的功能(月之暗面的 OK Computer、深度研究;MiniMax 的专业模式)吸引用户付费订阅。但只要字节等公司的同类产品免费,去年下半年的竞争问题必然会再次出现。


他们还在继续找钱。市场消息称,MiniMax 正筹备赴港上市。月之暗面又开了一轮新融资。


大模型注定是需要几百亿美元,甚至上千亿美元投入的游戏。创业公司想要走完这条路,创始人们必须证明,这是一场需要他们参与的长期探索,才能获得更多的理解和支持。


这是一道更难的证明题:在巨头林立、算力稀缺、资本收缩的市场中,是否还有空间容纳一种既做基础研究、又不属于任何巨头的 AI 公司?


这不仅需要更多技术突破,也需要一种在当前中国环境下罕见的能力——靠投资机构和业务收入,维持一支高密度的研究团队持续产出。

咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部