AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

AI|MiniMax和月之暗面:中国AI创业公司的两种路径和共同难题

638
2025-11-26 17:58
2025-11-26 17:58
638

想系统掌握亚马逊广告的投放逻辑与底层闭环?点击免费学习《亚马逊广告基础逻辑》


一时的技术成果或者用户增长,很难成为 AI 公司的竞争优势。



本文经授权转自《晚点LatePost》(ID:postlate)

作者:王与桐,编辑:贺乾明


大会结束,月之暗面创始人杨植麟被观众层层围住,有人举着手机想加他微信,有人追到茶歇区要签名。投资这家公司的机构,拉一整大巴的投资人去拜访他,“让一线投资人见见好的创业者是什么样子”。


MiniMax 创始人闫俊杰很少公开露面,网上能搜到的照片没几张。这无碍他在投资行业的热度。MiniMax 估值长期排在中国大模型创业公司前列,投资人要靠 “抢” 才能拿到份额。


这一切发生在 DeepSeek 爆火前。今年初,两家明星创业公司一起被挤到聚光灯边缘。


春节后的第一个工作周,两家公司的二号位各自召开了内部会议,讨论 DeepSeek 之后该怎么做增长。月之暗面在长达6个小时的会议后,决定暂缓投放,回归产品和技术本身。在 MiniMax,DAU 被称为 “虚荣指标”。


两家公司有员工觉得,这是一种 “解脱”:不用再绝望地消耗资源与字节等巨头竞争,也无需拼命证明 “中国能诞生 OpenAI”。问题已经失去意义。


在这之后,两家公司取得更好的技术进展。MiniMax 的视频生成模型,宣称在一些场景超过 Google 的 Veo3;其开源的 M2 文本模型,在部分测评中位列全球开源模型第一。月之暗面的 K2 模型,被称为 “中国又一个 DeepSeek”;近期发布的 K2 Thinking,宣称部分基准测试得分超过 GPT-5。


他们的压力并没有消失。MiniMax 和月之暗面曾用较少的资源证明过增长潜力。两家公司因此拿到中国大模型创投领域大多数资金,总计超过200亿元人民币。


这笔钱很少,让他们难与字节、阿里,甚至是 DeepSeek 正面竞争,或者是对标 OpenAI、Anthropic 这些海外同行。但这笔钱又足够多,让他们无法收敛野心。


闫俊杰和杨植麟是中国大模型领域的 “双子星”。他们几乎在同一时间走进公众视野,讲着相似的理想——相信技术,追求 AGI;也都在融资、流量、争议与期待中长期被同一个问题拷问:中国的 OpenAI,会诞生在哪?


两人的相同之处并不多。闫俊杰崇尚 “系统理性”,想要在庞杂的约束中寻找最优解。他把公司视作可以设计和优化的函数,坚信组织的力量能够催生创新与增长。


他敢于决断,然后接受冲突,迅速迭代。他创办的 MiniMax,在技术路线上选择多模态模型,是中国最早推出 MoE 模型的团队之一。


杨植麟则相信人才的力量,公司的核心产品 “Kimi” 也是他的英文名,个人光环与公司品牌深度绑定。


他看重 “共识驱动”,相信少数精英能引领方向。与 MiniMax 不同,他创办的月之暗面更执着于无损的语言模型本身的力量,一度不怎么在意 MoE。


现在他们要解决的问题是一样的。之前三年过山车般的经历表明,一时的技术成果或者用户增长,很难成为竞争优势。他们还要建立让技术和用户增长持续产生的组织能力。



技术 CEO、管家二号位


2017年,在商汤担任 CEO 助理的贠烨祎,就向云启资本合伙人、也是她在约翰霍普金斯的师兄陈昱提出过创业设想,但因为缺合伙人没能推进。四年后,她再次找到陈昱:“我终于找到创业搭子了。”


这个搭子,就是闫俊杰。


闫俊杰是典型的 “系统内优胜者”。他出生于1989年,在河南的县城长大,博士就读于中国科学院自动化所。


2014年博士毕业后,闫俊杰加入商汤,在这家核心成员大多来自香港中文大学和海外高校博士生的公司中,他只用了五年时间,就从算法工程师一路做到最年轻的副总裁、研究院副院长,负责智慧城市、游戏等多个业务。他参与了商汤底层算法到工程落地的体系建设,发表上百篇论文。


闫俊杰第一次见陈昱,就给对方留下深刻印象:一是光头,“一看就是绝顶聪明”;二是闫俊杰跟他讲,可以用基础模型,解决更加通用和泛化的问题。


“现在看来当然是常识,但在行业都还在讲用若干小模型解决复杂问题的2021年,令人耳目一新。” 陈昱说。


2021年底,闫俊杰离职创办 MiniMax。闫俊杰负责技术,贠烨祎负责技术之外的产品、融资等事务。一位 MiniMax 早期人士说:“闫俊杰想要做全世界最伟大的技术,贠烨祎想做全世界最伟大的公司。”


闫俊杰把 AGI 视为 “普通人每天都会用的一个产品、一个服务”。一位 MiniMax 前员工说,他加入 MiniMax,是被会议室墙上的一行字打动——Intelligence for Everyone。


MiniMax 的第一轮融资印证了这套故事的吸引力:闫俊杰在与高瓴创始人张磊聊过后,高瓴直接取代云启,拿下首轮2000万美元融资的领投。MiniMax 投后估值达到2亿美元。


月之暗面起步没那么顺利。2023年初,刚成立的月之暗面想融资2000万美元还不顺利。在投资人眼里,杨植麟只有 “技术” 标签,缺少产品、管理、融资经验。


出生于1992年的杨植麟是广东汕头人,头发茂密,他在卡耐基梅隆读博期间,发布的大语言模型相关论文 XLNet 和 Transformer-XL,现在引用接近两万。


同样在读博士期间,27岁的杨植麟参与创办 AI 公司循环智能。他在自己的个人主页上写道:“我所有工作的目标,包括研究和商业,都是最大化人工智能的价值。”


月之暗面的起点,是杨植麟在循环智能负责的团队。2021年,杨植麟主导了华为云合作的千亿级盘古大模型,团队就叫 “Moonshot”。两年后,他推动 “Moonshot” 从循环独立,成立月之暗面。他认为要 “专门建一家公司,而不是从别的业务里拐出一条支线。”


起步融资遇挫,杨植麟想到循环智能的投资人、也是他的清华学姐张予彤。在2019年,还在金沙江创投的张予彤就主导投资了循环智能。


在张予彤的推动下,月之暗面最终在2023年上半年完成第一笔融资,红杉、真格、Monolith 的下注让杨植麟赶上了窗口期。张予彤如今在月之暗面的角色是二号位,与贠烨祎在 MiniMax 类似,负责融资、增长等业务。不过张予彤的加入,后来也让月之暗面陷入潜在的利益冲突与仲裁风波


虽然起步方式不同,两位创始人在公司的发展上做出了类似的选择:用大半年时间研发基础模型后,尝试做 C 端产品,并迎来了第一个爆发点。


2022年中,MiniMax 投入数名员工,用一个月的时间做出了 AI 对话产品 Glow,用户可以在这个产品上自由创建角色,并和角色对话。他们本想用游戏化的方式收集数据,“没人想到这个产品会一炮而红”。Glow 上线4个月后注册用户超过五百万。


“Glow 出乎意料的成功让公司的重心转向了 C 端产品。” 一位 MiniMax 员工说。2023年底,MiniMax 有约300名员工,其中近200人在产品线,远超同类大模型创业公司。


月之暗面的故事类似。2023年8月,他们第一个模型训练到后期,开始立项做 AI 助理 Kimi,当时整个公司只有50人,预期只是 “展示模型能力”。上线之后,Kimi 连续数月月活用户环比增长超过100%。


“用了最少的钱,最少的人,最少的卡,做到了最好的状态。” Monolith 创始合伙人曹曦曾如此评价月之暗面,他的基金跟进了月之暗面三轮融资。


到2023年底再融资时,月之暗面成为资本追捧的对象。小红书投前9亿美元估值的价格很快被阿里压过:投资近8亿美元,将月之暗面的估值抬升到23.4亿美元。


这让它的估值与2021年就成立的 MiniMax 并驾齐驱,膨胀速度远超上一代 AI 公司。同一时间,MiniMax 也拿到阿里投资的6亿美元资源,估值又超过月之暗面。


两笔融资2024年初完成,合计超14亿美元(100亿元人民币),超过中国大模型创投领域上一年公开融资总额,改写了行业格局。



早期增长吸引大额投资,也成了竞争中的弱点


大额资本的注入放大了两位创始人的野心。2024年初,闫俊杰定下激进目标:技术达到 GPT-4 的水平,把产品用户规模翻十倍,单个产品能突破千万 DAU。


这一年的 MiniMax 很像字节跳动:同时推进多条产品线,从 Talkie、星野到海螺 AI,还有几个没有上线过就放弃的产品。年中,MiniMax 员工总数增长到400左右。


公司成立刚一年,杨植麟定下覆盖多个方向的目标:技术上深入无损长文本、视频生成、多阶段推理;产品上追求 DAU 增长、出海;并加大商业化力度。到年中,信奉精英策略的月之暗面,员工也翻了一番。


问题跟着爆发。MiniMax 陷入纠结与摇摆,这年1月,MiniMax 视觉模型团队开始押注视频模型;3月,他们抽调星野 /Talkie 和开放平台的一部分研发人员,做产品形态类似即梦的视频生成项目;5月,他们放弃这个产品形态项目。


到了8月,高层要求在一周内让模型 “能用”,要赶上公司的 Open Day。一位员工回忆,那时模型生成的人物 “手脚还在乱飞”,而承载视频模型的产品项目早已放弃。


最终团队先做了网页版上线,让用户测试,移动端往后延,嫁接到原本主打语音交互的海螺 AI 上。不过就像 Glow 一样,他们对这个产品期望不高。但第二个月,其网页端访问量就接近500万。


一位 MiniMax 员工回忆,2024年的大部分时间,他们都被这种 “既要又要” 的气氛影响——公司既想增长,又不想将模型往 “软色情” 方向调整,但 “一健康就不增长”。高层一度要求暂停在 Talkie、星野等产品上增加广告位,但收入下滑后又陷入焦虑。


闫俊杰说,他经历过技术被资本裹挟的过程:“如果一家企业必须靠不断融资才能前进,那它优化的就不再是产品,而是如何说服投资人继续给钱。”


月之暗面的精英策略也没有在新方向上发挥太多效果。他们想要复现 Sora 的视频模型,但效果一直未及预期,唯一的 “亮相”,是几位联合创始人在朋友圈里发布的几条视频,称由自家视频模型生成;月之暗面低调上线的两款出海产品 Ohai 和 Noisee,几个月后便停止运营。


在这期间,月之暗面创始团队出售股份,迅速在创投领域引发风波。关键不在于卖股份,而在于月之暗面背后的叙事失调。产品未定型、格局未稳固的时刻,创始团队出售股份,很容易被理解为 “急于落袋为安”。


风波之中,我们曾问他此事,他以一句 “Fake news” 简短作答。


2024年中,“大模型进展放缓” 的论调开始流行。当技术可能很难带来巨大突破时,市场和投资人衡量公司增长潜力的指标,转向最直接的 DAU 数据。


在月之暗面,张予彤主导大规模投流,拉高了 B 站等平台的 AI 产品投流价格。MiniMax 也在高层反复的纠结后,最终决定跟进。


他们再一次被资本看好。MiniMax 拿到腾讯等机构的投资;8月,月之暗面获得腾讯、高榕创投等3亿美元融资。资本意志开始更深地介入公司经营,部分投资人频繁给他们提供增长 “建议”:哪些海外 AI 应用公司增长更快,哪些投流策略更高效,哪类产品功能更能带来留存。


可一同出现的还有更强的对手。字节跳动发动了饱和式进攻:产品线覆盖一切,从生产力到娱乐,从助手到硬件。我们了解到,字节还严格控制外部 AI 产品在抖音上的投放,而豆包等作为字节系产品,还能享受折扣。


一位月之暗面员工回忆,那是公司的士气低谷,“面对字节这样的敌人,是打不过的。” 一位投资人称,如果不推动公司转型,“除了硬着头皮跟字节拼消耗,似乎别无他法”。


到这一年10月,一场数位投了大模型的投资人参加的聚会中,他们开始讨论 “如何能卖掉部分手里的大模型创业公司股份?”



追求技术可以是一种选择,但空间越来越小


DeepSeek “解救” 了 MiniMax 和月之暗面。他们靠着远超市场预期的模型,没花一分钱投流,就在一周内吸引了数千万用户,制造了中国自己的 ChatGPT 时刻。


“如果你在对手更强的赛道,那你就没有胜的可能。” 一位月之暗面员工说,DeepSeek 带来的热潮,让他明显感觉到公司内部情绪有了好转,“只要技术够强,就有机会逆天改命。”


月之暗面不再更新 K1 系列的模型,集中资源投入基础算法与新模型 K2。这个新模型被寄予厚望,月之暗面研发团队几乎全员参与,杨植麟本人也亲自下场写代码。


张予彤在社交平台上写道,“小伙伴为了这次发布直接睡在公司里”,配图是一个带有 “离发布还有0天” 标语的图片,标语下是一张沙发床。


几个月高强度开发后,月之暗面在7月发布并开源万亿参数的 MoE 模型 Kimi K2,宣称在自主编程、工具调用和数学推理等维度上超过 DeepSeek-V3 和阿里 Qwen3。在这之前,杨植麟相信 “闭源是正确的路”。《自然》杂志网站的一篇文章称其为 “中国的又一个 DeepSeek 时刻”。


MiniMax 也完成了类似的聚焦。他们将重点从 “模型与产品并重” 收缩到 “模型优先”。视频、语音等多模态模型依然在研究,这是他们有优势的方向。我们了解到,闫俊杰还把一部分产品的员工转到模型团队,并为文本模型重新分配算力,核心资源集中到语言模型的基础能力上,增加数学与编程数据的比重。他之前说,MiniMax 没必要为了一篇新闻稿,就训练一个类似 o1 那样的推理模型。


他们10月开源语言模型 M2 时,强调它的编程和推理能力突出,使用量在 OpenRouter 上已经增长到了前五。“应该创业第一天就开源。” 闫俊杰年初说。


两家公司似乎回到了刚创业时的状态,都把提升模型的能力当作主线,投资方也不再过多给公司提建议。公司的经营依赖创业者本身管理能力。


闫俊杰看上去温和,但一旦做出决定,执行起来极为坚决。在 MiniMax 创业初期,团队曾尝试过 3D 数字人方向。项目尚未上线,闫俊杰判断这条路与公司长期技术路线不符,就立即叫停。项目解散,刚组建的团队经历第一轮震荡。


2024年起,MiniMax 的中层开始密集流动:产品负责人、商务负责人、数据科学负责人、增长负责人、战投负责人等陆续离开。比如 MiniMax 对齐团队两年内换了三任负责人——第一任因与闫俊杰激烈争论技术进展,被降为普通工程师;第二任由下属提拔,半年后离职。MiniMax 早期的一百名员工,如今已走了一半。


“不是同路人的这些同事,我会请他们离开。我已经请走了几位。” 闫俊杰曾在公司全员会上说。


在他看来,好的成果不是某个人灵光一现的产物,而是科学方法和团队配合下的必然发现,哪怕个人能力不算顶尖,只要能让团队跑得更快,就是合适的人才。


闫俊杰认为,管理公司就是优化函数,目标是商业化效率、调用量等变量,管理的核心任务就是找到 “梯度下降最快的方向”,不断逼近最优解。


MiniMax 的很多决策,比如不做 3D、选择 MoE 架构、做视频模型,都属于 “算出来的结果”。甚至 MiniMax 每两周一次的全员分享会,也叫 “CD”(Coordinate Decent 算法)。 


杨植麟相信那些能提出新想法的人才,“因为在这个领域,创新本身最有价值”。他愿意为了招揽一名自己欣赏的技术人才,从北京飞到深圳,聊上十个小时,第二天赶早班机返回;也会让优秀的研究者自己一个人在异地自由工作。


他倾向于先达成共识,再迅速行动。月之暗面的第一款模型亮相时,主打20万长文本上下文。但一开始,核心团队有人并不看好这个方向。一位月之暗面早期员工回忆,2023年5月公司就有人提过做长文本,却被其他人否决,理由是算法视角里,这只是压缩问题,是工程活,不是技术突破。这个方向就没有推进。


两个月后,Anthropic 发布处理50万文本的 Claude 模型,引发行业震动。长文本成为月之暗面内部共识。“Lossless long context is everything” 成了杨植麟经常提的一句话。


但如今 AI 公司把追求模型能力当做公司经营的核心变得愈发困难。早期的 OpenAI 是一个参考答案。他们的团队延续了 “学术式” 的工作节奏,用实验和试错推动技术研究,领先技术成果诞生后加上山姆·阿尔特曼(Sam Altman)从 YC 带来的增长策略,推动公司持续发展。DeepSeek 的 “学术循环” 模式——批判性思考、原子化创新、推动科学边界——也是一种策略,但它不用太过于关注商业化和用户增长。


MiniMax 和月之暗面很难找到这样的空间和资源。这场资本密集游戏里,资金、算力和生态支持至关重要。OpenAI 的估值已达到5000亿美元,要顶着万亿美元估值上市;xAI 和 Anthropic 的估值也都逼近2000亿美元。而 MiniMax 和月之暗面的估值都在40亿美元左右。这让谁能成为中国 OpenAI 的问题变得没有意义。


体量较大的美元基金退潮后,中国拥有大规模资金的巨头不愿为创业公司持续输血,反而成为 AI 公司的竞争对手。阿里、字节、腾讯,甚至是 DeepSeek,研发基础模型都有主营业务(电商、广告、量化)供血,短期没有盈利压力。


MiniMax 和月之暗面都在尝试用更专业的功能(月之暗面的 OK Computer、深度研究;MiniMax 的专业模式)吸引用户付费订阅。但只要字节等公司的同类产品免费,去年下半年的竞争问题必然会再次出现。


他们还在继续找钱。市场消息称,MiniMax 正筹备赴港上市。月之暗面又开了一轮新融资。


大模型注定是需要几百亿美元,甚至上千亿美元投入的游戏。创业公司想要走完这条路,创始人们必须证明,这是一场需要他们参与的长期探索,才能获得更多的理解和支持。


这是一道更难的证明题:在巨头林立、算力稀缺、资本收缩的市场中,是否还有空间容纳一种既做基础研究、又不属于任何巨头的 AI 公司?


这不仅需要更多技术突破,也需要一种在当前中国环境下罕见的能力——靠投资机构和业务收入,维持一支高密度的研究团队持续产出。

12.12 厦门emag沙龙-文章页底部
TikTok、Facebook、谷歌、Twitter广告服务,0门槛抢占全球流量!
极速开户+优化投流+风险保障+效果跟踪,仅需4步,轻松撬动亿万海外流量,让品牌销量翻倍增长!
已成功开通5000+账户
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
宠物消费持续升温,亚马逊10款月销过万宠物产品推荐
AMZ123获悉,近日,亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。1. 猫咪情绪舒缓喷雾预计销售额:139.84万美元/月销量:26,000+星级评分:4.4好评数量:12,694+图源:亚马逊产品描述:FELIWAY Optimum猫咪情绪舒缓喷雾的专利信息素复合物能显著减少猫咪的应激表现,包括喷尿、抓挠、恐惧反应、紧张冲突等。产品无药性、安全且不干扰人类与其他宠物,每个喷雾覆盖面积约 700 平方英尺。
Allegro与ChatGPT合作,推出新AI购物工具
AMZ123获悉,近日,波兰电商平台Allegro宣布,正式推出基ChatGPT的AI购物工具Allegro GPT,为用户提供更便捷的商品搜索与推荐服务,并为平台卖家带来新的曝光渠道。Allegro GPT将直接连接ChatGPT与Allegro.pl的API,使用户能够在对话中即时获得基于平台实时商品数据的推荐,无需额外订阅任何付费版本的ChatGPT。目前该功能已处于公开测试(beta)阶段,所有用户均可直接使用。Allegro表示,越来越多消费者倾向于通过与AI互动寻找购物灵感,因此希望借助这一方式让用户能够更快找到目标商品,同时提升整体购物体验。
一文说清楚亚马逊多渠道配送是什么?附详细操作流程
MCF亚马逊多渠道配送,又叫MCF,是指:您将库存产品入仓到亚马逊运营中心后,亚马逊不仅能帮您配送在亚马逊店铺的订单,还能帮您配送来自其他销售渠道(如您的独立站、Shopify、eBay、沃尔玛等)的订单。简单来说,MCF是一个非常重要的物流模式,让您所有的销售渠道,都能共享亚马逊世界顶级的物流网络。一张图看懂MCF为什么卖家要使用MCF?主要有以下三大好处1极致物流体验,共享亚马逊的配送网络(包装、拣货、发货、客服、退货处理)2简化供应链管理,所有渠道的库存集中存放在亚马逊仓库。3加速资金回笼,订单配送时效极快(通常1-3天)。在日常运营中,亚马逊多渠道订单怎么操作?小编整理了详细的处理流程。
亚马逊与USPS谈判受阻,或将继续扩张自有物流网络
AMZ123获悉,近日,据外媒报道,亚马逊与美国邮政(USPS)续约的谈判出现停滞。报道指出,若谈判最终破裂,亚马逊可能结束双方超过30年的合作,并进一步扩大自有配送网络。据悉,此次谈判僵局与USPS局长David Steiner计划在明年初启动“最后一英里配送合约竞拍”有关,这意味着亚马逊需与其他全美零售商及区域物流企业竞争USPS的配送资源。亚马逊方面表示,这并非其原本的选择。亚马逊在近一年的谈判中始终寻求延长将于2026年10月1日到期的合约,并希望增加在USPS的投放量。亚马逊发言人Steve Kelly回应称,USPS是亚马逊“最早、最长期的合作伙伴”,并指出亚马逊对延长合作“仍保持承诺”。
TikTok将在巴西建首个拉美数据中心,总投资超2000亿雷亚尔
AMZ123获悉,近日,TikTok宣布,将在巴西塞阿拉州建立其在拉丁美洲的首个数据中心,选址位于佩森工业与港口综合区(CIPP),初期运营预计于2027年启动。该项目由TikTok与数据中心运营商Omnia(隶属Pátria Investimentos集团)及可再生能源企业Casa dos Ventos共同推进,旨在强化平台在拉美地区的数据处理能力,满足持续增长的本地用户需求。根据TikTok披露的信息,整个项目的总投资额预计将超过2000亿雷亚尔。TikTok计划在2035年前投入1080亿雷亚尔用于设备采购,并在此后十年持续追加技术升级投入。
AMZ123PayPal计算器使用指南及常见问题详解(内附计算公式)
Paypal手续费计算器介绍及计算公式分享 https://www.amz123.com/tools-paypal
跨界AI失败?深圳大卖资产重组终止!
12月2日,跨境3C 配件大卖杰美特发布公告,宣布决定终止筹划以现金方式收购AI 算力解决方案提供商思腾合力(天津)科技有限公司(以下简称“思腾合力”)控制权的重大资产重组事项。这场筹划半年、备受行业关注的跨界收购突然落幕,消息一出引发市场热议。AMZ123获悉,杰美特于2025年6月21日首次披露了筹划重组的提示性公告,拟通过现金交易控股思腾合力,该交易初步测算构成重大资产重组,且不涉及发行股份、不构成关联交易,也不会导致公司控制权变更。杰美特是“中国手机壳第一股”,主营业务为移动智能终端保护类产品的研发、设计与销售,产品包括手机、平板及穿戴设备的保护壳与表带等。
重磅!亚马逊公布2026年战略重心变化
AMZ123获悉,12月4日,2025年亚马逊全球开店跨境峰会上,亚马逊回顾了过去一年里中国卖家在亚马逊上所取得的进展,并围绕2026年四大业务战略重点——供应链服务、AI赋能、全球拓展布局、本地服务,揭晓了40余项创新举措。根据亚马逊披露的数据:2025年以来,中国卖家通过亚马逊全球站点售出数十亿件商品,在美欧等成熟站点的销售额增长超过15%,在新兴站点的销售额增长超过30%;2025年以来,销售额达到200万、500万、800万美金的中国卖家数量,增长均超过20%;销售额超过1000万美金的中国卖家数量,增幅近30%。
AMZ123PayPal计算器使用指南及常见问题详解(内附计算公式)
Paypal手续费计算器介绍及计算公式分享 https://www.amz123.com/tools-paypal
入职一年反被公司索赔 9 万多!前运营侵权致 TRO 罚款,我未及时响应需赔 12900 刀?
匿名用户我的C位求助一下业内大佬们!本人有2年精铺经验,2024年6月入职一家跨境电商公司担任运营职务,3个月试用期。2024年10月7日收到TRO邮件要求回复并出庭,TRO原因为前运营上架产品侵权,当时本人未及时回复,到11月27日才处理,致使店铺资金账号被冻结。跟原告律师协商达成和解,和解金额为25000美金以及800美金律师服务费,总计25800美金。公司与本人协商结果为个人承担50%和解金额即12900美金(此前双方都没有此类经验),按照汇率7.25结算,折合人民币93525元,从每季度发放提成奖金中扣除,直至结清为止,已签订合约。
破天荒!亚马逊欧洲站下调多类目销售佣金
2025年行至尾声,亚马逊一年一度的费用变更政策如期而至。出乎卖家意料的是,亚马逊欧洲站这次“破天荒”地下调了部分FBA费用,引起业内一片哗然。AMZ123获悉,12月2日,亚马逊欧洲站发布了销售佣金和物流费用的更新通知,宣布将实施有史以来规模最大的费用更新计划,以推动在欧洲站销售商品的卖家业务增长,降低双方的成本。具体费用调整情况如下(日期均为欧洲时间):1、物流费用下调2025年12月15日起,英国、德国、法国、意大利和西班牙站的物流配送费用有所降低,每件商品平均降低0.26英镑/0.32欧元。
亚马逊如何找到最适合自己ASIN的流量结构?
在亚马逊平台上,流量是决定产品曝光与转化的核心因素。然而,许多新卖家在运营过程中常常陷入盲目投广、结构无序的困境,难以识别哪些流量真正能带来稳定转化和长期收益。面对海量数据和复杂算法,如何精准判断最适合自身ASIN的流量结构,成为新手卖家提升销量与利润的关键难题。本文章将为你解析流量结构的本质,帮助你从零开始构建科学、高效的推广策略。亚马逊商品投放只能投放到商品详情页?许多人可能认为亚马逊的商品广告仅限于商品详情页,但实际上,亚马逊提供了更为多样化的广告投放位置。除了在商品详情页展示广告外,商家还可以选择将广告投放至关键词搜索结果页面。这种灵活性为卖家提供了一个更广阔的平台来吸引潜在客户。
闷声发大财的小众赛道!海外年销15亿,卖的居然是这些......
近年来,欧美市场盛行DIY(“自己动手”)文化,自己动手改善居住环境、制作礼物、纪念品等,已经成为当地居民日常生活方式的一部分。随着越来越多的海外消费者参与其中,工具类、耗材类产品的需求大幅增加,为出海商家带来了前所未有的机遇。尤其是便携式打印、3D打印等,已经从“小众领域”拓展成家庭场景日常需求热门品类。DIY礼物促使3D打印成家庭热门需求手机软件一键操作,小至礼品、卡片、大至模型、房屋装修材料等,各种DIY创意都能通过3D打印实现。尤其是在家庭场景领域,越来越多的3D打印产品被作为礼物,送给家人、朋友。
重磅!亚马逊公布2026年战略重心变化
AMZ123获悉,12月4日,2025年亚马逊全球开店跨境峰会上,亚马逊回顾了过去一年里中国卖家在亚马逊上所取得的进展,并围绕2026年四大业务战略重点——供应链服务、AI赋能、全球拓展布局、本地服务,揭晓了40余项创新举措。根据亚马逊披露的数据:2025年以来,中国卖家通过亚马逊全球站点售出数十亿件商品,在美欧等成熟站点的销售额增长超过15%,在新兴站点的销售额增长超过30%;2025年以来,销售额达到200万、500万、800万美金的中国卖家数量,增长均超过20%;销售额超过1000万美金的中国卖家数量,增幅近30%。
卖家还在等口径!欠税公示制度却已明确落地
卖家还在“等政策”,但政策已明确趋严过去几个月里,跨境卖家对税务政策最大的期待就是——“能不能再等等,看会不会有新口径”。但事实上,政策并没有往宽松走,而是沿着“数据透明—提醒申报—强化监管”这条路径一步步推进。AMZ123了解到,目前已有超过7000家境内外平台完成涉税信息报送,卖家的线上线下销售数据已全面纳入监管体系。随着数据比对展开,税务部门对申报明显低于平台数据的经营者陆续发出提示,要求补充申报;多数卖家在收到提示后完成了更正,但也的确还有部分经营者迟迟没有动作,继续处于观望甚至低申报的状态。在这种情况下,监管的态度也开始变得更为明确:对于未按规定申报的行为,将从提醒阶段进入到强化管理阶段。
TikTok Shop美国站多个品类平均价格上涨,涨幅高达103%
AMZ123获悉,近日,电商情报公司Charm的分析显示,TikTok Shop美国站的商品价格在过去一年显著上涨。数据显示,2025年TikTok Shop多个核心品类的平均售价较去年同期明显提高,其中鞋类商品在2025年 4 月至 10 月的平均单价达到 28.64 美元,比 2024 年同期的 14.06 美元上涨 103%。此外,体育与户外用品、箱包及时尚配饰等品类的平均价格也分别上涨了 54%、43% 和 42%;玩具、女装、电脑与办公设备等品类同样显著增长,涨幅超10%。TikTok Shop于2023年9月在美国上线时以高额补贴吸引卖家与消费者,平台售价明显低于其他电商。
《亚马逊生活日用品类攻略手册》PDF下载
作为日常生活不可或缺的重要组成,生活百货品类覆盖范围广泛,包括家居用品、家具、车用配件、户外装备、园艺 工具、运动器材、家装用品、厨房、玩具以及宠物用品等众多领域。这类产品不仅是满足基本生活所需,更体现了人们对美好生活的向往和追求。
《掘金泰国-市场洞察与战略机遇报告2025》PDF下载
随着全球经济一体化的加速,泰国作为东盟的核心枢纽,凭借其独特的地缘优势庞大的消费市场以及持续优化的营商环境,成为众多企业战略布局的重要目标。本报告深入剖析泰国市场的政策红利、消费趋势、产业机遇以及合规挑战,旨在为有志于开拓泰国市场的中国企业提供行动指南,助力企业在东盟这片充满活力的土地上把握机遇、应对挑战、!实现可持续发展。
《2025欧美假日购物季营销指南》PDF下载
2025年美国假日购物季零售额预计同比仅增长1.2%,总销售额约1.359万亿美元,虽仍保持正增长,但为2009年以来最低增速,市场正在步入低增长的新常态。
《2025年跨境电商东南亚市场进入战略白皮书》PDF下载
东南亚电商,正以惊人的速度复刻中国电商高速增长的黄金时代。2024年东南亚电商GMV达到1284亿美元,短短5年涨幅超过3倍。全球电商2024年GMV增幅最快的十大市场中,东南亚独占四席。东南亚是拥有约6.7亿人口的广阔市场,在现今全球关税的不确定性大格局下,因其电商基建完善,利好的贸易政策,和更高的年轻人口占比,成为跨境卖家生意拓张焦点之一。
《2025年TikTok Shop玩具品类行业报告(欧美站)》PDF下载
分析TikTok Shop美国市场、英国市场、西班牙市场、墨西哥市场等主流市场点短视频及直播电商数据,选取TikTok与玩具爱好品类相关的内容进行分析报告。
《2025 洗护品类趋势与创新洞察》PDF下载
本报告独特价值:将消费者的“行为结果”据),揭示消费者深层心理动机、并能精准预判未来增长机会
《亚马逊双轨增长指南》PDF下载
亚马逊以“以客户为中心”为核心理念,通过整合B2B与B2C的全渠道服务,帮助卖家实现“一店双拓”-- 一次上架,同步触达个人消费者与企业买家,获得双重收益。同时,基于Direct to Buyer(直接触达买家)的模式,更能有效减少中间环节,提升利润空间与品牌掌控力。
《亚马逊全球线上商采趋势与区域洞察》PDF下载
随着全球企业数字化转型的深入推进,B2B商采有望成为下一个万亿级别的蓝海市场然而,中国卖家在开拓海外企业商采市场时往往面临着一个关键挑战:难以准确把握海外企业买家的商采行为和决策模式。这种认知偏差不仅影响了产品开发方向,也制约了市场拓展策略的制定。
欧洲电商资讯
AMZ123旗下欧洲跨境电商新闻栏目,专注欧洲跨境电商热点资讯,为广大卖家提供欧洲跨境电商最新动态、最热新闻。
侃侃跨境那些事儿
不侃废话,挣钱要紧!
跨境电商干货集结
跨境电商干货集结,是结合亚马逊跨境电商卖家交流群内大家在交流过程中最常遇到的问题,进行收集整理,汇总解答,将会持续更新大家当前最常遇见的问题。欢迎大家加入跨境电商干货集结卖家交流群一起探讨。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
AMZ123选品观察员
选品推荐及选品技巧分享。
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
跨境科普达人
科普各种跨境小知识,科普那些你不知道的事...
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
首页
跨境头条
文章详情
AI|MiniMax和月之暗面:中国AI创业公司的两种路径和共同难题
36氪出海
2025-11-26 17:58
638


一时的技术成果或者用户增长,很难成为 AI 公司的竞争优势。



本文经授权转自《晚点LatePost》(ID:postlate)

作者:王与桐,编辑:贺乾明


大会结束,月之暗面创始人杨植麟被观众层层围住,有人举着手机想加他微信,有人追到茶歇区要签名。投资这家公司的机构,拉一整大巴的投资人去拜访他,“让一线投资人见见好的创业者是什么样子”。


MiniMax 创始人闫俊杰很少公开露面,网上能搜到的照片没几张。这无碍他在投资行业的热度。MiniMax 估值长期排在中国大模型创业公司前列,投资人要靠 “抢” 才能拿到份额。


这一切发生在 DeepSeek 爆火前。今年初,两家明星创业公司一起被挤到聚光灯边缘。


春节后的第一个工作周,两家公司的二号位各自召开了内部会议,讨论 DeepSeek 之后该怎么做增长。月之暗面在长达6个小时的会议后,决定暂缓投放,回归产品和技术本身。在 MiniMax,DAU 被称为 “虚荣指标”。


两家公司有员工觉得,这是一种 “解脱”:不用再绝望地消耗资源与字节等巨头竞争,也无需拼命证明 “中国能诞生 OpenAI”。问题已经失去意义。


在这之后,两家公司取得更好的技术进展。MiniMax 的视频生成模型,宣称在一些场景超过 Google 的 Veo3;其开源的 M2 文本模型,在部分测评中位列全球开源模型第一。月之暗面的 K2 模型,被称为 “中国又一个 DeepSeek”;近期发布的 K2 Thinking,宣称部分基准测试得分超过 GPT-5。


他们的压力并没有消失。MiniMax 和月之暗面曾用较少的资源证明过增长潜力。两家公司因此拿到中国大模型创投领域大多数资金,总计超过200亿元人民币。


这笔钱很少,让他们难与字节、阿里,甚至是 DeepSeek 正面竞争,或者是对标 OpenAI、Anthropic 这些海外同行。但这笔钱又足够多,让他们无法收敛野心。


闫俊杰和杨植麟是中国大模型领域的 “双子星”。他们几乎在同一时间走进公众视野,讲着相似的理想——相信技术,追求 AGI;也都在融资、流量、争议与期待中长期被同一个问题拷问:中国的 OpenAI,会诞生在哪?


两人的相同之处并不多。闫俊杰崇尚 “系统理性”,想要在庞杂的约束中寻找最优解。他把公司视作可以设计和优化的函数,坚信组织的力量能够催生创新与增长。


他敢于决断,然后接受冲突,迅速迭代。他创办的 MiniMax,在技术路线上选择多模态模型,是中国最早推出 MoE 模型的团队之一。


杨植麟则相信人才的力量,公司的核心产品 “Kimi” 也是他的英文名,个人光环与公司品牌深度绑定。


他看重 “共识驱动”,相信少数精英能引领方向。与 MiniMax 不同,他创办的月之暗面更执着于无损的语言模型本身的力量,一度不怎么在意 MoE。


现在他们要解决的问题是一样的。之前三年过山车般的经历表明,一时的技术成果或者用户增长,很难成为竞争优势。他们还要建立让技术和用户增长持续产生的组织能力。



技术 CEO、管家二号位


2017年,在商汤担任 CEO 助理的贠烨祎,就向云启资本合伙人、也是她在约翰霍普金斯的师兄陈昱提出过创业设想,但因为缺合伙人没能推进。四年后,她再次找到陈昱:“我终于找到创业搭子了。”


这个搭子,就是闫俊杰。


闫俊杰是典型的 “系统内优胜者”。他出生于1989年,在河南的县城长大,博士就读于中国科学院自动化所。


2014年博士毕业后,闫俊杰加入商汤,在这家核心成员大多来自香港中文大学和海外高校博士生的公司中,他只用了五年时间,就从算法工程师一路做到最年轻的副总裁、研究院副院长,负责智慧城市、游戏等多个业务。他参与了商汤底层算法到工程落地的体系建设,发表上百篇论文。


闫俊杰第一次见陈昱,就给对方留下深刻印象:一是光头,“一看就是绝顶聪明”;二是闫俊杰跟他讲,可以用基础模型,解决更加通用和泛化的问题。


“现在看来当然是常识,但在行业都还在讲用若干小模型解决复杂问题的2021年,令人耳目一新。” 陈昱说。


2021年底,闫俊杰离职创办 MiniMax。闫俊杰负责技术,贠烨祎负责技术之外的产品、融资等事务。一位 MiniMax 早期人士说:“闫俊杰想要做全世界最伟大的技术,贠烨祎想做全世界最伟大的公司。”


闫俊杰把 AGI 视为 “普通人每天都会用的一个产品、一个服务”。一位 MiniMax 前员工说,他加入 MiniMax,是被会议室墙上的一行字打动——Intelligence for Everyone。


MiniMax 的第一轮融资印证了这套故事的吸引力:闫俊杰在与高瓴创始人张磊聊过后,高瓴直接取代云启,拿下首轮2000万美元融资的领投。MiniMax 投后估值达到2亿美元。


月之暗面起步没那么顺利。2023年初,刚成立的月之暗面想融资2000万美元还不顺利。在投资人眼里,杨植麟只有 “技术” 标签,缺少产品、管理、融资经验。


出生于1992年的杨植麟是广东汕头人,头发茂密,他在卡耐基梅隆读博期间,发布的大语言模型相关论文 XLNet 和 Transformer-XL,现在引用接近两万。


同样在读博士期间,27岁的杨植麟参与创办 AI 公司循环智能。他在自己的个人主页上写道:“我所有工作的目标,包括研究和商业,都是最大化人工智能的价值。”


月之暗面的起点,是杨植麟在循环智能负责的团队。2021年,杨植麟主导了华为云合作的千亿级盘古大模型,团队就叫 “Moonshot”。两年后,他推动 “Moonshot” 从循环独立,成立月之暗面。他认为要 “专门建一家公司,而不是从别的业务里拐出一条支线。”


起步融资遇挫,杨植麟想到循环智能的投资人、也是他的清华学姐张予彤。在2019年,还在金沙江创投的张予彤就主导投资了循环智能。


在张予彤的推动下,月之暗面最终在2023年上半年完成第一笔融资,红杉、真格、Monolith 的下注让杨植麟赶上了窗口期。张予彤如今在月之暗面的角色是二号位,与贠烨祎在 MiniMax 类似,负责融资、增长等业务。不过张予彤的加入,后来也让月之暗面陷入潜在的利益冲突与仲裁风波


虽然起步方式不同,两位创始人在公司的发展上做出了类似的选择:用大半年时间研发基础模型后,尝试做 C 端产品,并迎来了第一个爆发点。


2022年中,MiniMax 投入数名员工,用一个月的时间做出了 AI 对话产品 Glow,用户可以在这个产品上自由创建角色,并和角色对话。他们本想用游戏化的方式收集数据,“没人想到这个产品会一炮而红”。Glow 上线4个月后注册用户超过五百万。


“Glow 出乎意料的成功让公司的重心转向了 C 端产品。” 一位 MiniMax 员工说。2023年底,MiniMax 有约300名员工,其中近200人在产品线,远超同类大模型创业公司。


月之暗面的故事类似。2023年8月,他们第一个模型训练到后期,开始立项做 AI 助理 Kimi,当时整个公司只有50人,预期只是 “展示模型能力”。上线之后,Kimi 连续数月月活用户环比增长超过100%。


“用了最少的钱,最少的人,最少的卡,做到了最好的状态。” Monolith 创始合伙人曹曦曾如此评价月之暗面,他的基金跟进了月之暗面三轮融资。


到2023年底再融资时,月之暗面成为资本追捧的对象。小红书投前9亿美元估值的价格很快被阿里压过:投资近8亿美元,将月之暗面的估值抬升到23.4亿美元。


这让它的估值与2021年就成立的 MiniMax 并驾齐驱,膨胀速度远超上一代 AI 公司。同一时间,MiniMax 也拿到阿里投资的6亿美元资源,估值又超过月之暗面。


两笔融资2024年初完成,合计超14亿美元(100亿元人民币),超过中国大模型创投领域上一年公开融资总额,改写了行业格局。



早期增长吸引大额投资,也成了竞争中的弱点


大额资本的注入放大了两位创始人的野心。2024年初,闫俊杰定下激进目标:技术达到 GPT-4 的水平,把产品用户规模翻十倍,单个产品能突破千万 DAU。


这一年的 MiniMax 很像字节跳动:同时推进多条产品线,从 Talkie、星野到海螺 AI,还有几个没有上线过就放弃的产品。年中,MiniMax 员工总数增长到400左右。


公司成立刚一年,杨植麟定下覆盖多个方向的目标:技术上深入无损长文本、视频生成、多阶段推理;产品上追求 DAU 增长、出海;并加大商业化力度。到年中,信奉精英策略的月之暗面,员工也翻了一番。


问题跟着爆发。MiniMax 陷入纠结与摇摆,这年1月,MiniMax 视觉模型团队开始押注视频模型;3月,他们抽调星野 /Talkie 和开放平台的一部分研发人员,做产品形态类似即梦的视频生成项目;5月,他们放弃这个产品形态项目。


到了8月,高层要求在一周内让模型 “能用”,要赶上公司的 Open Day。一位员工回忆,那时模型生成的人物 “手脚还在乱飞”,而承载视频模型的产品项目早已放弃。


最终团队先做了网页版上线,让用户测试,移动端往后延,嫁接到原本主打语音交互的海螺 AI 上。不过就像 Glow 一样,他们对这个产品期望不高。但第二个月,其网页端访问量就接近500万。


一位 MiniMax 员工回忆,2024年的大部分时间,他们都被这种 “既要又要” 的气氛影响——公司既想增长,又不想将模型往 “软色情” 方向调整,但 “一健康就不增长”。高层一度要求暂停在 Talkie、星野等产品上增加广告位,但收入下滑后又陷入焦虑。


闫俊杰说,他经历过技术被资本裹挟的过程:“如果一家企业必须靠不断融资才能前进,那它优化的就不再是产品,而是如何说服投资人继续给钱。”


月之暗面的精英策略也没有在新方向上发挥太多效果。他们想要复现 Sora 的视频模型,但效果一直未及预期,唯一的 “亮相”,是几位联合创始人在朋友圈里发布的几条视频,称由自家视频模型生成;月之暗面低调上线的两款出海产品 Ohai 和 Noisee,几个月后便停止运营。


在这期间,月之暗面创始团队出售股份,迅速在创投领域引发风波。关键不在于卖股份,而在于月之暗面背后的叙事失调。产品未定型、格局未稳固的时刻,创始团队出售股份,很容易被理解为 “急于落袋为安”。


风波之中,我们曾问他此事,他以一句 “Fake news” 简短作答。


2024年中,“大模型进展放缓” 的论调开始流行。当技术可能很难带来巨大突破时,市场和投资人衡量公司增长潜力的指标,转向最直接的 DAU 数据。


在月之暗面,张予彤主导大规模投流,拉高了 B 站等平台的 AI 产品投流价格。MiniMax 也在高层反复的纠结后,最终决定跟进。


他们再一次被资本看好。MiniMax 拿到腾讯等机构的投资;8月,月之暗面获得腾讯、高榕创投等3亿美元融资。资本意志开始更深地介入公司经营,部分投资人频繁给他们提供增长 “建议”:哪些海外 AI 应用公司增长更快,哪些投流策略更高效,哪类产品功能更能带来留存。


可一同出现的还有更强的对手。字节跳动发动了饱和式进攻:产品线覆盖一切,从生产力到娱乐,从助手到硬件。我们了解到,字节还严格控制外部 AI 产品在抖音上的投放,而豆包等作为字节系产品,还能享受折扣。


一位月之暗面员工回忆,那是公司的士气低谷,“面对字节这样的敌人,是打不过的。” 一位投资人称,如果不推动公司转型,“除了硬着头皮跟字节拼消耗,似乎别无他法”。


到这一年10月,一场数位投了大模型的投资人参加的聚会中,他们开始讨论 “如何能卖掉部分手里的大模型创业公司股份?”



追求技术可以是一种选择,但空间越来越小


DeepSeek “解救” 了 MiniMax 和月之暗面。他们靠着远超市场预期的模型,没花一分钱投流,就在一周内吸引了数千万用户,制造了中国自己的 ChatGPT 时刻。


“如果你在对手更强的赛道,那你就没有胜的可能。” 一位月之暗面员工说,DeepSeek 带来的热潮,让他明显感觉到公司内部情绪有了好转,“只要技术够强,就有机会逆天改命。”


月之暗面不再更新 K1 系列的模型,集中资源投入基础算法与新模型 K2。这个新模型被寄予厚望,月之暗面研发团队几乎全员参与,杨植麟本人也亲自下场写代码。


张予彤在社交平台上写道,“小伙伴为了这次发布直接睡在公司里”,配图是一个带有 “离发布还有0天” 标语的图片,标语下是一张沙发床。


几个月高强度开发后,月之暗面在7月发布并开源万亿参数的 MoE 模型 Kimi K2,宣称在自主编程、工具调用和数学推理等维度上超过 DeepSeek-V3 和阿里 Qwen3。在这之前,杨植麟相信 “闭源是正确的路”。《自然》杂志网站的一篇文章称其为 “中国的又一个 DeepSeek 时刻”。


MiniMax 也完成了类似的聚焦。他们将重点从 “模型与产品并重” 收缩到 “模型优先”。视频、语音等多模态模型依然在研究,这是他们有优势的方向。我们了解到,闫俊杰还把一部分产品的员工转到模型团队,并为文本模型重新分配算力,核心资源集中到语言模型的基础能力上,增加数学与编程数据的比重。他之前说,MiniMax 没必要为了一篇新闻稿,就训练一个类似 o1 那样的推理模型。


他们10月开源语言模型 M2 时,强调它的编程和推理能力突出,使用量在 OpenRouter 上已经增长到了前五。“应该创业第一天就开源。” 闫俊杰年初说。


两家公司似乎回到了刚创业时的状态,都把提升模型的能力当作主线,投资方也不再过多给公司提建议。公司的经营依赖创业者本身管理能力。


闫俊杰看上去温和,但一旦做出决定,执行起来极为坚决。在 MiniMax 创业初期,团队曾尝试过 3D 数字人方向。项目尚未上线,闫俊杰判断这条路与公司长期技术路线不符,就立即叫停。项目解散,刚组建的团队经历第一轮震荡。


2024年起,MiniMax 的中层开始密集流动:产品负责人、商务负责人、数据科学负责人、增长负责人、战投负责人等陆续离开。比如 MiniMax 对齐团队两年内换了三任负责人——第一任因与闫俊杰激烈争论技术进展,被降为普通工程师;第二任由下属提拔,半年后离职。MiniMax 早期的一百名员工,如今已走了一半。


“不是同路人的这些同事,我会请他们离开。我已经请走了几位。” 闫俊杰曾在公司全员会上说。


在他看来,好的成果不是某个人灵光一现的产物,而是科学方法和团队配合下的必然发现,哪怕个人能力不算顶尖,只要能让团队跑得更快,就是合适的人才。


闫俊杰认为,管理公司就是优化函数,目标是商业化效率、调用量等变量,管理的核心任务就是找到 “梯度下降最快的方向”,不断逼近最优解。


MiniMax 的很多决策,比如不做 3D、选择 MoE 架构、做视频模型,都属于 “算出来的结果”。甚至 MiniMax 每两周一次的全员分享会,也叫 “CD”(Coordinate Decent 算法)。 


杨植麟相信那些能提出新想法的人才,“因为在这个领域,创新本身最有价值”。他愿意为了招揽一名自己欣赏的技术人才,从北京飞到深圳,聊上十个小时,第二天赶早班机返回;也会让优秀的研究者自己一个人在异地自由工作。


他倾向于先达成共识,再迅速行动。月之暗面的第一款模型亮相时,主打20万长文本上下文。但一开始,核心团队有人并不看好这个方向。一位月之暗面早期员工回忆,2023年5月公司就有人提过做长文本,却被其他人否决,理由是算法视角里,这只是压缩问题,是工程活,不是技术突破。这个方向就没有推进。


两个月后,Anthropic 发布处理50万文本的 Claude 模型,引发行业震动。长文本成为月之暗面内部共识。“Lossless long context is everything” 成了杨植麟经常提的一句话。


但如今 AI 公司把追求模型能力当做公司经营的核心变得愈发困难。早期的 OpenAI 是一个参考答案。他们的团队延续了 “学术式” 的工作节奏,用实验和试错推动技术研究,领先技术成果诞生后加上山姆·阿尔特曼(Sam Altman)从 YC 带来的增长策略,推动公司持续发展。DeepSeek 的 “学术循环” 模式——批判性思考、原子化创新、推动科学边界——也是一种策略,但它不用太过于关注商业化和用户增长。


MiniMax 和月之暗面很难找到这样的空间和资源。这场资本密集游戏里,资金、算力和生态支持至关重要。OpenAI 的估值已达到5000亿美元,要顶着万亿美元估值上市;xAI 和 Anthropic 的估值也都逼近2000亿美元。而 MiniMax 和月之暗面的估值都在40亿美元左右。这让谁能成为中国 OpenAI 的问题变得没有意义。


体量较大的美元基金退潮后,中国拥有大规模资金的巨头不愿为创业公司持续输血,反而成为 AI 公司的竞争对手。阿里、字节、腾讯,甚至是 DeepSeek,研发基础模型都有主营业务(电商、广告、量化)供血,短期没有盈利压力。


MiniMax 和月之暗面都在尝试用更专业的功能(月之暗面的 OK Computer、深度研究;MiniMax 的专业模式)吸引用户付费订阅。但只要字节等公司的同类产品免费,去年下半年的竞争问题必然会再次出现。


他们还在继续找钱。市场消息称,MiniMax 正筹备赴港上市。月之暗面又开了一轮新融资。


大模型注定是需要几百亿美元,甚至上千亿美元投入的游戏。创业公司想要走完这条路,创始人们必须证明,这是一场需要他们参与的长期探索,才能获得更多的理解和支持。


这是一道更难的证明题:在巨头林立、算力稀缺、资本收缩的市场中,是否还有空间容纳一种既做基础研究、又不属于任何巨头的 AI 公司?


这不仅需要更多技术突破,也需要一种在当前中国环境下罕见的能力——靠投资机构和业务收入,维持一支高密度的研究团队持续产出。

咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部