AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

Sora 促AI视频领域融资热潮,这些华人创业者搭上了顺风车

1655
2024-04-27 10:36
2024-04-27 10:36
1655

图片来源Unsplash

文 | 小红帽

对于大部分初创公司来说,2023年无疑是难熬的一年。由于全球经济的不确定性和低增速带来的影响,风险投资公司(VCs)的投资意愿普遍降低。他们中的大多数选择了持币观望的策略,这无疑加剧了初创公司融资的难度。

然而,生成式人工智能领域却逆流而上,未受市场波动的影响。截至目前,热门的人工智能初创公司估值仍在持续飙升。风险投资者们对此领域充满热情,他们不惜支付额外的溢价来推高初创公司的估值。

当百度、阿里巴巴、月之暗面、智谱AI等科技巨头在AI大模型领域的竞争愈演愈烈之际,不少创业公司却开始将目光转向应用层面,寻求新的发展机遇。正如金沙江创投管理合伙人朱啸虎说的那样,“AI创业公司应该避开大模型”集火,聚焦垂直应用端。

风险投资公司也在积极寻找投资大模型领域之外的机会,他们纷纷将目光投向那些利用大模型技术开发应用的初创公司。

仅仅一个月,就有三家华人创立的生成式AI公司获得融资,且融资金额都过了千万美金。


01

那些成因“螃蟹”的初创公司


项目一:应用场景成熟的Haiper


就像ChatGPT带火了AI生成式文本,Sora的横空出世也迅速将“AI生成式视频”这个词带上了热搜,而一些相关创业公司蓄势待发。

3月7日,人工智能视频生成平台Haiper宣布完成由Octopus Ventures (章鱼风投)领投的1380万美元的种子轮融资。经过本轮融资,Haiper的总融资额已累计至1920万美元,这为公司计划在2024年顺利推进A轮融资进一步铺平道路。

Haiper于2021年底在伦敦成立,由Miao Yishu和Wang Ziyu创立,两位博士均持有牛津大学机器学习博士学位,并曾在谷歌DeepMind担任研究员。

根据职业社交平台领英的资料显示,在创立Haiper之前,Miao Yishu曾在Tiktok的全球信任与安全团队工作,任职技术主管。在拿到牛津大学的博士学位之前,Miao Yishu曾于2010年9月至2013年六月的这段时间里,在清华大学攻读数据挖掘硕士学位。

职业社交平台领英的资料显示,Miao Yishu在创立公司之前,曾在TikTok的全球信任与安全团队担任技术主管。此外,Miao Yishu在攻读牛津大学博士学位之前,曾于2010年9月至2013年6月在清华大学攻读并获得数据挖掘硕士学位。

起初,Haiper主要专注于3D重建领域。然而,在进行AI训练处理视频数据的过程中,两位创始人发现了AI视频生成这其中的商业潜力。于是,大约在7个月前,他们做出了战略性的转变,决定将重心转向视频生成领域。

虽然Haiper生成的视频片段可能还没有达到OpenAI发布样本的那种令人印象深刻的地步,但最起码在“主菜”上桌之前,它已经给大伙们提供了“前菜”试吃。

相反,目前还很少有人有机会体验Sora的功能。Haiper已经能够让用户根据文本提示创建两秒的高清晰度视频,或者在较低分辨率下生成稍长的视频剪辑。此外,Haiper还提供了通过静态图像生成动画版本或者以不同风格“重绘”视频的功能。公司还打算在近期增加使用AI技术来延长视频时长的功能。

图片来源:Haiper官网

在产品尚未正式上线之际,Haiper便积极展开了对应用场景的探索。早在1月24日,Haiper便宣布与伦敦艺术大学时装学院展开合作,借助AI技术将时装草图转化为动态视频,让设计师能够在成衣制作之前预览上身效果。紧接着,在2月9日,Haiper又宣布与京东展开合作,共同探索电商领域的应用场景。作为一款新生产品,Haiper已经开始着力为自家技术寻找多样化的应用场景了。

目前,由于Haiper的计算能力有限,制作每个样本视频大约需要一分钟的时间。生成式人力的算力成本非常“可怕”。堆积算力需要搭建昂贵的AI加速卡群组,而像英伟达H100这种加速卡的单价可能高达3万美元以上。

虽然公司目前还未公开该模型的详细信息,但Miao透露,他们已私下联系了一些开发者试用其封闭的API。他强调,开发者的反馈对于公司快速迭代模型至关重要。此外,Haiper还在考虑未来开放源代码,以便让更多人能够探索该模型在不同场景下的应用潜力。

无独有偶,在Haiper宣布完成1380万美元的种子轮融资后不久,视频大模型公司爱诗科技也于3月13日宣布完成了约一亿元人民币的A1轮融资。此轮融资由达晨财智独家投资,而光源资本则担任了独家财务顾问的角色。

项目二:中国版Sora,已实现4K分辨率视频的爱诗科技


爱诗科技来头不小,它是由字节跳动前视觉技术负责人王长虎于2023年4月创办,公司主要致力于开发AI视频生成模型及其应用。为营销、广告、游戏领域的内容创作行业提供帮助和服务。

王长虎在人工智能领域拥有丰富的产品经验。他毕业于中国科学技术大学并获得博士学位。2009年毕业后,他曾在微软亚洲研究院担任主管研究员。到了2017年初,王长虎加入字节跳动,担任过人工智能实验室总监以及集团视觉技术的负责人。

目前,在海外市场,爱诗科技的国际版AI视频生成产品PixVerse已经正式开始运营。用户可以通过网页端或者加入Discord-PixVerse服务器来体验这一产品。在今年3月,面向国内用户的爱诗大模型也已经开放内测,内测链接为https://aishiai.com/waitlist

技术上,爱诗科技采用了与Sora相同的技术路线,即DiT(Diffusion Transformer)架构。

PixVerse主要提供了文生视频、图生视频等核心功能,并且爱诗科技宣称在去年十月就已经实现了生成4K分辨率的视频内容。

以文生视频功能为例,PixVerse的产品界面提供了Prompt、Style、Aspect-ratio和Negative-prompt四个功能参数。其中,Prompt参数用于输入一段句子或关键词语来指导视频内容的生成;Style参数用于决定视频画面的风格;Aspect-ratio参数则用于设定视频的画幅比例;而Negative-prompt参数则帮助用户规避在视频中不希望呈现的内容。

图片来源:PixVerse国际版产品页面

现在的AI视频生成领域就好似GPT-2的前夕,而VCs现在需要做的就是在这个“泡泡”吹的足够大之前押注,才能满足“害怕错过“的心理需求。

正如投资机构a16z在投资备忘录所注解的那样“我们在过去的一年时间里在生成式视频这个领域频繁发力,但貌似还是不够。在消费者每天使用这些产品之前,还有很长的路要走。视频的‘ChatGPT时刻什么时候会到来?”

项目三:功能“量大管饱”的HeyGen


正是这种“害怕错过”的投资人心理造就了生成式视频领域的融资热潮。除了前两家公司,第三家我们要介绍的公司也是由华人创办的。

早在去年,这家名为HeyGen的公司就凭借一系列AI生成式创意视频而名声大噪,其中包括让美国知名歌手泰勒·斯威夫特说普通话,以及赵本山和郭德纲讲英语的精彩内容。

3月28日, 这家仅成立三年的AI视频生成创业公司宣布正在新一轮6000万美元的融资。而该轮融资之后,HeyGen的估值也来到了4.4亿美元。

HeyGen于2020年11月在洛杉矶创立,由前Snap软件工程师徐卓及其同济大学校友、前字节产品设计师梁望(Wayne Liang)共同发起。红杉资本中国、真格基金等机构均对其进行了重要投资。

HeyGen涵盖了丰富的生成式视频功能,不仅支持主播换脸、文字转口播视频,还能创建虚拟主播,并具备语音翻译与克隆等功能。

具体来看,HeyGen的文本转语音功能为用户提供了将书面文本转化为自然语音的便捷途径。通过这一功能,用户可以选择超过40种语言和300多种声音,用户还可以在脚本中的任意位置添加半秒停顿,以确保生成的语音听起来更加自然流畅。

HeyGen提供了超过100种AI头像,这些头像涵盖了各种族裔、年龄以及不同的身形姿势。用户只需通过书写或音频录制脚本,即可轻松生成AI头像视频,并且在几分钟内实现口型同步。

图片来源:HenGen网页

HeyGen的TalkingPhoto功能让用户能够将任何图像转变为会说话的图片。通过这一功能,用户可以为照片添加真实的人类声音,将原本静态的视觉效果转化为生动的动态动画。用户只需为照片的对话编写一个脚本,然后观看图片变得栩栩如生。

HeyGen联合创始人兼CEO徐卓(Joshua Xu)在近期透露,公司目前的年化收入已经超过了2000万美元,并且曾连续9个月实现了50%的月环比增长率。这一增速远超过其他竞品。

实际上,自2023年起,HeyGen开始逐渐剥离中国投资者在公司的影响。去年12月11日,HeyGen的国内实体诗云科技因决议解散,宣布申请注销登记,其业务重心也完全转移至美国市场。据知情人士援引公司内部人员的解释,数字人领域的技术门槛相对较低,国内市场竞争日益激烈,这可能是HeyGen选择出海的重要考量因素。


02

创业者们面临的挑战


AI 视频生成的这一波集中融资,与 Sora的发布、并展现远高于之前同类产品的惊艳效果有着很强的关联。

AI视频生成领域目前的竞争日益激烈。除了OpenAI最近推出的Sora之外,市场上还涌现了众多强有力的竞争者。其中,谷歌和英伟达支持的Runway已经成功筹集超过2.3亿美元的资金。同时,谷歌和Meta等科技巨头也各自研发了视频生成模型。去年,人工智能图片生成公司Stability AI在DEMO预览中也宣布了Stable Diffusion 视频模型。

从成本角度来看,Sora的算力需求相较于GPT-4高出了多个数量级。这种庞大的算力需求无疑给视频生成领域的初创公司带来了巨大的商业化挑战和融资压力。对于初创公司而言,如何在保证产品质量的同时,有效控制成本,实现商业化盈利,是一个亟待解决的问题。同时,如何吸引投资者的目光,获得足够的资金支持,以应对高额的算力成本,也是这些公司必须面对的考验。因此,对于初创公司来说,如何在视频生成领域取得突破,既需要技术创新,也需要商业模式的创新。

3.12 厦门coupang-文章页底部图片
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
美国农业部下调2025年农业收入预期,疲软态势将持续至2026年
美国农业部最新的农业收入预测强化了美国农业面临的艰难现实。
商店页面评分对投放影响
Google Play 页面评分,为什么很重要?很多团队把 Google Play 的评分当成“面子工程”:
Shopee发布紧急通知提醒;越南电商订单剧增,快递不堪重负;金华2025年进出口额首超万亿元
01 Shopee发布紧急通知提醒据外媒消息,面对猖獗的高科技诈骗,Shopee 正式发布紧急警告,提醒用户注意安全“红线”。第一条警告直接针对虚假信息和电子邮件的复杂程度。诈骗分子现在经常冒充 Shopee 发送拼写错误的通知、索取个人信息或提供诱人的工作机会。为了避免落入此类陷阱,用户必须记住,所有合法通知只会出现在 Shopee 应用或经过验证的社交媒体账户(带有蓝色勾号的账户)上。一条黄金法则是:绝对不要点击任何来路不明的链接或下载任何来自未知来源的附件,并立即向客服举报任何异常活动。关于账户安全,Shopee 特别强调了“重置密码”链接的风险。
长江和记:警告马士基
围绕巴拿马运河两端关键集装箱码头的运营权争议持续发酵。2月12日,长江和记实业发布最新声明称,已依据投资保护条约向巴拿马共和国正式发出争端通知并邀请磋商,同时警告马士基旗下APM Terminals(APMT),未经同意接管相关港口将引发法律行动。长和强调,两座码头能否持续运营,“完全取决于巴拿马最高法院和巴拿马政府的行动”,已不在公司控制范围之内。长江和记12日的一份声明称,其正在采取进一步措施,以保障其在这两处巴拿马港口的“权益”。声明称,和记港口集团有限公司已通知马士基航运集团,在未经长江和记同意下,任何由马士基航运集团或其任何联属公司,在任何时期、以任何方式接管这两处港口的管理或运营,将引发“法律行动”。
靠一个睡袋,一年卖出3300万美金?从母婴爆品到品牌闭环,它做对了什么?
Kyte Baby的案例说明,真正有生命力的品牌,并不是靠概念创新突围,而是通过对真实需求的理解建立连接。
《非洲B2C电商与支付2026》报告:即时支付与移动基础设施驱动万亿美元数字商业新时代
最新报告显示非洲电商规模将于2033年突破万亿美元,即时支付与移动金融成为核心驱动力,智能手机普及和数字基础设施升级正重塑大陆商业格局。随着移动互联网、金融科技与即时支付体系的快速发展,非洲数字商业正在进入结构性扩张阶段。最新发布的《Africa B2C E-Commerce & Payments 2026》报告指出,非洲电商与数字支付生态正在经历深刻转型,移动优先与实时支付正成为推动市场增长的关键力量。非洲电商迈向万亿美元规模报告预测,非洲电子商务市场规模将从 2024年的3170亿美元增长至2033年超过1万亿美元,进入长期结构性增长阶段。
亚马逊FBA新规:移除与销毁费用将按单件收取
AMZ123获悉,近日,亚马逊宣布,将调整其对 FBA(Fulfillment by Amazon)库存移除和销毁费用的计费方式,但相关费用标准本身不会发生变化。该调整将于 2026 年 2 月 15 日起正式生效,适用于当日及之后创建的所有新移除或销毁订单。根据亚马逊发布的公告,未来 FBA 移除和销毁费用将改为“按单件商品”在商品被实际移除或销毁时逐一收取。此前,亚马逊是在整个移除或销毁订单完成后,一次性向卖家收取全部相关费用。亚马逊在公告中指出,这一改变旨在为卖家提供更清晰的费用可见性,让卖家能够更直观地了解每一件商品被移除或销毁时所产生的具体费用。
暴雪重创,亚马逊卖家冰火两重天
截至 2026 年 2 月 3 日,美国正遭遇 “炸弹气旋” 引发的冬季风暴,东南部(北卡、南卡、佐治亚、弗吉
亚马逊链接优化你做对了吗?
作为亚马逊运营,标题和图片是Listing 点击与转化的重要因素,我们需要通过数据表现,判断链接在什么时候需要
这3款产品已出现大量同款,其外观专利也在路上了!
近日有500多条外观专利正处于进行预审处理的阶段,其中这3个专利在亚马逊上有同款如果你正在销售或准备上线同类产品,可以提前对照产品的外观特征进行排查01旗杆支架先看看它的外观,这款旗杆支架采用双管设计,能将旗子直立或者45°固定,侧面有3个锁紧孔底座两侧留有缺口,便于定位安装/用轧带固定采用矩形底座,四角有预留安装孔;底部可见三个矩形凹槽和一个通孔从外观上来说,和目前市面上的其他双管旗杆产品相比,主要存在以下差异点:底座侧面无缺口;侧面锁紧孔数量不一右侧产品为亚马逊同款02防滑贴纸这种波浪型防滑贴纸的专利,除了看外形,还要看纹理其表面纹理整体呈波浪形,而且细看其纹理是一条条凸起的棱条点击图片放大如果你的产品也是波
今年4月,亚马逊或继续裁员!
裁员、重组、压预算,亚马逊的“紧日子”并没有结束。亚马逊的裁员潮已持续数月。路透社报道称,自2025年10月以来,亚马逊企业端累计宣布/推进的岗位调整规模约3万人,其中2026年1月下旬公开确认的一轮约1.6万人。而进入2月,裁撤开始从“总量口径”走向“执行清单”。AMZ123获悉,多份美国地方 WARN 文件与媒体披露显示,亚马逊下一轮裁撤的落地信息进一步明朗:相关裁撤的执行节点主要落在2026年4月28日前后,并将延续至6月下旬。从披露细节看,本轮裁撤呈现出两个关键词:技术岗位居多、区域集中落地。
东莞过亿大卖遭TRO,400万资金被冻结!
跨境圈里,TRO最狠的地方不在“官司输赢”,而在“先把生意按停”。TRO落到谁头上,体验其实都差不多:链接出状态、回款受限、运营动作被迫停一停。区别在于承受力:小卖家是“伤筋动骨”,一年白干;头部卖家更像“主引擎熄火”,一旦头部链接和资金链同时被卡,损失会按天放大。近期AMZ123从业内听闻,东莞亿级大卖赵先生就经历了这样一次“被按停”,险些一夜之间破产后起死回生的两个月。为还原事件的关键节点,AMZ123随后联系并采访了当事人赵先生及其代理律师团队。赵先生在采访中回忆称,这次“被按停”的经历,几乎让他第一次真正体会到:跨境卖家对TRO/PI的恐惧,很多时候来自后台,而不是法庭。赵先生的遭遇始于2025年10月。
亚马逊如何找到你的竞争对手?
竞争对手分析是亚马逊精细化运营的核心环节,精准定位竞品能够帮助你明确市场边界、优化产品策略、制定高效推广计划。本文将从判定标准、实操途径、核心原则三个维度,为你提供一套可直接落地的竞品挖掘方法。一、明确竞争对手只有先界定“谁是你的竞争对手”,后续的分析才有意义。判定的核心逻辑是:满足同一客户群体需求,具备高度可替代性。具体可通过以下4个维度精准筛选:相同的类目节点:优先选择与你的产品共享2-3级核心类目的ASIN。类目节点越精准,竞争相关性越强。相仿的外观设计:产品视觉呈现高度相似(如同款型、同材质外观),容易被消费者视为直接替代选项。近似的功能属性:核心功能与你的产品匹配,能够解决同一用户痛点。
30天卖了4万单,它凭借“回忆杀”成TikTok销量王
我在TikTok上卖“情侣年鉴”已月入400万+
《中企出海美国季度研究报告》PDF下载
近年来,随着全球化进程的深化与中国经济实力的持续提升,越来越多的中国企业将目光投向海外市场。美国作为全球最大经济体创新高地和消费市场,始终是中企出海战略中的关键目标。从制造业到科技领域,从消费品到金融服务,中国企业的国际化步伐不断加快,既彰显了“中国智造”的全球竞争力,也面临复杂的政策环境、文化差异与市场竞争等挑战。
《跨境蓝海拉美市场洞察 - 墨西哥篇》PDF下载
墨西哥位于北美大陆南部,北邻美国,政局稳定,法律健全,是拉丁美洲地区第一贸易大国和重要的外国直接投资目的地。墨西哥拥有 1.28亿人口,是仅次于巴西的拉美第二大经济体,同时也是拉美第三大线上零售市场,无论是互联网的普及率还是使用率在拉美市场都处于佼佼者。
《东南亚出海合规实操指南手册》PDF下载
近年来,东南亚电商市场以迅猛的增长态势成为全球贸易的新蓝海,印尼马来西亚、新加坡等六国凭借庞大的人口基数、持续提升的互联网渗透率吸引着无数中国卖家前来布局。
《2025中国新能源汽车产业链出海洞察报告 - 匈牙利篇》PDF下载
中国汽车市场新能源汽车渗透率已达50%,各主机厂纷纷开启价格战,让利消费者,并承担相应的利润损失,在中国新能源汽车市场逐渐成为红海的的大背景下,海逐渐成为各主机厂主动或被动的选择。
《2024哥伦比亚电商市场概览报告》PDF下载
哥伦比亚位于南美洲西北部,是拉丁美洲第三大国家,北部是加勒比海,东部与委内瑞拉接壤,东南方是巴西,南方是秘鲁和厄瓜多尔,西部是巴拿马和太平洋。

《2026独立站卖家日历》PDF下载
2026 独立站卖家日历 2026 全年营销节奏
《2025中东北非消费者数字经济报告》PDF下载
2025年的报告不仅持续跟踪数字经济的同比增长,也更深入:我们探讨了新兴技术对下一波数字化转型的影响力,还首次将中东北非国家及地区的消费者行为偏好与全球其他市场进行对比。
《2025年终大促旺季AI消费趋势报告》PDF下载
随着人工智能 AI的爆发式增长,如 ChatGPT、Perplexity 和Llama等交互式聊天机器人正在渐渐成为大众研究和推荐的首选工具。根据 AI智能体功能的更新迭代,目前已经可以完成网购下单、预订服务、及交易支付,现已被统称为 AI智能体电商Agentic Commerce,且其采用率正呈现出滚雪球式的增长。
亚马逊资讯
AMZ123旗下亚马逊资讯发布平台,专注亚马逊全球热点事件,为广大卖家提供亚马逊最新动态、最热新闻。
北美电商资讯
AMZ123旗下北美跨境电商新闻栏目,专注北美跨境电商热点资讯,为广大卖家提供北美跨境电商最新动态、最热新闻。
亿邦动力网
消除一切电商知识鸿沟,每日发布独家重磅新闻。
AMZ123选品观察员
选品推荐及选品技巧分享。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
跨境平台资讯
AMZ123旗下跨境电商平台新闻栏目,专注全球跨境电商平台热点事件,为广大卖家提供跨境电商平台最新动态、最热新闻。
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
跨境电商赢商荟
跨境电商行业唯一一家一年365天不断更的媒体!
首页
跨境头条
文章详情
Sora 促AI视频领域融资热潮,这些华人创业者搭上了顺风车
MorketingGlobal
2024-04-27 10:36
1655

图片来源Unsplash

文 | 小红帽

对于大部分初创公司来说,2023年无疑是难熬的一年。由于全球经济的不确定性和低增速带来的影响,风险投资公司(VCs)的投资意愿普遍降低。他们中的大多数选择了持币观望的策略,这无疑加剧了初创公司融资的难度。

然而,生成式人工智能领域却逆流而上,未受市场波动的影响。截至目前,热门的人工智能初创公司估值仍在持续飙升。风险投资者们对此领域充满热情,他们不惜支付额外的溢价来推高初创公司的估值。

当百度、阿里巴巴、月之暗面、智谱AI等科技巨头在AI大模型领域的竞争愈演愈烈之际,不少创业公司却开始将目光转向应用层面,寻求新的发展机遇。正如金沙江创投管理合伙人朱啸虎说的那样,“AI创业公司应该避开大模型”集火,聚焦垂直应用端。

风险投资公司也在积极寻找投资大模型领域之外的机会,他们纷纷将目光投向那些利用大模型技术开发应用的初创公司。

仅仅一个月,就有三家华人创立的生成式AI公司获得融资,且融资金额都过了千万美金。


01

那些成因“螃蟹”的初创公司


项目一:应用场景成熟的Haiper


就像ChatGPT带火了AI生成式文本,Sora的横空出世也迅速将“AI生成式视频”这个词带上了热搜,而一些相关创业公司蓄势待发。

3月7日,人工智能视频生成平台Haiper宣布完成由Octopus Ventures (章鱼风投)领投的1380万美元的种子轮融资。经过本轮融资,Haiper的总融资额已累计至1920万美元,这为公司计划在2024年顺利推进A轮融资进一步铺平道路。

Haiper于2021年底在伦敦成立,由Miao Yishu和Wang Ziyu创立,两位博士均持有牛津大学机器学习博士学位,并曾在谷歌DeepMind担任研究员。

根据职业社交平台领英的资料显示,在创立Haiper之前,Miao Yishu曾在Tiktok的全球信任与安全团队工作,任职技术主管。在拿到牛津大学的博士学位之前,Miao Yishu曾于2010年9月至2013年六月的这段时间里,在清华大学攻读数据挖掘硕士学位。

职业社交平台领英的资料显示,Miao Yishu在创立公司之前,曾在TikTok的全球信任与安全团队担任技术主管。此外,Miao Yishu在攻读牛津大学博士学位之前,曾于2010年9月至2013年6月在清华大学攻读并获得数据挖掘硕士学位。

起初,Haiper主要专注于3D重建领域。然而,在进行AI训练处理视频数据的过程中,两位创始人发现了AI视频生成这其中的商业潜力。于是,大约在7个月前,他们做出了战略性的转变,决定将重心转向视频生成领域。

虽然Haiper生成的视频片段可能还没有达到OpenAI发布样本的那种令人印象深刻的地步,但最起码在“主菜”上桌之前,它已经给大伙们提供了“前菜”试吃。

相反,目前还很少有人有机会体验Sora的功能。Haiper已经能够让用户根据文本提示创建两秒的高清晰度视频,或者在较低分辨率下生成稍长的视频剪辑。此外,Haiper还提供了通过静态图像生成动画版本或者以不同风格“重绘”视频的功能。公司还打算在近期增加使用AI技术来延长视频时长的功能。

图片来源:Haiper官网

在产品尚未正式上线之际,Haiper便积极展开了对应用场景的探索。早在1月24日,Haiper便宣布与伦敦艺术大学时装学院展开合作,借助AI技术将时装草图转化为动态视频,让设计师能够在成衣制作之前预览上身效果。紧接着,在2月9日,Haiper又宣布与京东展开合作,共同探索电商领域的应用场景。作为一款新生产品,Haiper已经开始着力为自家技术寻找多样化的应用场景了。

目前,由于Haiper的计算能力有限,制作每个样本视频大约需要一分钟的时间。生成式人力的算力成本非常“可怕”。堆积算力需要搭建昂贵的AI加速卡群组,而像英伟达H100这种加速卡的单价可能高达3万美元以上。

虽然公司目前还未公开该模型的详细信息,但Miao透露,他们已私下联系了一些开发者试用其封闭的API。他强调,开发者的反馈对于公司快速迭代模型至关重要。此外,Haiper还在考虑未来开放源代码,以便让更多人能够探索该模型在不同场景下的应用潜力。

无独有偶,在Haiper宣布完成1380万美元的种子轮融资后不久,视频大模型公司爱诗科技也于3月13日宣布完成了约一亿元人民币的A1轮融资。此轮融资由达晨财智独家投资,而光源资本则担任了独家财务顾问的角色。

项目二:中国版Sora,已实现4K分辨率视频的爱诗科技


爱诗科技来头不小,它是由字节跳动前视觉技术负责人王长虎于2023年4月创办,公司主要致力于开发AI视频生成模型及其应用。为营销、广告、游戏领域的内容创作行业提供帮助和服务。

王长虎在人工智能领域拥有丰富的产品经验。他毕业于中国科学技术大学并获得博士学位。2009年毕业后,他曾在微软亚洲研究院担任主管研究员。到了2017年初,王长虎加入字节跳动,担任过人工智能实验室总监以及集团视觉技术的负责人。

目前,在海外市场,爱诗科技的国际版AI视频生成产品PixVerse已经正式开始运营。用户可以通过网页端或者加入Discord-PixVerse服务器来体验这一产品。在今年3月,面向国内用户的爱诗大模型也已经开放内测,内测链接为https://aishiai.com/waitlist

技术上,爱诗科技采用了与Sora相同的技术路线,即DiT(Diffusion Transformer)架构。

PixVerse主要提供了文生视频、图生视频等核心功能,并且爱诗科技宣称在去年十月就已经实现了生成4K分辨率的视频内容。

以文生视频功能为例,PixVerse的产品界面提供了Prompt、Style、Aspect-ratio和Negative-prompt四个功能参数。其中,Prompt参数用于输入一段句子或关键词语来指导视频内容的生成;Style参数用于决定视频画面的风格;Aspect-ratio参数则用于设定视频的画幅比例;而Negative-prompt参数则帮助用户规避在视频中不希望呈现的内容。

图片来源:PixVerse国际版产品页面

现在的AI视频生成领域就好似GPT-2的前夕,而VCs现在需要做的就是在这个“泡泡”吹的足够大之前押注,才能满足“害怕错过“的心理需求。

正如投资机构a16z在投资备忘录所注解的那样“我们在过去的一年时间里在生成式视频这个领域频繁发力,但貌似还是不够。在消费者每天使用这些产品之前,还有很长的路要走。视频的‘ChatGPT时刻什么时候会到来?”

项目三:功能“量大管饱”的HeyGen


正是这种“害怕错过”的投资人心理造就了生成式视频领域的融资热潮。除了前两家公司,第三家我们要介绍的公司也是由华人创办的。

早在去年,这家名为HeyGen的公司就凭借一系列AI生成式创意视频而名声大噪,其中包括让美国知名歌手泰勒·斯威夫特说普通话,以及赵本山和郭德纲讲英语的精彩内容。

3月28日, 这家仅成立三年的AI视频生成创业公司宣布正在新一轮6000万美元的融资。而该轮融资之后,HeyGen的估值也来到了4.4亿美元。

HeyGen于2020年11月在洛杉矶创立,由前Snap软件工程师徐卓及其同济大学校友、前字节产品设计师梁望(Wayne Liang)共同发起。红杉资本中国、真格基金等机构均对其进行了重要投资。

HeyGen涵盖了丰富的生成式视频功能,不仅支持主播换脸、文字转口播视频,还能创建虚拟主播,并具备语音翻译与克隆等功能。

具体来看,HeyGen的文本转语音功能为用户提供了将书面文本转化为自然语音的便捷途径。通过这一功能,用户可以选择超过40种语言和300多种声音,用户还可以在脚本中的任意位置添加半秒停顿,以确保生成的语音听起来更加自然流畅。

HeyGen提供了超过100种AI头像,这些头像涵盖了各种族裔、年龄以及不同的身形姿势。用户只需通过书写或音频录制脚本,即可轻松生成AI头像视频,并且在几分钟内实现口型同步。

图片来源:HenGen网页

HeyGen的TalkingPhoto功能让用户能够将任何图像转变为会说话的图片。通过这一功能,用户可以为照片添加真实的人类声音,将原本静态的视觉效果转化为生动的动态动画。用户只需为照片的对话编写一个脚本,然后观看图片变得栩栩如生。

HeyGen联合创始人兼CEO徐卓(Joshua Xu)在近期透露,公司目前的年化收入已经超过了2000万美元,并且曾连续9个月实现了50%的月环比增长率。这一增速远超过其他竞品。

实际上,自2023年起,HeyGen开始逐渐剥离中国投资者在公司的影响。去年12月11日,HeyGen的国内实体诗云科技因决议解散,宣布申请注销登记,其业务重心也完全转移至美国市场。据知情人士援引公司内部人员的解释,数字人领域的技术门槛相对较低,国内市场竞争日益激烈,这可能是HeyGen选择出海的重要考量因素。


02

创业者们面临的挑战


AI 视频生成的这一波集中融资,与 Sora的发布、并展现远高于之前同类产品的惊艳效果有着很强的关联。

AI视频生成领域目前的竞争日益激烈。除了OpenAI最近推出的Sora之外,市场上还涌现了众多强有力的竞争者。其中,谷歌和英伟达支持的Runway已经成功筹集超过2.3亿美元的资金。同时,谷歌和Meta等科技巨头也各自研发了视频生成模型。去年,人工智能图片生成公司Stability AI在DEMO预览中也宣布了Stable Diffusion 视频模型。

从成本角度来看,Sora的算力需求相较于GPT-4高出了多个数量级。这种庞大的算力需求无疑给视频生成领域的初创公司带来了巨大的商业化挑战和融资压力。对于初创公司而言,如何在保证产品质量的同时,有效控制成本,实现商业化盈利,是一个亟待解决的问题。同时,如何吸引投资者的目光,获得足够的资金支持,以应对高额的算力成本,也是这些公司必须面对的考验。因此,对于初创公司来说,如何在视频生成领域取得突破,既需要技术创新,也需要商业模式的创新。

咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部