AMZ123跨境卖家导航
拖动LOGO到书签栏,立即收藏AMZ123
首页跨境头条文章详情

Sora 促AI视频领域融资热潮,这些华人创业者搭上了顺风车

1376
2024-04-27 10:36
2024-04-27 10:36
1376

图片来源Unsplash

文 | 小红帽

对于大部分初创公司来说,2023年无疑是难熬的一年。由于全球经济的不确定性和低增速带来的影响,风险投资公司(VCs)的投资意愿普遍降低。他们中的大多数选择了持币观望的策略,这无疑加剧了初创公司融资的难度。

然而,生成式人工智能领域却逆流而上,未受市场波动的影响。截至目前,热门的人工智能初创公司估值仍在持续飙升。风险投资者们对此领域充满热情,他们不惜支付额外的溢价来推高初创公司的估值。

当百度、阿里巴巴、月之暗面、智谱AI等科技巨头在AI大模型领域的竞争愈演愈烈之际,不少创业公司却开始将目光转向应用层面,寻求新的发展机遇。正如金沙江创投管理合伙人朱啸虎说的那样,“AI创业公司应该避开大模型”集火,聚焦垂直应用端。

风险投资公司也在积极寻找投资大模型领域之外的机会,他们纷纷将目光投向那些利用大模型技术开发应用的初创公司。

仅仅一个月,就有三家华人创立的生成式AI公司获得融资,且融资金额都过了千万美金。


01

那些成因“螃蟹”的初创公司


项目一:应用场景成熟的Haiper


就像ChatGPT带火了AI生成式文本,Sora的横空出世也迅速将“AI生成式视频”这个词带上了热搜,而一些相关创业公司蓄势待发。

3月7日,人工智能视频生成平台Haiper宣布完成由Octopus Ventures (章鱼风投)领投的1380万美元的种子轮融资。经过本轮融资,Haiper的总融资额已累计至1920万美元,这为公司计划在2024年顺利推进A轮融资进一步铺平道路。

Haiper于2021年底在伦敦成立,由Miao Yishu和Wang Ziyu创立,两位博士均持有牛津大学机器学习博士学位,并曾在谷歌DeepMind担任研究员。

根据职业社交平台领英的资料显示,在创立Haiper之前,Miao Yishu曾在Tiktok的全球信任与安全团队工作,任职技术主管。在拿到牛津大学的博士学位之前,Miao Yishu曾于2010年9月至2013年六月的这段时间里,在清华大学攻读数据挖掘硕士学位。

职业社交平台领英的资料显示,Miao Yishu在创立公司之前,曾在TikTok的全球信任与安全团队担任技术主管。此外,Miao Yishu在攻读牛津大学博士学位之前,曾于2010年9月至2013年6月在清华大学攻读并获得数据挖掘硕士学位。

起初,Haiper主要专注于3D重建领域。然而,在进行AI训练处理视频数据的过程中,两位创始人发现了AI视频生成这其中的商业潜力。于是,大约在7个月前,他们做出了战略性的转变,决定将重心转向视频生成领域。

虽然Haiper生成的视频片段可能还没有达到OpenAI发布样本的那种令人印象深刻的地步,但最起码在“主菜”上桌之前,它已经给大伙们提供了“前菜”试吃。

相反,目前还很少有人有机会体验Sora的功能。Haiper已经能够让用户根据文本提示创建两秒的高清晰度视频,或者在较低分辨率下生成稍长的视频剪辑。此外,Haiper还提供了通过静态图像生成动画版本或者以不同风格“重绘”视频的功能。公司还打算在近期增加使用AI技术来延长视频时长的功能。

图片来源:Haiper官网

在产品尚未正式上线之际,Haiper便积极展开了对应用场景的探索。早在1月24日,Haiper便宣布与伦敦艺术大学时装学院展开合作,借助AI技术将时装草图转化为动态视频,让设计师能够在成衣制作之前预览上身效果。紧接着,在2月9日,Haiper又宣布与京东展开合作,共同探索电商领域的应用场景。作为一款新生产品,Haiper已经开始着力为自家技术寻找多样化的应用场景了。

目前,由于Haiper的计算能力有限,制作每个样本视频大约需要一分钟的时间。生成式人力的算力成本非常“可怕”。堆积算力需要搭建昂贵的AI加速卡群组,而像英伟达H100这种加速卡的单价可能高达3万美元以上。

虽然公司目前还未公开该模型的详细信息,但Miao透露,他们已私下联系了一些开发者试用其封闭的API。他强调,开发者的反馈对于公司快速迭代模型至关重要。此外,Haiper还在考虑未来开放源代码,以便让更多人能够探索该模型在不同场景下的应用潜力。

无独有偶,在Haiper宣布完成1380万美元的种子轮融资后不久,视频大模型公司爱诗科技也于3月13日宣布完成了约一亿元人民币的A1轮融资。此轮融资由达晨财智独家投资,而光源资本则担任了独家财务顾问的角色。

项目二:中国版Sora,已实现4K分辨率视频的爱诗科技


爱诗科技来头不小,它是由字节跳动前视觉技术负责人王长虎于2023年4月创办,公司主要致力于开发AI视频生成模型及其应用。为营销、广告、游戏领域的内容创作行业提供帮助和服务。

王长虎在人工智能领域拥有丰富的产品经验。他毕业于中国科学技术大学并获得博士学位。2009年毕业后,他曾在微软亚洲研究院担任主管研究员。到了2017年初,王长虎加入字节跳动,担任过人工智能实验室总监以及集团视觉技术的负责人。

目前,在海外市场,爱诗科技的国际版AI视频生成产品PixVerse已经正式开始运营。用户可以通过网页端或者加入Discord-PixVerse服务器来体验这一产品。在今年3月,面向国内用户的爱诗大模型也已经开放内测,内测链接为https://aishiai.com/waitlist

技术上,爱诗科技采用了与Sora相同的技术路线,即DiT(Diffusion Transformer)架构。

PixVerse主要提供了文生视频、图生视频等核心功能,并且爱诗科技宣称在去年十月就已经实现了生成4K分辨率的视频内容。

以文生视频功能为例,PixVerse的产品界面提供了Prompt、Style、Aspect-ratio和Negative-prompt四个功能参数。其中,Prompt参数用于输入一段句子或关键词语来指导视频内容的生成;Style参数用于决定视频画面的风格;Aspect-ratio参数则用于设定视频的画幅比例;而Negative-prompt参数则帮助用户规避在视频中不希望呈现的内容。

图片来源:PixVerse国际版产品页面

现在的AI视频生成领域就好似GPT-2的前夕,而VCs现在需要做的就是在这个“泡泡”吹的足够大之前押注,才能满足“害怕错过“的心理需求。

正如投资机构a16z在投资备忘录所注解的那样“我们在过去的一年时间里在生成式视频这个领域频繁发力,但貌似还是不够。在消费者每天使用这些产品之前,还有很长的路要走。视频的‘ChatGPT时刻什么时候会到来?”

项目三:功能“量大管饱”的HeyGen


正是这种“害怕错过”的投资人心理造就了生成式视频领域的融资热潮。除了前两家公司,第三家我们要介绍的公司也是由华人创办的。

早在去年,这家名为HeyGen的公司就凭借一系列AI生成式创意视频而名声大噪,其中包括让美国知名歌手泰勒·斯威夫特说普通话,以及赵本山和郭德纲讲英语的精彩内容。

3月28日, 这家仅成立三年的AI视频生成创业公司宣布正在新一轮6000万美元的融资。而该轮融资之后,HeyGen的估值也来到了4.4亿美元。

HeyGen于2020年11月在洛杉矶创立,由前Snap软件工程师徐卓及其同济大学校友、前字节产品设计师梁望(Wayne Liang)共同发起。红杉资本中国、真格基金等机构均对其进行了重要投资。

HeyGen涵盖了丰富的生成式视频功能,不仅支持主播换脸、文字转口播视频,还能创建虚拟主播,并具备语音翻译与克隆等功能。

具体来看,HeyGen的文本转语音功能为用户提供了将书面文本转化为自然语音的便捷途径。通过这一功能,用户可以选择超过40种语言和300多种声音,用户还可以在脚本中的任意位置添加半秒停顿,以确保生成的语音听起来更加自然流畅。

HeyGen提供了超过100种AI头像,这些头像涵盖了各种族裔、年龄以及不同的身形姿势。用户只需通过书写或音频录制脚本,即可轻松生成AI头像视频,并且在几分钟内实现口型同步。

图片来源:HenGen网页

HeyGen的TalkingPhoto功能让用户能够将任何图像转变为会说话的图片。通过这一功能,用户可以为照片添加真实的人类声音,将原本静态的视觉效果转化为生动的动态动画。用户只需为照片的对话编写一个脚本,然后观看图片变得栩栩如生。

HeyGen联合创始人兼CEO徐卓(Joshua Xu)在近期透露,公司目前的年化收入已经超过了2000万美元,并且曾连续9个月实现了50%的月环比增长率。这一增速远超过其他竞品。

实际上,自2023年起,HeyGen开始逐渐剥离中国投资者在公司的影响。去年12月11日,HeyGen的国内实体诗云科技因决议解散,宣布申请注销登记,其业务重心也完全转移至美国市场。据知情人士援引公司内部人员的解释,数字人领域的技术门槛相对较低,国内市场竞争日益激烈,这可能是HeyGen选择出海的重要考量因素。


02

创业者们面临的挑战


AI 视频生成的这一波集中融资,与 Sora的发布、并展现远高于之前同类产品的惊艳效果有着很强的关联。

AI视频生成领域目前的竞争日益激烈。除了OpenAI最近推出的Sora之外,市场上还涌现了众多强有力的竞争者。其中,谷歌和英伟达支持的Runway已经成功筹集超过2.3亿美元的资金。同时,谷歌和Meta等科技巨头也各自研发了视频生成模型。去年,人工智能图片生成公司Stability AI在DEMO预览中也宣布了Stable Diffusion 视频模型。

从成本角度来看,Sora的算力需求相较于GPT-4高出了多个数量级。这种庞大的算力需求无疑给视频生成领域的初创公司带来了巨大的商业化挑战和融资压力。对于初创公司而言,如何在保证产品质量的同时,有效控制成本,实现商业化盈利,是一个亟待解决的问题。同时,如何吸引投资者的目光,获得足够的资金支持,以应对高额的算力成本,也是这些公司必须面对的考验。因此,对于初创公司来说,如何在视频生成领域取得突破,既需要技术创新,也需要商业模式的创新。

12.26 深圳 emag沙龙-文章页底部图片
TikTok、Facebook、谷歌、Twitter广告服务,0门槛抢占全球流量!
极速开户+优化投流+风险保障+效果跟踪,仅需4步,轻松撬动亿万海外流量,让品牌销量翻倍增长!
已成功开通5000+账户
二维码
免责声明
本文链接:
本文经作者许可发布在AMZ123跨境头条,如有疑问,请联系客服。
最新热门报告作者标签
25年亚太电商报告:新兴与成熟市场差异显著
AMZ123获悉,近日,PCMI发布了《2025年亚太电商消费者趋势报告》。随着电商持续渗透全球消费市场,支付方式的变化正成为影响电商增长结构和区域差异的重要因素。在亚太地区,电商市场快速增长,同时支付方式也呈现出高度多样化特征。此次报告通过图表和数据分析,系统呈现亚太地区(不含中国)11个国家消费者的支付习惯、电商市场规模变化以及潜在增长空间,为卖家和品牌判断市场机会、投资方向提供参考。一、亚太市场规模报告显示,亚太地区电商整体呈现高增长趋势。2025年亚太地区电商规模将首次突破1.1万亿美元,预计在2025至2027年间保持12%的年复合增长率,到2027年市场规模将超过1.5万亿美元。
Shopee越南双十二用户活跃度提升,直播售出超5000万件商品
AMZ123获悉,近日,2025年12月,Shopee在越南结束了12.12生日超级促销活动。作为Shopee成立10周年的重要节点,本次大促期间平台用户活跃度和转化表现显著提升,直播与短视频内容成为推动成交的重要渠道。数据显示,仅在12月12日当天,Shopee在越南的访问量就超过1200万次;为期两周的活动期间,用户累计节省金额超过4万亿越南盾。在促销活动之外,Shopee在本次12.12期间大幅强化内容与娱乐元素,通过音乐演出、综艺衍生内容和直播互动等形式提升用户参与度。
关税压顶、税单敲门!2025跨境电商十大事件回顾
专栏介绍2025年,跨境电商行业经历了一场深刻的范式转换。旧增长秩序已被改写,行业竞争已从流量争夺,升维为供应韧性、成本控制与合规运营的系统性较量。周期更迭,潮起潮落。行业的巨轮缓缓驶入深水区,有人在调整中登上新高,也有人就此转身离场。作为深度参与的行业观察者,AMZ123特此发起 【2025年度跨境专题报道】系列专栏。本专栏将不止记录赛道的高光与暗礁,更致力于解构穿越周期的密码,为从业者提供一份关于生存与进化的真实笔记。本文为专栏的第一篇报道,旨在通过回顾过去一年的行业大事,以此看清行业新秩序与未来破局方向。2025年,美国对华关税政策经历了从紧张升级到逐步缓和的过程。
25年美国社交电商市场将达870亿美元,TikTok推动增长
AMZ123获悉,近日,研究机构Emarketer的最新报告显示,TikTok正持续推动社交电商市场增长,其中TikTok Shop已成为该领域的重要组成部分。2025年,TikTok Shop的销售额占全球社交电商总量的近20%。按照预测,TikTok Shop的销售规模将在2026年超过200亿美元,并在2028年突破300亿美元。与此同时,2026年预计将有一半的美国社交购物用户在TikTok平台完成购买。从整体市场来看,社交电商目前仍仅占美国电商总规模的一小部分,但占比正在稳步提升。
双十二期间,印尼消费者更偏好本地品牌与高品质商品
AMZ123获悉,近日,电商平台Shopee与Lazada的数据均显示,印尼消费者的线上购物行为在 12.12 全国网购日(Harbolnas)活动期间呈现出明显变化。消费者在年终促销节点的购物重点正在发生转移,从单纯追求低价,逐步转向对本地产品和高质量商品的关注。Shopee 的数据显示,2025 年 12.12 活动期间,印尼消费者对本地产品的兴趣显著上升。平台观察到,用户通过多种活动和功能,更积极地寻找并支持本地中小微企业(UMKM)及本土品牌。该趋势不仅体现在购物热度上,也反映出 12.12 已从单一的促销活动,逐渐演变为消费者了解和选择本地产品的重要窗口。
每日低价跨境包裹数高达5万,希腊呼吁加强监管
AMZ123获悉,近日,随着Shein、Temu等电商平台在欧洲快速扩张,大量单价不超过150欧元的跨境包裹每天通过免税政策进入希腊市场,希腊相关行业组织正呼吁欧盟建立统一的监管措施。希腊商贸与企业联合会(ESEE)的数据显示,欧盟范围内,91%以上的低于150欧元的跨境包裹来自中国。2024年,欧盟市场共进口约46亿件单价不超过150欧元的包裹,预计2025年将增至约60亿件。在希腊,每天进入市场的低价跨境订单数量最高可达5万单,且仍在增长。相关研究估算,希腊消费者在电商平台上的支出中,每5欧元就有1欧元流向中国,年交易规模约为5.29亿至6.27亿欧元。
AMZ123星球专享丨12月第三周资讯汇总
亚马逊亚马逊于12月16日上午9点启动了“圣诞限时特卖”活动,此次促销将持续到12月25日23点59分,可能成为平台年内的最后一场大型促销。亚马逊宣布自2026年3月31日起将全面终止共享库存(混仓)模式,并更新制造商条码的使用标准。根据新规,完成品牌备案的品牌所有者将可以直接使用UPC等制造商条码进行入库,而无需粘贴亚马逊条码。亚马逊正在与人工智能公司OpenAI就一笔潜在投资展开磋商,投资规模约为100亿美元。亚马逊向美国华盛顿州提交了一份新的通报,将在当地裁减84个岗位。亚马逊说明,这一调整属于各业务部门在日常运营中进行的人员结构优化,并不涉及其在今年10月宣布的全球性裁员计划。
新入口曝光!亚马逊广告后台新增 Prompts(提示词)功能
今日分享「结合数据高效优化老品广告」
美国圣诞节后预计迎来退货高峰,退货率或将高出35%
AMZ123获悉,近日,Adobe最新发布的假日购物数据分析显示,2025年假日季至今,美国消费者的退货行为较去年同期有所放缓,但整体趋势仍需谨慎看待。11月1日至12月12日,线上购物退货量同比下降2.5%;而在黑五周(Cyber Week)结束后的7天内,退货量仅同比下降0.1%,降幅明显收窄。Adobe指出,当前的退货下降并不意味着假日季整体退货压力减轻。按照历史规律,圣诞节后将迎来集中退货高峰。预计12月26日至12月31日期间,退货量将较11月1日至12月12日这一阶段高出25%至35%。根据2024年假日季数据,每8笔退货中就有1笔发生在这一6天内,Adobe预计这一趋势将在今年延续。
扎心了,超7成跨境人今年无年终奖
年终奖取消,公司岌岌可危,跨境人:今年太难了
亚马逊走9810退税模式的灵魂拷问!
亚马逊走9810退税模式的灵魂拷问!
跨境电商的入场券,变了
2025年,跨境电商仍在增长,但增长的方式已悄然改写——它不再均匀洒向每一个卖家,而是像一场“定向灌溉”,愈发向头部与合规能力强的卖家集中。平台数据揭示出这一分化:2025年1—9月,亚马逊中国卖家上新数量同比提升近25%;销售额达到200万、500万、800万美元的卖家数量增幅均超过20%;而销售额超过1000万美元的头部卖家,增幅接近30%。这不是简单的强弱分化,而是一次行业的深层迁移:平台正在亲手改写规则,把“可控”定为第一要义。随之而来的,是三条谁都绕不开的趋势——它们共同把跨境电商,从过去的“流量快跑”,推向了如今的“系统耐力赛”。
冬季需求拉动增长,10款汽配产品在亚马逊月销过万
AMZ123获悉,近日,亚马逊各类产品搜索量增长显著,以下10款产品在亚马逊上销量表现突出,深受消费者欢迎。1. 便携轮胎充气泵预计销售额:679.99万美元/月销量:100,000+星级评分:4.3好评数量:23,615+图源:亚马逊产品介绍:这款便携式轮胎充气泵采用电池供电设计,体积小巧,可放置于手套箱或后备箱,适用于汽车、SUV、摩托车、自行车及球类等。支持最高 120 PSI 的精准充气,内置数字胎压显示屏,可在 PSI、kPa、Bar 等多种单位间切换,并通过按键设定目标胎压,到达设定值后自动停止,降低过度充气风险。配套多种充气接口和LED照明灯,满足日常补气和应急使用需求。
亚马逊拟投资OpenAI 100亿美元
AMZ123获悉,近日,据外媒报道,亚马逊正在与人工智能公司OpenAI就一笔潜在投资展开磋商,投资规模约为100亿美元。知情人士透露,相关谈判仍处于高度不确定状态,但若交易达成,OpenAI的整体估值可能超过5000亿美元。大型科技公司在生成式人工智能领域的竞争正在加速。近年来,OpenAI已与多家基础设施和芯片厂商达成数十亿美元级别的合作协议,包括今年与英伟达和甲骨文签署的多项AI相关交易。2025年11月,OpenAI还与亚马逊签署了一份规模约380亿美元的云服务采购协议,进一步强化其算力布局。市场同时也对高强度资本投入保持审慎态度。
《亚马逊生活日用品类攻略手册》PDF下载
作为日常生活不可或缺的重要组成,生活百货品类覆盖范围广泛,包括家居用品、家具、车用配件、户外装备、园艺 工具、运动器材、家装用品、厨房、玩具以及宠物用品等众多领域。这类产品不仅是满足基本生活所需,更体现了人们对美好生活的向往和追求。
《掘金泰国-市场洞察与战略机遇报告2025》PDF下载
随着全球经济一体化的加速,泰国作为东盟的核心枢纽,凭借其独特的地缘优势庞大的消费市场以及持续优化的营商环境,成为众多企业战略布局的重要目标。本报告深入剖析泰国市场的政策红利、消费趋势、产业机遇以及合规挑战,旨在为有志于开拓泰国市场的中国企业提供行动指南,助力企业在东盟这片充满活力的土地上把握机遇、应对挑战、!实现可持续发展。
《2025欧美假日购物季营销指南》PDF下载
2025年美国假日购物季零售额预计同比仅增长1.2%,总销售额约1.359万亿美元,虽仍保持正增长,但为2009年以来最低增速,市场正在步入低增长的新常态。
《2025年跨境电商东南亚市场进入战略白皮书》PDF下载
东南亚电商,正以惊人的速度复刻中国电商高速增长的黄金时代。2024年东南亚电商GMV达到1284亿美元,短短5年涨幅超过3倍。全球电商2024年GMV增幅最快的十大市场中,东南亚独占四席。东南亚是拥有约6.7亿人口的广阔市场,在现今全球关税的不确定性大格局下,因其电商基建完善,利好的贸易政策,和更高的年轻人口占比,成为跨境卖家生意拓张焦点之一。
《2025年TikTok Shop玩具品类行业报告(欧美站)》PDF下载
分析TikTok Shop美国市场、英国市场、西班牙市场、墨西哥市场等主流市场点短视频及直播电商数据,选取TikTok与玩具爱好品类相关的内容进行分析报告。
《2025 洗护品类趋势与创新洞察》PDF下载
本报告独特价值:将消费者的“行为结果”据),揭示消费者深层心理动机、并能精准预判未来增长机会
《亚马逊双轨增长指南》PDF下载
亚马逊以“以客户为中心”为核心理念,通过整合B2B与B2C的全渠道服务,帮助卖家实现“一店双拓”-- 一次上架,同步触达个人消费者与企业买家,获得双重收益。同时,基于Direct to Buyer(直接触达买家)的模式,更能有效减少中间环节,提升利润空间与品牌掌控力。
《亚马逊全球线上商采趋势与区域洞察》PDF下载
随着全球企业数字化转型的深入推进,B2B商采有望成为下一个万亿级别的蓝海市场然而,中国卖家在开拓海外企业商采市场时往往面临着一个关键挑战:难以准确把握海外企业买家的商采行为和决策模式。这种认知偏差不仅影响了产品开发方向,也制约了市场拓展策略的制定。
AMZ123卖家导航
这个人很懒,还没有自我介绍
亚马逊公告
AMZ123旗下亚马逊公告发布平台,实时更新亚马逊最新公告,致力打造最及时和有态度的亚马逊公告栏目!
跨境数据中心
聚合海量跨境数据,输出跨境研究智慧。
AMZ123跨境电商
专注跨境行业热点事件报道,每日坚持推送原创深度热文
AMZ123选品观察员
选品推荐及选品技巧分享。
跨境学院
跨境电商大小事,尽在跨境学院。
AMZ123会员
「AMZ123会员」为出海者推出的一站式私享服务
侃侃跨境那些事儿
不侃废话,挣钱要紧!
首页
跨境头条
文章详情
Sora 促AI视频领域融资热潮,这些华人创业者搭上了顺风车
MorketingGlobal
2024-04-27 10:36
1377

图片来源Unsplash

文 | 小红帽

对于大部分初创公司来说,2023年无疑是难熬的一年。由于全球经济的不确定性和低增速带来的影响,风险投资公司(VCs)的投资意愿普遍降低。他们中的大多数选择了持币观望的策略,这无疑加剧了初创公司融资的难度。

然而,生成式人工智能领域却逆流而上,未受市场波动的影响。截至目前,热门的人工智能初创公司估值仍在持续飙升。风险投资者们对此领域充满热情,他们不惜支付额外的溢价来推高初创公司的估值。

当百度、阿里巴巴、月之暗面、智谱AI等科技巨头在AI大模型领域的竞争愈演愈烈之际,不少创业公司却开始将目光转向应用层面,寻求新的发展机遇。正如金沙江创投管理合伙人朱啸虎说的那样,“AI创业公司应该避开大模型”集火,聚焦垂直应用端。

风险投资公司也在积极寻找投资大模型领域之外的机会,他们纷纷将目光投向那些利用大模型技术开发应用的初创公司。

仅仅一个月,就有三家华人创立的生成式AI公司获得融资,且融资金额都过了千万美金。


01

那些成因“螃蟹”的初创公司


项目一:应用场景成熟的Haiper


就像ChatGPT带火了AI生成式文本,Sora的横空出世也迅速将“AI生成式视频”这个词带上了热搜,而一些相关创业公司蓄势待发。

3月7日,人工智能视频生成平台Haiper宣布完成由Octopus Ventures (章鱼风投)领投的1380万美元的种子轮融资。经过本轮融资,Haiper的总融资额已累计至1920万美元,这为公司计划在2024年顺利推进A轮融资进一步铺平道路。

Haiper于2021年底在伦敦成立,由Miao Yishu和Wang Ziyu创立,两位博士均持有牛津大学机器学习博士学位,并曾在谷歌DeepMind担任研究员。

根据职业社交平台领英的资料显示,在创立Haiper之前,Miao Yishu曾在Tiktok的全球信任与安全团队工作,任职技术主管。在拿到牛津大学的博士学位之前,Miao Yishu曾于2010年9月至2013年六月的这段时间里,在清华大学攻读数据挖掘硕士学位。

职业社交平台领英的资料显示,Miao Yishu在创立公司之前,曾在TikTok的全球信任与安全团队担任技术主管。此外,Miao Yishu在攻读牛津大学博士学位之前,曾于2010年9月至2013年6月在清华大学攻读并获得数据挖掘硕士学位。

起初,Haiper主要专注于3D重建领域。然而,在进行AI训练处理视频数据的过程中,两位创始人发现了AI视频生成这其中的商业潜力。于是,大约在7个月前,他们做出了战略性的转变,决定将重心转向视频生成领域。

虽然Haiper生成的视频片段可能还没有达到OpenAI发布样本的那种令人印象深刻的地步,但最起码在“主菜”上桌之前,它已经给大伙们提供了“前菜”试吃。

相反,目前还很少有人有机会体验Sora的功能。Haiper已经能够让用户根据文本提示创建两秒的高清晰度视频,或者在较低分辨率下生成稍长的视频剪辑。此外,Haiper还提供了通过静态图像生成动画版本或者以不同风格“重绘”视频的功能。公司还打算在近期增加使用AI技术来延长视频时长的功能。

图片来源:Haiper官网

在产品尚未正式上线之际,Haiper便积极展开了对应用场景的探索。早在1月24日,Haiper便宣布与伦敦艺术大学时装学院展开合作,借助AI技术将时装草图转化为动态视频,让设计师能够在成衣制作之前预览上身效果。紧接着,在2月9日,Haiper又宣布与京东展开合作,共同探索电商领域的应用场景。作为一款新生产品,Haiper已经开始着力为自家技术寻找多样化的应用场景了。

目前,由于Haiper的计算能力有限,制作每个样本视频大约需要一分钟的时间。生成式人力的算力成本非常“可怕”。堆积算力需要搭建昂贵的AI加速卡群组,而像英伟达H100这种加速卡的单价可能高达3万美元以上。

虽然公司目前还未公开该模型的详细信息,但Miao透露,他们已私下联系了一些开发者试用其封闭的API。他强调,开发者的反馈对于公司快速迭代模型至关重要。此外,Haiper还在考虑未来开放源代码,以便让更多人能够探索该模型在不同场景下的应用潜力。

无独有偶,在Haiper宣布完成1380万美元的种子轮融资后不久,视频大模型公司爱诗科技也于3月13日宣布完成了约一亿元人民币的A1轮融资。此轮融资由达晨财智独家投资,而光源资本则担任了独家财务顾问的角色。

项目二:中国版Sora,已实现4K分辨率视频的爱诗科技


爱诗科技来头不小,它是由字节跳动前视觉技术负责人王长虎于2023年4月创办,公司主要致力于开发AI视频生成模型及其应用。为营销、广告、游戏领域的内容创作行业提供帮助和服务。

王长虎在人工智能领域拥有丰富的产品经验。他毕业于中国科学技术大学并获得博士学位。2009年毕业后,他曾在微软亚洲研究院担任主管研究员。到了2017年初,王长虎加入字节跳动,担任过人工智能实验室总监以及集团视觉技术的负责人。

目前,在海外市场,爱诗科技的国际版AI视频生成产品PixVerse已经正式开始运营。用户可以通过网页端或者加入Discord-PixVerse服务器来体验这一产品。在今年3月,面向国内用户的爱诗大模型也已经开放内测,内测链接为https://aishiai.com/waitlist

技术上,爱诗科技采用了与Sora相同的技术路线,即DiT(Diffusion Transformer)架构。

PixVerse主要提供了文生视频、图生视频等核心功能,并且爱诗科技宣称在去年十月就已经实现了生成4K分辨率的视频内容。

以文生视频功能为例,PixVerse的产品界面提供了Prompt、Style、Aspect-ratio和Negative-prompt四个功能参数。其中,Prompt参数用于输入一段句子或关键词语来指导视频内容的生成;Style参数用于决定视频画面的风格;Aspect-ratio参数则用于设定视频的画幅比例;而Negative-prompt参数则帮助用户规避在视频中不希望呈现的内容。

图片来源:PixVerse国际版产品页面

现在的AI视频生成领域就好似GPT-2的前夕,而VCs现在需要做的就是在这个“泡泡”吹的足够大之前押注,才能满足“害怕错过“的心理需求。

正如投资机构a16z在投资备忘录所注解的那样“我们在过去的一年时间里在生成式视频这个领域频繁发力,但貌似还是不够。在消费者每天使用这些产品之前,还有很长的路要走。视频的‘ChatGPT时刻什么时候会到来?”

项目三:功能“量大管饱”的HeyGen


正是这种“害怕错过”的投资人心理造就了生成式视频领域的融资热潮。除了前两家公司,第三家我们要介绍的公司也是由华人创办的。

早在去年,这家名为HeyGen的公司就凭借一系列AI生成式创意视频而名声大噪,其中包括让美国知名歌手泰勒·斯威夫特说普通话,以及赵本山和郭德纲讲英语的精彩内容。

3月28日, 这家仅成立三年的AI视频生成创业公司宣布正在新一轮6000万美元的融资。而该轮融资之后,HeyGen的估值也来到了4.4亿美元。

HeyGen于2020年11月在洛杉矶创立,由前Snap软件工程师徐卓及其同济大学校友、前字节产品设计师梁望(Wayne Liang)共同发起。红杉资本中国、真格基金等机构均对其进行了重要投资。

HeyGen涵盖了丰富的生成式视频功能,不仅支持主播换脸、文字转口播视频,还能创建虚拟主播,并具备语音翻译与克隆等功能。

具体来看,HeyGen的文本转语音功能为用户提供了将书面文本转化为自然语音的便捷途径。通过这一功能,用户可以选择超过40种语言和300多种声音,用户还可以在脚本中的任意位置添加半秒停顿,以确保生成的语音听起来更加自然流畅。

HeyGen提供了超过100种AI头像,这些头像涵盖了各种族裔、年龄以及不同的身形姿势。用户只需通过书写或音频录制脚本,即可轻松生成AI头像视频,并且在几分钟内实现口型同步。

图片来源:HenGen网页

HeyGen的TalkingPhoto功能让用户能够将任何图像转变为会说话的图片。通过这一功能,用户可以为照片添加真实的人类声音,将原本静态的视觉效果转化为生动的动态动画。用户只需为照片的对话编写一个脚本,然后观看图片变得栩栩如生。

HeyGen联合创始人兼CEO徐卓(Joshua Xu)在近期透露,公司目前的年化收入已经超过了2000万美元,并且曾连续9个月实现了50%的月环比增长率。这一增速远超过其他竞品。

实际上,自2023年起,HeyGen开始逐渐剥离中国投资者在公司的影响。去年12月11日,HeyGen的国内实体诗云科技因决议解散,宣布申请注销登记,其业务重心也完全转移至美国市场。据知情人士援引公司内部人员的解释,数字人领域的技术门槛相对较低,国内市场竞争日益激烈,这可能是HeyGen选择出海的重要考量因素。


02

创业者们面临的挑战


AI 视频生成的这一波集中融资,与 Sora的发布、并展现远高于之前同类产品的惊艳效果有着很强的关联。

AI视频生成领域目前的竞争日益激烈。除了OpenAI最近推出的Sora之外,市场上还涌现了众多强有力的竞争者。其中,谷歌和英伟达支持的Runway已经成功筹集超过2.3亿美元的资金。同时,谷歌和Meta等科技巨头也各自研发了视频生成模型。去年,人工智能图片生成公司Stability AI在DEMO预览中也宣布了Stable Diffusion 视频模型。

从成本角度来看,Sora的算力需求相较于GPT-4高出了多个数量级。这种庞大的算力需求无疑给视频生成领域的初创公司带来了巨大的商业化挑战和融资压力。对于初创公司而言,如何在保证产品质量的同时,有效控制成本,实现商业化盈利,是一个亟待解决的问题。同时,如何吸引投资者的目光,获得足够的资金支持,以应对高额的算力成本,也是这些公司必须面对的考验。因此,对于初创公司来说,如何在视频生成领域取得突破,既需要技术创新,也需要商业模式的创新。

咨询
官方微信群
官方客服

扫码添加,立即咨询

加群
官方微信群
官方微信群

扫码添加,拉你进群

更多
订阅号服务号跨境资讯
二维码

为你推送和解读最前沿、最有料的跨境电商资讯

二维码

90% 亚马逊卖家都在关注的微信公众号

二维码

精选今日跨境电商头条资讯

回顶部