在OpenAI上个月推出Sora模型之后,以AI为驱动的视频生成市场火热非凡。两位DeepMind前成员,苗义书和王子玉,公开发布了他们的视频生成工具Haiper,该工具底层搭载了自己的AI模型。
之前在TikTok全球信任与安全团队工作的苗义书,以及曾在DeepMind和谷歌担任研究科学家的王子玉,从2021年开始着手公司事务,并于2022年正式成立了公司。


这对搭档在机器学习领域拥有丰富的专长,他们最初致力于利用神经网络进行3D重建问题的研究。苗义书在与TechCrunch通话中提到,经过对视频数据的训练,他们发现视频生成比3D重建更加吸引人。这也是为什么Haiper在大约六个月前开始专注于视频生成的原因。
Haiper在一轮种子融资中筹集了1380万美元,该轮融资由章鱼风投领投,5Y Capital参与投资。此前,像Phil Blunsom和Nando de Freitas这样的天使投资人帮助公司在2022年4月筹集了540万美元的种子前轮融资。
Haiper提供视频生成服务,用户可以通过输入文本提示在其网站上免费生成视频。但是,存在一定的限制。你只能生成长达两秒的高清视频和质量稍低的最长四秒视频。
此外,Haiper网站还提供了诸如将你的图片动画化、以不同风格重绘你的视频等功能。公司还在努力引入诸如延长视频时长的能力。
苗义书表示,公司的目标是保持这些功能的免费,以此构建社区。他指出,对于这家刚起步的公司来说,现在考虑围绕视频生成构建订阅产品“还为时过早”。然而,它已经与像京东这样的公司合作,探索商业用途。
他们使用了一个原始的Sora提示来生成样本视频:“几头巨大的毛毛象穿过雪地草原,它们长长的毛发在风中轻轻摇曳,背景是被雪覆盖的树木和戏剧性的雪山,午后的光线透过稀疏的云朵,在远处的阳光下产生温暖的光芒,低视角的镜头捕捉到这些大型毛茸茸的哺乳动物,摄影的景深效果令人惊叹。”
虽然Haiper目前专注于其面向消费者的网站,但它希望构建一个核心的视频生成模型,该模型可以提供给其他人。公司尚未公开任何有关模型的详细信息。
苗义书表示,公司已私下联系了一批开发者尝试其封闭API。他预计开发者的反馈对于公司迅速迭代模型非常重要。Haiper还考虑了将来可能开源其模型,以便人们探索不同的使用案例。
CEO相信,目前重要的是解决视频生成中的不可思议谷现象 —— 当人们看到AI生成的类人形象时会引发怪异感觉的现象。
“我们并不是在解决内容和风格领域的问题,而是试图解决基本问题,比如AI生成的人物行走时的外观或雪花落下的样子。”他说。
公司目前有大约20名员工,并且正在积极招聘多个工程和营销职位。
未来的竞争
目前,OpenAI最近发布的Sora可能是Haiper目前最受欢迎的竞争对手。然而,还有其他参与者,如谷歌和Nvidia支持的Runway,已经筹集了超过2.3亿美元的资金。谷歌和Meta也有自己的视频生成模型。去年,Stability AI宣布了稳定扩散视频模型的研究预览。
章鱼风投的合伙人Rebecca Hunt认为,在接下来的三年里,Haiper需要构建一个强大的视频生成模型,以在这个市场中实现差异化。
“实际上,只有少数几个人有能力实现这一点;这是我们想要支持Haiper团队的原因之一。一旦模型超越了不可思议谷并反映了现实世界及其物理规律,将会有一个应用无限的时期,”她通过电子邮件告诉TechCrunch。
虽然投资者正在寻求投资于AI驱动的视频生成初创公司,他们也认为这项技术仍有很大的改进空间。
“感觉就像AI视频还处于GPT-2级别。我们在过去一年取得了巨大进步,但在日常消费者开始每天使用这些产品之前,还有很长的路要走。视频的‘ChatGPT时刻’何时到来?”a16z的Justine Moore去年写道。