DeepMind前成员携手推出了Haiper 挑战Sora

在OpenAI上个月推出Sora模型之后，以AI为驱动的视频生成市场火热非凡。两位DeepMind前成员，苗义书和王子玉，公开发布了他们的视频生成工具Haiper，该工具底层搭载了自己的AI模型。

之前在TikTok全球信任与安全团队工作的苗义书，以及曾在DeepMind和谷歌担任研究科学家的王子玉，从2021年开始着手公司事务，并于2022年正式成立了公司。

这对搭档在机器学习领域拥有丰富的专长，他们最初致力于利用神经网络进行3D重建问题的研究。苗义书在与TechCrunch通话中提到，经过对视频数据的训练，他们发现视频生成比3D重建更加吸引人。这也是为什么Haiper在大约六个月前开始专注于视频生成的原因。

Haiper在一轮种子融资中筹集了1380万美元，该轮融资由章鱼风投领投，5Y Capital参与投资。此前，像Phil Blunsom和Nando de Freitas这样的天使投资人帮助公司在2022年4月筹集了540万美元的种子前轮融资。

Haiper提供视频生成服务，用户可以通过输入文本提示在其网站上免费生成视频。但是，存在一定的限制。你只能生成长达两秒的高清视频和质量稍低的最长四秒视频。

此外，Haiper网站还提供了诸如将你的图片动画化、以不同风格重绘你的视频等功能。公司还在努力引入诸如延长视频时长的能力。

苗义书表示，公司的目标是保持这些功能的免费，以此构建社区。他指出，对于这家刚起步的公司来说，现在考虑围绕视频生成构建订阅产品“还为时过早”。然而，它已经与像京东这样的公司合作，探索商业用途。

他们使用了一个原始的Sora提示来生成样本视频：“几头巨大的毛毛象穿过雪地草原，它们长长的毛发在风中轻轻摇曳，背景是被雪覆盖的树木和戏剧性的雪山，午后的光线透过稀疏的云朵，在远处的阳光下产生温暖的光芒，低视角的镜头捕捉到这些大型毛茸茸的哺乳动物，摄影的景深效果令人惊叹。”

虽然Haiper目前专注于其面向消费者的网站，但它希望构建一个核心的视频生成模型，该模型可以提供给其他人。公司尚未公开任何有关模型的详细信息。

苗义书表示，公司已私下联系了一批开发者尝试其封闭API。他预计开发者的反馈对于公司迅速迭代模型非常重要。Haiper还考虑了将来可能开源其模型，以便人们探索不同的使用案例。

CEO相信，目前重要的是解决视频生成中的不可思议谷现象 —— 当人们看到AI生成的类人形象时会引发怪异感觉的现象。

“我们并不是在解决内容和风格领域的问题，而是试图解决基本问题，比如AI生成的人物行走时的外观或雪花落下的样子。”他说。

公司目前有大约20名员工，并且正在积极招聘多个工程和营销职位。

未来的竞争
目前，OpenAI最近发布的Sora可能是Haiper目前最受欢迎的竞争对手。然而，还有其他参与者，如谷歌和Nvidia支持的Runway，已经筹集了超过2.3亿美元的资金。谷歌和Meta也有自己的视频生成模型。去年，Stability AI宣布了稳定扩散视频模型的研究预览。

章鱼风投的合伙人Rebecca Hunt认为，在接下来的三年里，Haiper需要构建一个强大的视频生成模型，以在这个市场中实现差异化。

“实际上，只有少数几个人有能力实现这一点；这是我们想要支持Haiper团队的原因之一。一旦模型超越了不可思议谷并反映了现实世界及其物理规律，将会有一个应用无限的时期，”她通过电子邮件告诉TechCrunch。

虽然投资者正在寻求投资于AI驱动的视频生成初创公司，他们也认为这项技术仍有很大的改进空间。

“感觉就像AI视频还处于GPT-2级别。我们在过去一年取得了巨大进步，但在日常消费者开始每天使用这些产品之前，还有很长的路要走。视频的‘ChatGPT时刻’何时到来？”a16z的Justine Moore去年写道。

Subscribe 订阅