哇塞,Myspace社交平台和游戏公司Jam City的两位创始人Chris DeWolfe和Aber Whitcomb,这对老将级科技企业家,一直以来就致力掌握最热门的科技趋势。今年早些时候,他们通过最新的创业项目Plai Labs把目标转向了web3和人工智能风潮,这是一家得到a16z投资的社交平台开发创业公司,目的是为消费者提供AI工具进行协作和联系。

Plai Labs今天宣布推出其免费文本转视频生成器PlaiDay,加入了众多生成式AI视频工具的队伍,包括谷歌的Imagen、Meta的制作视频、OpenAI的DALL-E 2和Stable Diffusion。但是一个显著的特点是,可以通过自拍照将你的样子添加到视频中,对视频进行个性化。
如果你一直想看到自己(换句话说,动画版的你)飞过大峡谷或者与星际敌人作战的视频,PlaiDay可以实现这种愿望。你只需上传一张自拍,输入几个词,它就会生成一个短视频,你可以和朋友分享。视频目前只有3秒长,但视频时长未来会延长。公司也在加入音频功能。
公司给我们演示的一个例子使用了这样的提示词:“英国巡警,1800年代伦敦街景,特写,逼真。”
虽然我们不会说这很“逼真”,但PlaiDay在表达逼真的面部表情方面做得不错。此外,背景中的行人也走得相对流畅。(当然,他们的走动不完全像真人,但不显得突兀。)
个性化视频有点问题。由于用户的自拍中没有胡子,视频里这个人的胡须似乎正在融入皮肤。
这个其他例子(由Discord用户@Marvel创建)就扭曲了10倍。老实说,简直恐怖。为了避免这种情况,公司建议输入“特写”或“某人的画像”,以生成细致的人脸。由于还处于早期阶段,PlaiDay目前更适合生成一个面孔,而不是大量人群。
提示词:时尚女孩在时尚美容大赛中走秀
我们离看到电影级的AI生成视频还有很长的路要走。但是,我们对PlaiDay取得的成就和潜力仍然印象深刻。
你可以在PlaiDay的Discord频道上试用这款个性化文本转视频生成器。它即将在PlaiDay应用上推出,这是当前处于alpha版本的免费应用。PlaiDay提供各种其他有趣的功能,比如将你自己插入TikTok视频,文本转图像工具,调整图像样式的能力,生成字幕的文本生成器等等。公司称在未来几周会公布更多关于该应用的详情。
联合创始人兼首席架构师Jim Benedetto在接受TechCrunch采访时表示:“这只是我们看到的未来叙事方式的开始。一旦你可以把自己放进这些AI视频中,你就真正开始讲述自己的故事。”Benedetto之前是Myspace的高级副总裁。他还共同创立了内容优化创业公司Gravity,后被AOL在2014年收购。
该文本转视频生成器建立在公司自己的AI平台(内部代码名Orchestra)之上,它结合了自主和开源模型。这是Plai实验室计划提供的众多产品中的第一款。
正如团队所解释的,Orchestra是一个“灵活的工具集,可以增强几乎任何业务。它利用一组可重用的代码块为基础,这将使技术和非技术人员都能够快速高效地创建和部署新的有趣的AI应用程序,而与行业无关。”
Plai实验室希望其平台可以帮助设计师和产品经理在没有工程师帮助的情况下创建AI功能。
Benedetto补充说:“我们感到兴奋,因为它使拥有远见的产品经理能够创建通常需要5至10名博士才能完成的AI。”
提示词:巨大的火焰石头怪兽,两条长手臂,红色电光,站在岩石平台上,逼真图形,黑暗奇幻。
Whitcomb解释说,AI平台不仅仅用于生成生成式艺术。很快,该平台可以帮助营销活动、安全监控、分析等。
“例如,你可以用扩散过程生成一系列创意作品。然后你可以用神经网络分析每一个创意作品,并添加一些文本……你可以使用语音转文字使其可索引,并使用LLM模块以便能够使用多种语言或推荐其他文本,”Whitcomb说。
他声称这个平台“灵活到可以做任何AI相关的事”。
这个还未命名的AI平台将在未来几个月内面向公众。