
EMO的超酷炫框架出现了,它能根据一张参考照片和声音输入,比如说话或唱歌,生成带有丰富表情和各种头部姿势的人物视频。而且还有个牛逼闪闪的点,那就是无论你给它的音频有多长,它都能根据音频的长度生成对应时长的视频。这意味着啥?意味着你现在可以创造一个动起来、会说会笑的数字化的自己或者是你喜欢的人物,而且可以让它持续唠叨或者唱歌,直到你说停。这技术简直不要太酷,让人想到了未来可能人人都有自己的虚拟代言人,搞个个人音乐会啥的,都不是问题了!
来自新加坡的最新人工智能动态跟踪简报 (中英文)
EMO的超酷炫框架出现了,它能根据一张参考照片和声音输入,比如说话或唱歌,生成带有丰富表情和各种头部姿势的人物视频。而且还有个牛逼闪闪的点,那就是无论你给它的音频有多长,它都能根据音频的长度生成对应时长的视频。这意味着啥?意味着你现在可以创造一个动起来、会说会笑的数字化的自己或者是你喜欢的人物,而且可以让它持续唠叨或者唱歌,直到你说停。这技术简直不要太酷,让人想到了未来可能人人都有自己的虚拟代言人,搞个个人音乐会啥的,都不是问题了!