OpenAI于本周二宣布,将为更多付费用户推出“高级语音模式”(AVM)。这一语音功能能够让ChatGPT的对话更加自然,首先向Plus和Teams套餐的用户开放,而企业版和教育版客户将在下周获得使用权限。
此次更新中,AVM的设计也焕然一新,取代5月展示时的黑色动画点,新的语音功能图标变成了一个蓝色动态球体。当用户的ChatGPT应用中可用AVM时,会在语音图标旁边收到一个弹窗通知。
这周内,所有Plus和Teams用户将在应用中陆续收到该功能更新。为了安抚那些已经等待已久的用户,OpenAI还添加了自定义指令、记忆功能、五种新语音,并且进一步优化了口音处理能力。值得一提的是,AVM现在还能用超过50种语言说“抱歉,来晚了”。
OpenAI官方推特还发布了消息,介绍了五种新语音,分别是Arbor、Maple、Sol、Spruce和Vale。这使得ChatGPT的语音选择增加到9种,几乎赶上了谷歌的Gemini Live系统。所有这些语音名字都取自自然元素,或许是为了体现AVM让互动更加“自然”的理念。
不过,有一个语音明显缺席,那就是曾在春季更新中展示的Sky语音。这个语音因被女演员斯嘉丽·约翰逊指控与她的声音过于相似而引发法律纠纷。约翰逊曾在电影《她》中饰演一位AI系统,因此她对Sky语音提出了异议。虽然OpenAI解释并无意模仿她的声音,但还是迅速下架了Sky语音。
此外,本次更新还没有包括此前展示的视频和屏幕共享功能。这一功能原本可以让GPT-4o同时处理视觉和听觉信息,用户可以实时询问ChatGPT关于眼前纸上的数学题或者电脑屏幕代码的问题。不过,OpenAI目前尚未给出这一多模态功能的正式上线时间。
尽管如此,OpenAI表示,自AVM进行有限的alpha测试以来,功能已经有所改进。除了增强对口音的理解能力外,语音对话的流畅性和响应速度也得到了提升。虽然测试中偶尔仍会出现故障,但OpenAI称这一情况已经有了改善。
此外,AVM还引入了一些定制功能,例如自定义指令,允许用户个性化ChatGPT的响应方式,以及记忆功能,可以让ChatGPT记住之前的对话,方便日后参考。
不过,目前AVM功能尚未在多个地区上线,包括欧盟、英国、瑞士、冰岛、挪威和列支敦士登等。