ChatGPT的语音模式是最受欢迎的功能之一。五种不同的声音都是经过五个月的专业配音演员、人才代理机构、选角导演和行业顾问的精心筛选而确定的。以下是关于这些声音选择过程的详细信息。
2023年9月,引入了语音功能,为用户提供了另一种与ChatGPT互动的方式。自推出以来,用户对这一功能和各个声音的反应十分积极。每个声音——Breeze、Cove、Ember、Juniper和Sky——都是与配音演员合作创造的样本。
支持创意社区,并与配音行业密切合作
为了确保采取正确的步骤为ChatGPT选配声音,与配音行业密切合作。每位演员的报酬都高于市场最高标准,只要他们的声音用于产品,这一报酬就会持续。
AI声音不应故意模仿某个名人的独特声音——Sky的声音并非模仿斯嘉丽·约翰逊,而是由另一位专业女演员使用她自己的自然声音录制的。为了保护他们的隐私,配音演员的姓名不会公开。
与获奖的选角导演和制片人合作,制定了声音标准
2023年初,为了甄选配音演员,与独立的、知名的获奖选角导演和制片人合作,制定了一套ChatGPT声音的标准,仔细考虑了每个声音的独特个性及其对全球观众的吸引力。
一些标准包括:
- – 来自不同背景或能说多种语言的演员
- – 具有永恒感的声音
- – 令人信任的亲切声音
- – 温暖、吸引人、自信、富有魅力的声音,音质丰富
- – 自然且易于聆听
收到超过400份配音和影视演员的投稿
2023年5月,选角机构和选角导演发布了征集通知。在不到一周的时间内,收到了来自配音和影视演员的400多份投稿。为了试镜,演员们需要录制一段ChatGPT的回复样本,这些样本包括回答关于正念的问题、头脑风暴旅行计划,甚至与用户进行日常对话。
选出五个最终声音,并与演员讨论人机互动的愿景和语音模式的目标. 整个5月,选角团队独立审查并手选了一份初步名单,包括14名演员。之后,进一步筛选,最终向OpenAI提交了最佳声音名单。
与每位演员讨论了人机语音互动的愿景、OpenAI的技术能力、限制和风险,以及实施的安全措施。确保每位演员在参与项目之前,了解语音模式的范围和意图。OpenAI的内部团队从产品和研究的角度审查了这些声音,经过仔细考虑,最终选定了Breeze、Cove、Ember、Juniper和Sky的声音。
每位演员飞往旧金山进行录音,他们的声音于2023年9月在ChatGPT中发布
在6月和7月,演员们飞往旧金山进行录音和与OpenAI产品和研究团队的面对面会议。
2023年9月25日,这些声音在ChatGPT中发布。
整个过程涉及与演员和选角团队的密切协调,持续了五个月。目前,仍在与演员合作,他们为GPT-4o的音频研究和新语音功能贡献了额外的工作。
新的语音模式即将推出GPT-4o,并将新增更多声音
计划在未来几周内向ChatGPT Plus用户开放新的GPT-4o语音模式。在GPT-4o中,使用语音与ChatGPT互动更加自然。GPT-4o能够顺利处理打断、有效管理群体对话、过滤背景噪音,并适应语气。
展望未来,ChatGPT将引入更多声音,以更好地满足用户的不同兴趣和偏好。