ChatGPT语音模式背后的秘密：五个月的精心挑选与合作

ChatGPT的语音模式是最受欢迎的功能之一。五种不同的声音都是经过五个月的专业配音演员、人才代理机构、选角导演和行业顾问的精心筛选而确定的。以下是关于这些声音选择过程的详细信息。

2023年9月，引入了语音功能，为用户提供了另一种与ChatGPT互动的方式。自推出以来，用户对这一功能和各个声音的反应十分积极。每个声音——Breeze、Cove、Ember、Juniper和Sky——都是与配音演员合作创造的样本。

为了确保采取正确的步骤为ChatGPT选配声音，与配音行业密切合作。每位演员的报酬都高于市场最高标准，只要他们的声音用于产品，这一报酬就会持续。

AI声音不应故意模仿某个名人的独特声音——Sky的声音并非模仿斯嘉丽·约翰逊，而是由另一位专业女演员使用她自己的自然声音录制的。为了保护他们的隐私，配音演员的姓名不会公开。

2023年初，为了甄选配音演员，与独立的、知名的获奖选角导演和制片人合作，制定了一套ChatGPT声音的标准，仔细考虑了每个声音的独特个性及其对全球观众的吸引力。

一些标准包括：

2023年5月，选角机构和选角导演发布了征集通知。在不到一周的时间内，收到了来自配音和影视演员的400多份投稿。为了试镜，演员们需要录制一段ChatGPT的回复样本，这些样本包括回答关于正念的问题、头脑风暴旅行计划，甚至与用户进行日常对话。

选出五个最终声音，并与演员讨论人机互动的愿景和语音模式的目标. 整个5月，选角团队独立审查并手选了一份初步名单，包括14名演员。之后，进一步筛选，最终向OpenAI提交了最佳声音名单。

与每位演员讨论了人机语音互动的愿景、OpenAI的技术能力、限制和风险，以及实施的安全措施。确保每位演员在参与项目之前，了解语音模式的范围和意图。OpenAI的内部团队从产品和研究的角度审查了这些声音，经过仔细考虑，最终选定了Breeze、Cove、Ember、Juniper和Sky的声音。

每位演员飞往旧金山进行录音，他们的声音于2023年9月在ChatGPT中发布
在6月和7月，演员们飞往旧金山进行录音和与OpenAI产品和研究团队的面对面会议。

2023年9月25日，这些声音在ChatGPT中发布。

整个过程涉及与演员和选角团队的密切协调，持续了五个月。目前，仍在与演员合作，他们为GPT-4o的音频研究和新语音功能贡献了额外的工作。

新的语音模式即将推出GPT-4o，并将新增更多声音
计划在未来几周内向ChatGPT Plus用户开放新的GPT-4o语音模式。在GPT-4o中，使用语音与ChatGPT互动更加自然。GPT-4o能够顺利处理打断、有效管理群体对话、过滤背景噪音，并适应语气。

展望未来，ChatGPT将引入更多声音，以更好地满足用户的不同兴趣和偏好。

Subscribe 订阅