ChatGPT可以看，听，说了

ChatGPT发布了一系列更新，包括语音和图像识别，标志着向创建更互动和直观的用户体验（类似于我们当前与Siri和Google Assistant的互动）迈出了重要的一步。

🔑 主要点：

用户现在可以拍照并与ChatGPT进行实时讨论—这一特性在旅行、计划餐点或协助学术问题时特别方便。

语音互动由一种新型文本到语音模型提供支持，该模型与专业配音演员合作，生成类似人类的音频。您还可以将您自己的音频转录为文本，以简化互动。

图像理解得到了BeMyEyes的支持—将GPT-4的推理能力扩展到包括照片、屏幕截图和混合文本图像文档在内的广泛图像；使与GPT-4进行讨论比以往更容易。

新功能最初将发布给Plus和Enterprise用户，计划在不久的将来进行更广泛的推出。语音功能将仅在iOS和Android上可用，图像功能将在所有平台上可访问。

Subscribe 订阅