ChatGPT发布了一系列更新,包括语音和图像识别,标志着向创建更互动和直观的用户体验(类似于我们当前与Siri和Google Assistant的互动)迈出了重要的一步。
🔑 主要点:
用户现在可以拍照并与ChatGPT进行实时讨论—这一特性在旅行、计划餐点或协助学术问题时特别方便。
语音互动由一种新型文本到语音模型提供支持,该模型与专业配音演员合作,生成类似人类的音频。您还可以将您自己的音频转录为文本,以简化互动。
图像理解得到了BeMyEyes的支持—将GPT-4的推理能力扩展到包括照片、屏幕截图和混合文本图像文档在内的广泛图像;使与GPT-4进行讨论比以往更容易。
新功能最初将发布给Plus和Enterprise用户,计划在不久的将来进行更广泛的推出。语音功能将仅在iOS和Android上可用,图像功能将在所有平台上可访问。