OpenAI 在 2024 年的 DevDay 上发布了四项重大更新

OpenAI 在 2024 年的 DevDay 上发布了四项重大更新，重点放在提升 AI 的可访问性和降低成本上，为开发者们带来了更多实用工具。

以下是更新亮点：

实时 API：全新发布的实时 API 提供六种 AI 语音，专为应用程序中的无缝集成设计。这些语音与 ChatGPT 的不同，更加自然，适用于旅游规划、电话订购等场景，收费约为每小时 18 美元。此 API 支持实时响应，提升了多种应用中的用户体验，但开发者需明确告知使用了 AI 生成的语音。

视觉微调 API：视觉微调 API 允许开发者通过结合图像数据与文本增强 GPT-4o 的视觉理解能力。这项功能可应用于高级视觉搜索、自动驾驶中的物体识别以及精确的医学影像分析，且仅需 100 张图像即可实现。OpenAI 还强调了数据透明度，开发者可完全掌控数据的所有权与使用权，自动化安全评估确保合规。

API 中的提示缓存：提示缓存功能通过重用之前的输入 token，帮助开发者降低成本并减少延迟。这个功能对代码编辑和多轮对话特别有用，处理时间可节省多达 50%。它会自动应用于最新的 GPT-4o 和 GPT-4o mini 版本，并在提示超过 1,024 个 token 时激活，同时确保隐私保护。

API 中的模型蒸馏：OpenAI 推出的模型蒸馏技术，允许开发者利用 GPT-4o 和 o1-preview 等高级模型的输出来优化低成本模型。该集成过程简化了高性能模型的创建，比如 GPT-4o mini，且无需多种工具。关键功能包括“存储完成”用于自动生成数据集，以及“评估”用于性能测评。模型蒸馏现已开放，开发者每天可免费获得 200 万 GPT-4o mini 训练 token，和 100 万 GPT-4o token，直到 10 月 31 日，之后将按标准微调收费。

还有一个新的提示生成器？

据传 OpenAI 泄露了一份系统提示生成器的提示，专为提高提示的清晰度和有效性设计。

另外，OpenAI 还宣布 o1-preview 模型的访问权限已经扩展到第 3 层使用者，速率限制与 GPT-4o 相同。

Subscribe 订阅