OpenAI 在 2024 年的 DevDay 上发布了四项重大更新,重点放在提升 AI 的可访问性和降低成本上,为开发者们带来了更多实用工具。

以下是更新亮点:
实时 API:全新发布的实时 API 提供六种 AI 语音,专为应用程序中的无缝集成设计。这些语音与 ChatGPT 的不同,更加自然,适用于旅游规划、电话订购等场景,收费约为每小时 18 美元。此 API 支持实时响应,提升了多种应用中的用户体验,但开发者需明确告知使用了 AI 生成的语音。
视觉微调 API:视觉微调 API 允许开发者通过结合图像数据与文本增强 GPT-4o 的视觉理解能力。这项功能可应用于高级视觉搜索、自动驾驶中的物体识别以及精确的医学影像分析,且仅需 100 张图像即可实现。OpenAI 还强调了数据透明度,开发者可完全掌控数据的所有权与使用权,自动化安全评估确保合规。
API 中的提示缓存:提示缓存功能通过重用之前的输入 token,帮助开发者降低成本并减少延迟。这个功能对代码编辑和多轮对话特别有用,处理时间可节省多达 50%。它会自动应用于最新的 GPT-4o 和 GPT-4o mini 版本,并在提示超过 1,024 个 token 时激活,同时确保隐私保护。
API 中的模型蒸馏:OpenAI 推出的模型蒸馏技术,允许开发者利用 GPT-4o 和 o1-preview 等高级模型的输出来优化低成本模型。该集成过程简化了高性能模型的创建,比如 GPT-4o mini,且无需多种工具。关键功能包括“存储完成”用于自动生成数据集,以及“评估”用于性能测评。模型蒸馏现已开放,开发者每天可免费获得 200 万 GPT-4o mini 训练 token,和 100 万 GPT-4o token,直到 10 月 31 日,之后将按标准微调收费。
还有一个新的提示生成器?
据传 OpenAI 泄露了一份系统提示生成器的提示,专为提高提示的清晰度和有效性设计。
另外,OpenAI 还宣布 o1-preview 模型的访问权限已经扩展到第 3 层使用者,速率限制与 GPT-4o 相同。