OpenAI RealTime API 将长对话的费用最多降低80%

在伦敦的一场开发者活动中，AI市场领军企业OpenAI宣布了一项关于RealTime API的新功能，帮助开发者节省使用成本，特别是对于开发语音聊天机器人的团队，这将是一个显著的成本削减。

OpenAI宣布，RealTime API即将加入自动缓存音频和文本输入的功能，预计可以将长对话的费用最多降低80%。这款API的核心在于支持语音助手和AI代理的开发，广泛应用于Healthify、Speak和Twilio等公司，用户可以通过语音或文字与机器人互动，甚至完成一些任务，如点餐或预约。

自今年10月初推出以来，RealTime API受到开发者的欢迎，但一些开发者反馈价格过高，特别是对于长对话的应用场景。OpenAI的API按处理的“tokens”（数据片段）收费：文本输入每百万个tokens收费5美元，输出则为20美元；音频输入每百万tokens收费100美元，输出为200美元。

Daily公司联合创始人Kwindla Kramer在社交平台X上指出了一个关键问题：RealTime API在每次新输入后会重新发送所有先前的输入和输出tokens，这使得长对话的费用成倍增长。他表示：“这就是RealTime API费用昂贵的原因——音频消耗大量tokens，而多轮对话会重复发送所有的tokens。”

OpenAI API支持团队的Shaun Ralston也在X上回应了相关问题。他解释，当用户输入的内容与之前处理的音频或文本相似或相同，OpenAI可以直接调取先前的结果，无需重新处理，从而节省费用。缓存的片段将按折扣价计费，大大提高了成本效益。

通过引入缓存功能，OpenAI将文本处理的价格从每百万tokens 5美元降低至2.5美元，而音频处理的价格则从100美元降至20美元，实现了80%的降幅。这一举措将极大地减轻开发者的负担，推动更多创新型应用的落地。

Subscribe 订阅