OpenAI 正式赋予 ChatGPT 通过视频实时与用户互动的能力。这项备受期待的功能在七个月前首次被公开提及,如今终于在直播活动中揭开神秘面纱。
通过新推出的视频选项,ChatGPT 可以利用智能手机的摄像头识别物体并根据屏幕内容进行交互。举例来说,用户可以请求 ChatGPT 协助回复打开的应用中的消息,或者获取实时指导,例如学习如何冲泡一杯咖啡。
这项视频功能将从周四起逐步向付费的 ChatGPT Plus 和 Pro 用户开放,而企业和教育用户将在明年一月获得这一功能的使用权限。
自两年前推出 ChatGPT 引领文本聊天机器人投资热潮以来,OpenAI 及其竞争对手持续扩展所谓的多模态功能,这些功能可以响应音频、图像和视频输入。此类服务让数字助手更具互动性和吸引力,进一步提升用户体验。
此次发布是 OpenAI 为期 12 天的直播产品活动中的一部分。此前,OpenAI 已通过系列发布会推出了更高价的 ChatGPT Pro 订阅选项,并宣布逐步推出一款名为 Sora 的 AI 视频生成工具。这些动态进一步凸显 OpenAI 在人工智能领域的雄心与创新能力。