去年,OpenAI在旧金山举办了一场盛大的新闻发布会,宣布了一系列新产品和工具,包括命运多舛的GPT商店。
然而,今年的活动将低调许多。周一,OpenAI宣布将其DevDay大会的形式从一个重要的活动改为一系列巡回开发者互动会。公司还确认不会在DevDay期间发布其下一个主要旗舰模型,而是专注于API和开发者服务的更新。
“我们不计划在DevDay上宣布我们的下一个模型,”OpenAI发言人告诉TechCrunch。“我们将更多地关注教育开发者现有的内容,并展示开发者社区的故事。”
今年的DevDay活动将于10月1日在旧金山、10月30日在伦敦、11月21日在新加坡举行。所有活动将包括研讨会、小组讨论、OpenAI产品和工程团队的演示以及开发者聚光灯。注册费用为450美元(符合条件的参会者可通过奖学金免费参加),申请将于8月15日截止。
最近几个月,OpenAI在生成式AI领域采取了更多的渐进步骤,而不是巨大的飞跃,公司选择在训练其当前领先模型GPT-4o和GPT-4o mini的继任者时精细调整其工具。公司改进了模型的整体性能并防止其像以前那样频繁出错,但根据一些基准测试,OpenAI似乎在生成式AI竞赛中失去了技术领先地位。
其中一个原因可能是寻找高质量训练数据的挑战日益增大。
OpenAI的模型(与大多数生成式AI模型一样)基于海量的网络数据进行训练——许多创作者选择限制访问这些数据,担心他们的数据会被剽窃或不会得到应有的信用或报酬。根据Originality.AI的数据,全球排名前1000的网站中有超过35%现在屏蔽了OpenAI的网络爬虫。麻省理工学院数据来源计划的一项研究发现,主要用于训练AI模型的“高质量”来源数据中约有25%已被限制。
如果当前的访问屏蔽趋势继续下去,研究小组Epoch AI预测开发者将在2026年至2032年之间用尽用于训练生成式AI模型的数据。这——以及对版权诉讼的担忧——迫使OpenAI与出版商和各种数据经纪人达成高昂的许可协议。
据悉,OpenAI已经开发了一种推理技术,可以提高其模型在某些问题(特别是数学问题)上的响应能力,公司首席技术官Mira Murati承诺未来将推出具有“博士水平”智能的模型。(OpenAI在5月的一篇博文中透露,它已经开始训练其下一个“前沿”模型。)这是一个巨大的承诺——压力也很大。据报道,OpenAI在训练其模型和雇佣高薪研究人员时,损失了数十亿美元。
OpenAI仍面临许多争议,例如使用受版权保护的数据进行训练、严格的员工保密协议(NDA)以及有效地将安全研究人员推开。较慢的产品周期可能有助于扭转OpenAI为了追求更强大的生成式AI技术而忽视AI安全工作的叙事。