Anthropic发布了全新Haiku 3.5模型,该模型现已通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI平台向公众开放。
据Anthropic介绍,Haiku 3.5在代码生成、工具使用和逻辑推理方面表现更为出色,在许多基准测试中超越了上一代的旗舰模型Claude 3 Opus,尽管成本低约15倍。其定价为每百万输入tokens收费1美元,每百万输出tokens收费5美元,约为第一代Haiku的四倍。旧版Haiku目前仍在提供,且具备新款尚未具备的视觉处理功能。
在降低使用成本方面,用户可以通过缓存和批量处理提示来节省开支,与其他Anthropic模型类似。该模型适合对响应速度要求较高的任务,例如终端用户聊天机器人等应用。
先进的Claude 3.5模型:编码和工具使用显著提升
Anthropic在此次发布中还带来了Claude 3.5 Sonnet模型,并首次推出了AI与计算机交互的新功能。Claude 3.5 Sonnet在编程任务上进步显著,例如在SWE Bench验证测试中的得分从33.4%提升至49.0%,超越了所有公开可用的模型,甚至包括专门为编程设计的系统。此外,在代理工具使用测试(TAU Bench)中的表现也显著提升,在零售领域的得分从62.6%提升到69.2%,在航空领域则从36.0%提升至46.0%。
Anthropic还特别开发了API,使Claude可以感知并与计算机界面交互。开发者可以利用该API,将指令如“使用我的计算机和互联网数据填写此表格”转化为实际的计算机命令。Claude 3.5 Sonnet在OSWorld基准测试的“仅截图”分类中得分14.9%,大大高于次佳系统的7.8%,但与人类能力相比仍存在差距。
AI在全球监管下的未来
Anthropic的Claude 3.5 Haiku和Sonnet为AI应用带来了更多灵活性,但其潜在影响还需在全球范围内平衡发展与规范化。