Anthropic发布了全新Haiku 3.5模型

Anthropic发布了全新Haiku 3.5模型，该模型现已通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI平台向公众开放。

据Anthropic介绍，Haiku 3.5在代码生成、工具使用和逻辑推理方面表现更为出色，在许多基准测试中超越了上一代的旗舰模型Claude 3 Opus，尽管成本低约15倍。其定价为每百万输入tokens收费1美元，每百万输出tokens收费5美元，约为第一代Haiku的四倍。旧版Haiku目前仍在提供，且具备新款尚未具备的视觉处理功能。

在降低使用成本方面，用户可以通过缓存和批量处理提示来节省开支，与其他Anthropic模型类似。该模型适合对响应速度要求较高的任务，例如终端用户聊天机器人等应用。

先进的Claude 3.5模型：编码和工具使用显著提升

Anthropic在此次发布中还带来了Claude 3.5 Sonnet模型，并首次推出了AI与计算机交互的新功能。Claude 3.5 Sonnet在编程任务上进步显著，例如在SWE Bench验证测试中的得分从33.4%提升至49.0%，超越了所有公开可用的模型，甚至包括专门为编程设计的系统。此外，在代理工具使用测试（TAU Bench）中的表现也显著提升，在零售领域的得分从62.6%提升到69.2%，在航空领域则从36.0%提升至46.0%。

Anthropic还特别开发了API，使Claude可以感知并与计算机界面交互。开发者可以利用该API，将指令如“使用我的计算机和互联网数据填写此表格”转化为实际的计算机命令。Claude 3.5 Sonnet在OSWorld基准测试的“仅截图”分类中得分14.9%，大大高于次佳系统的7.8%，但与人类能力相比仍存在差距。

AI在全球监管下的未来

Anthropic的Claude 3.5 Haiku和Sonnet为AI应用带来了更多灵活性，但其潜在影响还需在全球范围内平衡发展与规范化。

Subscribe 订阅

先进的Claude 3.5模型：编码和工具使用显著提升

AI在全球监管下的未来