
Image by TechCrunch, from Flickr
AI能先思考再发言?Claude 3.7 Sonnet推出混合推理功能
Anthropic已经推出了Claude 3.7 Sonnet,这是其AI模型的新版本,引入了一个可选的“延长思考”模式,让用户对模型处理复杂任务的方式有更多的控制权。
急着了解?下面是快速事实!
- 该模型通过允许自我反思来提高推理和解决问题的能力。
- 延伸思维模式只在付费计划中可用。
- Claude Code,一款编程助手,目前仅对开发者有限预览。
Anthropic 公司发布了升级版的 AI 模型 Claude 3.7 Sonnet,这款模型引入了混合推理功能,使用户可以在快速回应和深度思考之间进行选择。
这种新的方法旨在通过让模型在需要的时候花更多时间评估和完善其反应,从而提高解决问题的能力。
在标准模式下,Claude 3.7 Sonnet作为其前身Claude 3.5 Sonnet的迭代改进。然而,在扩展思考模式下,模型会在产生答案之前进行自我反思。
Anthropic的AI产品负责人Michael Gerstenhaber将这个功能描述为一种让用户在响应时间和推理深度之间取得平衡的方式。“[用户]对行为有很多控制权——可以控制它思考的时间长短,以及平衡推理和智能与时间和预算的关系。”他在接受WIRED的采访时表示。
这个过程旨在提高在需要多步推理的领域的准确性,比如数学、物理、编程和指令执行。通过API与模型进行交互的用户可以设定模型“思考”的代币使用上限,从而控制响应速度和成本。
《WIRED》指出,这次更新还包括了一个“草稿板”功能,它能让模型在处理请求时的推理步骤可见。这种方法与其他AI模型,如DeepSeek’s的技术类似。
Anthropic表示,Claude 3.7 Sonnet已针对实际应用进行了优化,而非竞赛式的基准测试。早期测试表明,扩展的推理模式能够改善处理涉及复杂代码库、高级工具使用和全栈软件开发的任务的性能。
该模型已在SWE-bench Verified和TAU-bench上进行了评估,据Anthropic报道,其表现优于以往的版本。
CNN指出,Anthropic将Claude 3.7的定价与以往的模型保持一致,将其定位在OpenAI的最新产品之下。每百万个输入令牌的价格为3美元,每百万个输出令牌的价格为15美元,而对于类似的等级,OpenAI的价格分别为15美元和60美元。
留下评论
取消