Anthropic推出全球首個「混合推理」AI，為什麼它是迄今最聰明模型？

AI新創Anthropic推出一種「混合推理」的AI模型，能讓用戶決定是想要一個簡單快速的答案，還是一個模仿人類推理、更深思熟慮的答案，預期這種創新的方法能讓這家公司在競爭中脫穎而出。

深淺皆宜，幫用戶省時

這款新的AI模型名為「Claude 3.7 Sonnet」，它不僅能解決更複雜的問題，在數學和程式設計等領域的表現也優於過往的其他AI模型。

在測量寫程式能力的測試SWE-Bench中，Claude 3.7 Sonnet的準確率為62.3%，而OpenAI的o3-mini模型準確率為49.3%；在另一項衡量AI模型在零售場景中與模擬使用者和外部API互動能力的測試TAU-Bench中，Claude 3.7 Sonnet的得分為81.2%，而OpenAI的o1模型的得分為73.5%。

過去幾個月，愈來愈多的AI新創，包含OpenAI、DeepSeek 和伊隆馬斯克的xAI，都推出了可以在回答問題前，投入更多時間計算答案的「推理」功能，但Anthropic認為用戶有時候可能渴望「簡單一點」。