Anthropic推出全球首個「混合推理」AI,為什麼它是迄今最聰明模型?

AI新創Anthropic推出一種「混合推理」的AI模型,能讓用戶決定是想要一個簡單快速的答案,還是一個模仿人類推理、更深思熟慮的答案,預期這種創新的方法能讓這家公司在競爭中脫穎而出。
深淺皆宜,幫用戶省時
這款新的AI模型名為「Claude 3.7 Sonnet」,它不僅能解決更複雜的問題,在數學和程式設計等領域的表現也優於過往的其他AI模型。
在測量寫程式能力的測試SWE-Bench中,Claude 3.7 Sonnet的準確率為62.3%,而OpenAI的o3-mini模型準確率為49.3%;在另一項衡量AI模型在零售場景中與模擬使用者和外部API互動能力的測試TAU-Bench中,Claude 3.7 Sonnet的得分為81.2%,而OpenAI的o1模型的得分為73.5%。
過去幾個月,愈來愈多的AI新創,包含OpenAI、DeepSeek 和伊隆馬斯克的xAI,都推出了可以在回答問題前,投入更多時間計算答案的「推理」功能,但Anthropic認為用戶有時候可能渴望「簡單一點」。