Will 保哥的技術交流中心 on Facebook競爭是殘酷的,人類是現實的,金錢是衡量效率的最後仲裁者!🤘
從這張 SWE-bench 排行榜可以直觀看到一個事實:模型之間沒有情面可講,只剩下「能不能把問題解掉、要花多少時間、成本多高」。
GPT 5.1 Codex 站在最上面,不靠宣傳,只靠把題目做對;Claude、Qwen、Grok 全部擠在後面,各自用不同策略拉開差距。
圖表告訴你現在的 AI 模型已經不是「能不能寫程式」的問題,而是「在相同任務下,誰能用更少成本、更可控的時間,把事情做完」。
工程師的世界裡,這種排名永遠最誠實。✨