Anthropic 推出 Claude Opus 4.8,程式碼代理能力大幅進化



AI 公司 Anthropic 今日正式推出最新旗艦模型 Claude Opus 4.8,在代理式程式設計(agentic coding)、多領域推理與電腦操作等任務上都有明顯進步,被視為目前最強的「AI 程式設計協作者」之一。根據官方測試數據,Opus 4.8 在 SWE-Bench Pro 基準測試中達到 69.2% 的成績,超越 OpenAI 的 GPT-5.5 與 Google 的 Gemini 3.1 Pro。在多項代理式任務與知識工作評測中,也展現出更可靠的判斷力與執行力。


速度更快、成本更低

這次更新最受開發者關注的是「快速模式」(Fast Mode)。Opus 4.8 的快速模式速度比前一代快 2.5 倍,價格則便宜 3 倍。同時,模型在程式碼審查時「放過有缺陷程式碼」的機率,比 Opus 4.7 減少了 4 倍,顯示其判斷力與誠實度都有提升。

Anthropic 表示,Opus 4.8 在對齊(alignment)評測中也表現更好,較少出現欺騙或不當行為,親社會傾向更明顯。


新增「動態工作流」功能

此次更新還加入了「動態工作流」(Dynamic Workflows)研究預覽功能。開發者可以讓 Claude 拆解大型任務,自動規劃並啟動多個子代理(subagents)平行作業,適合進行大規模程式碼重構或專案遷移。目前這項功能已開放給 Enterprise、Team 與 Max 方案的 Claude Code 使用者。

此外,模型新增「努力程度控制」(Effort Control),讓用戶可以調整 Claude 思考的深度,預設為高努力模式以獲得最佳品質。Messages API 也支援在對話中途更新系統指令,方便開發者進行更彈性的控制。

AI 軍備競賽持續升溫

Anthropic 目前正同步開發比 Opus 系列更強大的新一代模型,並持續強化安全機制。據悉,代號「Claude Mythos」的新模型已在部分機構進行測試,預計不久後將開放給所有客戶使用。 隨著 Claude Opus 4.8 的推出,AI 在程式設計與代理任務上的實用性再次往前推進一大步。開發者與企業用戶可立即在 Anthropic 平台上體驗新模型。接下來就看看 OpenAI 甚麼時候要發布 GPT 5.6 了!


相關文章:

Claude Opus 4.8強調「誠實」,部分用戶反彈:寧可 AI 說謊也不想聽不確定性  [6/2/2026]
Anthropic 估值超越 OpenAI,最新估值達 9650 億美元  [5/31/2026]
Anthropic Claude 額度控管調整:Design 功能併入共用額度  [5/29/2026]
[「擇法善思林之蘭室藏津」的緣起]
韓AI命理師看好這題材股票!公開告白黃仁勳:隨時聯絡我
觀光署公布旅行社「黑名單」 勒令停業1家、廢照7家
台中鐵工廠爆工安!泰籍移工塗裝作業突倒地 昏迷搶救中
竹市壯壯卡擴大 11月起1.7萬國中生每週可兌換乳品豆漿優酪乳
萬丹國小通學步道施工一年未成 學校、家長抱怨連連
台東國中小校長第一階段遴選 17人調動、17人連任原校
ASIC訂單放量出貨 創意5月營收年增達132.1%
20多年前殺台日混血少女判刑聲請釋憲 憲法法庭認追訴權時效變更合憲
客戶改版 昇達科五月營收月減15%
法網》20歲捷克新星門希克拚決賽門票 透露偶像喬科維奇傳訊鼓勵
台南歸仁小學生自煮謝師宴僅1道炒米粉 卻復刻地方傳奇美味
世足》「藍武士」日本緊急更換訓練場地 久保建英:球員擔心受傷
青年買房有望!彰化溪湖青宅動土 總價可望低於員林案
議場變遊樂場?民眾黨議員質詢 請蔣萬安玩戰鬥陀螺、打匹克球
課堂所學應用於社區服務 北醫大學生組守護隊推廣食安理念
[擇法善思林之蘭室藏津]