91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Claude Opus 4.8 上線:提升 AI 編程可靠性,減少無依據(jù)結論

2026/5/29 6:52:22 來源:IT之家 作者:故淵 責編:故淵

IT之家 5 月 29 日消息,Anthropic 今天(5 月 29 日)宣布推出旗艦新模型 Claude Opus 4.8,主打更強的智能體編程、多領域推理和知識工作能力。

官方表示,相比較 Opus 4.7 模型,本次 Opus 4.8 更新幅度較小,在保持價格不變的情況下,主要提升編程、智能體、推理和知識工作等用戶能感知的方面。

能力層面,官方援引多家早期測試方反饋稱,表示 Opus 4.8 “更可靠,判斷也更敏銳”,在復雜多步驟任務中判斷更穩(wěn),能主動提問、識別自身錯誤,并在計劃不合理時提出異議。

官方評估顯示,和前代相比,Opus 4.8 放任自己所寫代碼缺陷、卻不加說明的概率降低至四分之一,更愿意主動標出不確定性,減少缺乏依據(jù)的結論。

對齊表現(xiàn)方面,Opus 4.8 在支持用戶自主性、按用戶最佳利益行動等親社會指標上創(chuàng)下新高。與此同時,欺騙等失配行為的出現(xiàn)率低于 Opus 4.7,并與 Claude Mythos Preview 接近。IT之家附上相關截圖如下:

配套功能方面,claude.ai 新增 effort 程度控制,用戶可平衡更高質量與更快響應。默認是 high 檔,在編碼任務中,token 消耗與 Opus 4.7 默認檔接近,但效果更好;若選擇 extra(在 Claude Code 中為 xhigh)或者 max 更高檔位,模型會消耗更多 tokens 以換取更優(yōu)結果。

基準測試方面,Anthropic 稱 Opus 4.8 在 SWE-Bench Pro 上得到 69.2%,并在該測試和其他多項基準中超過 GPT–5.5 與 Gemini 3.1 Pro。但在終端編程基準上,GPT–5.5 仍然領先。

這次更新還帶來性能和價格調整。Anthropic 表示,Opus 4.8 的快速模式運行速度提升到 2.5 倍,模型成本則降到此前模型的 1/3。

定價方面,常規(guī)模式維持每 100 萬輸入令牌 5 美元、每 100 萬輸出令牌 25 美元;快速模式為每 100 萬輸入令牌 10 美元、每 100 萬輸出令牌 50 美元。

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:AI,Claude

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知

台东县| 台北市| 登封市| 炉霍县| 万州区| 晋中市| 双牌县| 东丰县| 襄城县| 进贤县| 吉林省| 乐平市| 乌审旗| 元谋县| 金平| 含山县| 汾西县| 湘乡市| 保定市| 葫芦岛市| 牙克石市| 那坡县| 勐海县| 丰城市| 华容县| 乌拉特后旗| 额敏县| 五华县| 吉安县| 濮阳市| 满城县| 西昌市| 舟山市| 江源县| 察雅县| 罗定市| 辽阳县| 昭苏县| 聂荣县| 五原县| 宣城市|