IT之家 6 月 6 日消息,據(jù) Business Insider 消息,Anthropic 正通過一個由約 1000 名人類軟件工程師參與的項目,提升 Claude Code 的性能。
該項目在數(shù)據(jù)標注公司 Snorkel AI 內(nèi)部被稱為“Marlin”(馬林魚),其核心在于微調(diào) Claude Code 的回答,使其能夠更接近開發(fā)人員的真實工作環(huán)境。
像 Anthropic 這樣的 AI 公司通常會將數(shù)據(jù)工作外包給諸如 Snorkel 之類的第三方公司,而這些第三方公司會雇傭外包人員來向 AI 教授各種專業(yè)領(lǐng)域的學科,并執(zhí)行其他任務(wù)以改進模型。
兩位參與該 Anthropic 項目的外包人員透露,他們編寫提示詞并審查代碼的報酬為每項任務(wù) 280 美元(IT之家注:現(xiàn)匯率約合 1902 元人民幣)。他們表示,每項任務(wù)大約需要一小時,不過有些提交的內(nèi)容需要與 Snorkel 的審批層進行多輪溝通。
在 Marlin 項目中,擁有軟件工程背景的外包人員被要求對兩種不同模型生產(chǎn)的代碼進行 A/B 測試。他們會比較兩組輸出,選擇自己更偏好的結(jié)果,并判斷模型是否真正達到了提示詞要求的細節(jié)程度。
一名外包人員表示,該項目旨在確保模型能夠達到提示詞中所期望的詳細程度,從本質(zhì)上講,就是在訓練 Claude Code 生產(chǎn)更簡化、更易于維護的代碼。
據(jù)悉,該項目目前仍在進行中。外包人員并不知道他們所評估的是哪個版本的模型。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。