91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

哥倫比亞大學(xué)研究:AI 搜索工具平均準(zhǔn)確率僅六成,且自信滿滿“不認(rèn)錯”

2025/3/13 16:33:22 來源:IT之家 作者:清源 責(zé)編:清源

IT之家 3 月 13 日消息,據(jù)外媒 Techspot 周二報(bào)道,哥倫比亞大學(xué)數(shù)字新聞研究中心(Tow Center for Digital Journalism)近期對八款 AI 搜索引擎展開研究,包括 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search 和 Copilot。研究人員測試了每款引擎的準(zhǔn)確性,并記錄了它們拒絕回答問題的頻率。

研究人員從 20 家新聞機(jī)構(gòu)中隨機(jī)挑選了 200 篇報(bào)道(每家 10 篇),確保它們在谷歌搜索時(shí)能排在前三位,然后用相同的查詢方式測試各 AI 搜索工具,并評估它們是否正確引用了文章內(nèi)容、新聞機(jī)構(gòu)名稱和原始鏈接。

測試結(jié)果顯示,除 Perplexity 及其付費(fèi)版外,其余 AI 搜索引擎的表現(xiàn)都不盡如人意。整體來看,AI 搜索引擎提供的答案有 60% 是不準(zhǔn)確的,而且 AI 對錯誤答案的“自信”反而加劇了問題。

這項(xiàng)研究的重要性在于,它用數(shù)據(jù)印證了外界多年來的擔(dān)憂 —— 大語言模型僅會出錯,還擅長一本正經(jīng)地胡說八道。它們往往以絕對肯定的語氣陳述錯誤信息,甚至在被質(zhì)疑時(shí)仍然試圖自圓其說。

即使承認(rèn)了錯誤,ChatGPT 仍可能在后續(xù)回答中繼續(xù)編造內(nèi)容。在大語言模型的設(shè)定中,幾乎是無論如何都要給出答案”。研究數(shù)據(jù)支持了這一觀點(diǎn):ChatGPT Search 是唯一回答了所有 200 個(gè)新聞查詢的 AI 工具,但其“完全正確”率僅 28%,而“完全錯誤”率高達(dá) 57%

ChatGPT 并非表現(xiàn)最糟的。X 旗下的 Grok AI 表現(xiàn)尤為不堪,其中 Grok-3 Search 的錯誤率高達(dá) 94%。微軟 Copilot 也問題重重 —— 在 200 次查詢中,有 104 次拒絕作答,剩下的 96 次中,僅 16 次“完全正確”,14 次“部分正確”,66 次“完全錯誤”,總體錯誤率接近 70%

這些 AI 工具的開發(fā)公司并未公開承認(rèn)這些問題,卻仍向用戶收取每月 20 至 200 美元(IT之家備注:當(dāng)前約 145 至 1449 元人民幣)的訂閱費(fèi)。此外,付費(fèi)版 Perplexity Pro(20 美元 / 月)和 Grok-3 Search(40 美元 / 月)比免費(fèi)版回答得更多,但錯誤率也更高。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:搜索引擎,人工智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知

新民市| 张北县| 皋兰县| 新和县| 辽中县| 阿拉善右旗| 资兴市| 丰原市| 乐业县| 仪陇县| 灵川县| 荃湾区| 南丰县| 兖州市| 水富县| 上栗县| 桐柏县| 朝阳区| 句容市| 永泰县| 鲁甸县| 额济纳旗| 陇西县| 沈丘县| 贵阳市| 霍林郭勒市| 志丹县| 积石山| 江口县| 富宁县| 阳山县| 应城市| 平陆县| 海原县| 全椒县| 宁武县| 石嘴山市| 老河口市| 措美县| 虎林市| 凉城县|