91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

BBC 等機(jī)構(gòu)研究評(píng)估 AI 工具新聞總結(jié)水平,谷歌 Gemini 錯(cuò)誤比例最高

2025/10/24 7:29:21 來源:IT之家 作者:清源 責(zé)編:清源

IT之家 10 月 24 日消息,生成式 AI 的確在信息整理方面大有用處,生成的內(nèi)容也常令人驚嘆,但只要仔細(xì)一看,就能發(fā)現(xiàn)這項(xiàng)技術(shù)仍存在不少缺陷。

據(jù)外媒 Android Authority 今日報(bào)道,歐洲廣播聯(lián)盟(EBU)與 BBC 近日聯(lián)合評(píng)估了 ChatGPT、Gemini 及 Perplexity 等多款 AI 系統(tǒng)在新聞?wù)矫娴谋憩F(xiàn)。研究動(dòng)因在于,現(xiàn)有約 15% 的 25 歲以下年輕人主要通過 AI 獲取新聞。

BBC 最初通過大規(guī)模問卷調(diào)查及六場焦點(diǎn)小組訪談收集公眾對 AI 新聞工具的使用體驗(yàn)與看法,隨后 EBU 將這項(xiàng)研究擴(kuò)展至國際范圍。

研究顯示,約 42% 的英國成年人表示信任 AI 內(nèi)容的準(zhǔn)確性,年輕群體的信任度更高。不過,84% 的受訪者認(rèn)為,一旦出現(xiàn)事實(shí)性錯(cuò)誤,將嚴(yán)重削弱自己對 AI 的信任。問題在于,這些系統(tǒng)的“不準(zhǔn)確度”究竟為何,以及用戶是否真的察覺到了這些錯(cuò)誤。

結(jié)果顯示,大多數(shù) AI 生成的內(nèi)容都存在問題。各模型整體表現(xiàn)差距不大,但 Gemini 成為明顯“異類”,不僅錯(cuò)誤數(shù)量最多,嚴(yán)重錯(cuò)誤的比例也遠(yuǎn)高于其他系統(tǒng)

ai news research chart 1

ai news research chart 2

研究指出,Gemini 的問題主要包括:缺乏清晰的資料來源鏈接、未能區(qū)分可靠信息與諷刺內(nèi)容、過度依賴維基百科、缺乏足夠語境,以及錯(cuò)誤引用原文。

在六個(gè)月的研究周期中,各大 AI 系統(tǒng)的表現(xiàn)都有改進(jìn),新聞?wù)臏?zhǔn)確率普遍提升,Gemini 的進(jìn)步尤為明顯。但即使如此,Gemini 的表現(xiàn)仍明顯落后于其他系統(tǒng)。

IT之家附報(bào)告鏈接:News Integrity in AI Assistants

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能,AI總結(jié)Gemini

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知

太仆寺旗| 韩城市| 车致| 张家口市| 军事| 滕州市| 溧水县| 海盐县| 丰镇市| 锡林郭勒盟| 新兴县| 伊吾县| 乡宁县| 肃南| 东乡族自治县| 镇坪县| 桐乡市| 梓潼县| 台南县| 翁牛特旗| 河东区| 茌平县| 吴川市| 汨罗市| 瑞昌市| 平定县| 西盟| 绵竹市| 松潘县| 个旧市| 安义县| 云安县| 海城市| 德昌县| 历史| 西华县| 托克逊县| 云安县| 双牌县| 长白| 青铜峡市|