国产在线拍揄自揄视精品一区|求快播网站你们懂得|好老师的小兔子好软水好多|夫妻性全过程实拍|s8视频网站|精品一区二区传媒公司|男女生的节日对比

湖南臺(tái)AI主播被罵上熱搜,但AI每小時(shí)喂5700 萬條「錯(cuò)誤信息」沒人管

  天天被 AI 刷屏,湖南這個(gè)五一假期我真的播被不想再看到 AI 生成的內(nèi)容了。

  結(jié)果我難得打開電視,罵上I每沒人投票沖刺技巧分享卻發(fā)現(xiàn),熱搜電視臺(tái)已經(jīng)開始用 AI 主持人來播報(bào)新聞。小時(shí)信息

  

  湖南經(jīng)視在《經(jīng)視新聞》宣布啟用 AI 主播「聲聲」和「雙雙」,這也不是湖南說湖南衛(wèi)視要用 AI 完全替代真人,這兩位 AI 主播暫時(shí)只在五一假期期間播報(bào)常態(tài)化新聞,播被同時(shí)畫面中也標(biāo)注「AI 生成」。罵上I每沒人

  

  AI 主播與真人主播合影

  雖然如此,依然引發(fā)了大量網(wǎng)友吐槽,小時(shí)信息話題一度沖到微博熱搜第一。錯(cuò)誤

  在港劇《新聞女王 2》里有一段這樣的湖南劇情,主播文慧心離開電視臺(tái)后,播被老東家把她和一位已故男主播「蒸餾」成 AI 數(shù)字人,罵上I每沒人繼續(xù)在臺(tái)前播報(bào)新聞。

  

  現(xiàn)在,這樣的劇情已經(jīng)成真。去年開始,越來越多的電視臺(tái)已經(jīng)開始試點(diǎn)類似的 AI 主播。

  或許你一時(shí)間還不能接受 AI 主播 ,投票沖刺技巧分享但說實(shí)話,現(xiàn)在用 AI 搜新聞看新聞,已經(jīng)十分普遍了,搜索引擎也把 AI 搜索融入到了搜索框里。

  實(shí)際上,比起 AI 主播,用 AI 看新聞是現(xiàn)在更需要警惕的。而未來,大量 AI 主播播報(bào) AI 搜集撰寫的新聞,才是最可怕的。

  一個(gè)調(diào)查數(shù)據(jù)顯示,Google AI 搜索新聞的結(jié)果,十條就有一條是錯(cuò)的。

  去年年底,住在多倫多的 41 歲數(shù)據(jù)分析師 Stephen Punwasi 在準(zhǔn)備晚餐時(shí)看到一條新聞,說傳奇摔跤選手霍爾克·霍肯的死亡可能會(huì)引發(fā)訴訟。Punwasi 從來沒聽說過霍肯已經(jīng)去世了,于是打開 Google,想查查這件事是什么時(shí)候發(fā)生的。

  Google 給他的第一條回答來自自家的 AI Overview :「沒有可信的報(bào)道表明霍爾克·霍肯已經(jīng)去世?!?/p>

  

  可就在這個(gè)回答的下方,Stephen Punwasi 看到第一條搜索鏈接就是《每日郵報(bào)》的一篇文章,標(biāo)題是:「霍爾克·霍肯死亡之謎加深?!?/p>

  人都懵了,這是怎么個(gè)事呢?

  每小時(shí)超 5700 萬條錯(cuò)誤信息

  2024 年,Google 開始在搜索結(jié)果頁面最頂部放置 AI 生成的摘要回答,叫做 AI Overviews。這個(gè)動(dòng)作是 Google 生態(tài)全面加速 AI 化的第一波動(dòng)作,把搜索引擎從一個(gè)信息的「策展人」變成了一個(gè)「發(fā)布者」。它不再只是告訴你哪里有答案,而是直接告訴你答案是什么。

  

  《紐約時(shí)報(bào)》委托 AI 初創(chuàng)公司 Oumi 對這個(gè)功能進(jìn)行了系統(tǒng)測試。他們用行業(yè)標(biāo)準(zhǔn)的 SimpleQA 基準(zhǔn)測試檢查了 4326 次 Google 搜索的 AI Overview 回答,分別在去年 10 月(基于 Gemini 2)和今年 2 月(升級(jí)到 Gemini 3)進(jìn)行了測試。

  結(jié)果發(fā)現(xiàn) Gemini 2 時(shí)期,準(zhǔn)確率約 85%,錯(cuò)誤率 15%。到了 Gemini 3 時(shí)期,準(zhǔn)確率提升到 91%,錯(cuò)誤率 9%

  乍一聽 90%準(zhǔn)確率聽起來還不錯(cuò),但考慮到 Google 每年處理超 5 萬億次搜索,即便只有 9%的錯(cuò)誤率,換算下來也是每小時(shí)超 5700 萬條錯(cuò)誤信息,每分鐘數(shù)十萬條。

  這些錯(cuò)誤答案被放在搜索結(jié)果的最頂部,用最權(quán)威的排版呈現(xiàn),用戶看到的第一個(gè)東西,就是 AI 的回答。

  看起來像答案,但不是答案

  AI 會(huì)穩(wěn)定出錯(cuò),出差錯(cuò)的方式倒是花樣繁多,比如像開頭的故事那樣,屬于是直接答錯(cuò)。

  直接答錯(cuò)看似最不應(yīng)該,實(shí)則相當(dāng)頻繁。在測試?yán)?,?dāng)被問到鮑勃·馬利的故居是哪一年改建為博物館時(shí),AI Overview 回答說 1987 年。但正確答案是博物館在 1986 年 5 月 11 日開放,也就是馬利去世五周年紀(jì)念日當(dāng)天,牙買加《每日光明報(bào)》在開館第二天就報(bào)道了。

  

  牙買加國家圖書館收錄的相關(guān)報(bào)道

  AI Overview 引用了三個(gè)來源:一個(gè)是馬利女兒的 Facebook 帖子(根本沒提開館時(shí)間),一個(gè)是旅游博客(信息不準(zhǔn)確),一個(gè)是 Wikipedia 頁面,大家都知道,Wiki 的頁面變化非常頻繁,根本就不準(zhǔn)。

  有事后出錯(cuò)則是因?yàn)樾畔⒂幸粋€(gè)模糊的來源,需要謹(jǐn)慎判斷,但 AI 推斷錯(cuò)了。比如當(dāng)被問到哪條河流在北卡羅來納州戈?duì)柶澆帐械奈鱾?cè)時(shí),AI Overview 回答說是尼斯河(Neuse River)。它正確地找到了一個(gè)旅游網(wǎng)站說尼斯河「流經(jīng)該市」,但錯(cuò)誤地推斷出它「在西側(cè)」。實(shí)際上西側(cè)的是小河(Little River),尼斯河在西南方。

  最離譜的一種出錯(cuò)方式找到了正確的來源,但給出相反的答案。當(dāng)被問到大提琴家馬友友是哪一年被引入古典音樂名人堂時(shí),AI Overview 正確地鏈接到了該組織的官網(wǎng),網(wǎng)站上明確列出了包括馬友友在內(nèi)的 165 位入選者。但 AI 的回答卻說:「沒有記錄顯示他被引入過?!?/p>

  

  睜著眼睛說瞎話是吧,哦不,AI 沒有眼睛。

  「它看起來像個(gè)正經(jīng)答案啊」

  Oumi 分析了 AI Overview 引用的 5380 個(gè)來源,發(fā)現(xiàn) Facebook 和 Reddit 分別是第二和第四大被引用源。當(dāng) AI Overview 給出錯(cuò)誤回答時(shí),引用 Facebook 的比例是 7%;當(dāng)回答正確時(shí),這個(gè)比例是 5%。

  

  社交媒體是主要的信息來源,但缺乏核實(shí)

  換句話說,你看到的那個(gè)「最權(quán)威」的回答,數(shù)據(jù)來源可能是一條 Facebook 帖子,真是沒招了。

  而且,即便回答本身是正確的,也不代表你能逆向查驗(yàn)。Gemini 3 版本的 AI Overview 中,56%的正確回答是「無根據(jù)的」,意思是它鏈接的網(wǎng)站并不完全支持它給出的信息。或許答案本身沒錯(cuò),但你硬是找不到證據(jù)做實(shí)它是對的。這個(gè)比例還在上升,去年 10 月是 37%,升級(jí)到 Gemini 3 之后反而漲到 56%。

  

  馬友友的名人堂條目需要進(jìn)一步在網(wǎng)站內(nèi)檢索才能獲得

  Oumi 的 CEO Manos Koukoumidis 的總結(jié)很直接:「即使答案是對的,你怎么知道它是對的?你怎么檢查?」

  還有一個(gè)問題:AI Overview 可以被操縱。

  BBC 播客「The Interface」的聯(lián)合主持人 Thomas Germain 做了一個(gè)實(shí)驗(yàn)。他發(fā)布了一篇博客,標(biāo)題是「最擅長吃熱狗的科技記者」,描述了一個(gè)完全虛構(gòu)的南達(dá)科他州國際熱狗吃賽,聲稱自己獲得了第一名。

  

  一天后,他在 Google 搜索「最會(huì)吃熱狗的科技記者」。Google 的 AI Overview 將他列為第一名,并引用了他在那個(gè)虛構(gòu)比賽中的「成績」。Germain 說:「它把我網(wǎng)站上的東西當(dāng)成真理一樣吐出來?!?/p>

  Google 的發(fā)言人 Ned Adriance 回應(yīng)稱,大多數(shù)這類例子是「不現(xiàn)實(shí)的搜索,人們實(shí)際上不會(huì)這樣搜」。但問題不在于人們會(huì)不會(huì)搜「最擅長吃熱狗的記者」,而在于這個(gè)機(jī)制在任何搜索中都在運(yùn)作——包括醫(yī)療建議、急救信息、法律問題。

  當(dāng)搜索引擎變成答案引擎

  Google 自己的測試也印證了這個(gè)問題。在 Google 對 Gemini 3 的內(nèi)部評(píng)估中,模型單獨(dú)運(yùn)行時(shí)的錯(cuò)誤率是 28%。Google 說,AI Overview 因?yàn)榻Y(jié)合了搜索引擎的信息,比 Gemini 單獨(dú)運(yùn)行更準(zhǔn)確。這也不算錯(cuò),但「比通用的 AI 更準(zhǔn)確」和「足夠準(zhǔn)確」之間,還有很長的距離。

  

  核心矛盾在于,過去的 Google 搜索是一個(gè)「目錄」,它告訴你哪里有信息,你自己去判斷,費(fèi)時(shí)間但自己看過什么自己心知肚明。現(xiàn)在的 Google 搜索要做一個(gè)「答案機(jī)器」,直接告訴你答案是什么,而且放在最顯眼的位,但這個(gè)「答案」的數(shù)據(jù)來源包括 Facebook 帖子和旅游博客,有超過一半的正確回答無法被驗(yàn)證,而且任何人只要寫一篇博客就能操縱它的輸出。

  Google(包括大部分的 AI 產(chǎn)品)都在每一條 AI Overview 下方加了一行小字:「AI 可能會(huì)犯錯(cuò),請雙重檢查?!?/p>

  但當(dāng)你把一個(gè)答案放在搜索結(jié)果的最頂部,用最權(quán)威的排版呈現(xiàn),然后在底部用小字說「別全信」,這不像是負(fù)責(zé)任的設(shè)計(jì),更像是免責(zé)聲明。

  

  真正的問題不在于 9%的錯(cuò)誤率本身。任何信息系統(tǒng)都有錯(cuò)誤率,傳統(tǒng)搜索結(jié)果里也有大量垃圾網(wǎng)站和誤導(dǎo)性內(nèi)容。真正的問題在于一個(gè)設(shè)計(jì)決策:Google 把一個(gè)不確定的回答包裝成了確定的樣子。

  過去,搜索引擎給你十個(gè)鏈接,你知道自己需要判斷。

  現(xiàn)在,搜索引擎給你一個(gè)答案,放在最上面,用最干凈的排版,語氣肯定而完整。它看起來不像「這里有一些信息供你參考」,而是「這就是答案」。而人類對「看起來像答案的東西」的默認(rèn)反應(yīng)是信任,不是質(zhì)疑。

  Okahu 的 CEO Pratik Verma 的建議是:「永遠(yuǎn)不要信任單一來源,總是拿另一個(gè)來源對比。」這是好建議,但它默認(rèn)用戶有能力和意愿去做交叉驗(yàn)證。而 AI Overview 的整個(gè)設(shè)計(jì)邏輯恰恰相反:它要的就是讓你不用再點(diǎn)進(jìn)去看。

  它把答案遞到你面前,然后建議是,別信

鄂ICP備2025167458號(hào)-1