谷歌AI搜索慘敗,竟教唆網友自殺!

0 評論 1748 瀏覽 1 收藏 20 分鐘

隔壁OpenAI都殺瘋了,谷歌還在收集badcase?搜索引擎AI Overview上線之后,沒想到谷歌AI的邪惡程度遠超想象:教唆網友自殺/謀殺、吃毒蘑菇,甚至無法識別混淆信息,犯常識錯誤......

這幾天,谷歌AI搜索給出的奇葩結果,可是被網友吵翻了天。

究竟有多離譜?

有人就問了這么一個問題,「如何不讓芝士從披薩上滑落」?

谷歌AI Overview給的回復是,「給披薩加點料——膠水」。

在醬汁中加入1/8杯無毒膠水,可以使其更粘稠,有助于芝士粘附。

有趣的是,這一答案竟可以追溯到11年前的Reddit帖子,而這只是Reddit網友玩的一個梗。

除此以外,谷歌AI Overview還建議網友,吃有毒的蘑菇、殺人、跳橋等,給出了各種震碎三觀的回答。

其實,谷歌這項AI搜索功能——「生成式搜索體驗」(SGE),在去年5月已經推出了測試版。

根據官博所述,目前SGE功能,已被「AI Overview」所取代。

幾周前的谷歌I/O大會上,劈柴甚至表示,谷歌已經提供了超10億次查詢。

針對這些荒謬的回復,谷歌正在采取行動,刪除某些錯誤內容,并根據這些例子去更廣泛地改進AI系統。

若要說谷歌翻車,早已見怪不怪了。

去年首推對標ChatGPT的聊天機器人Bard,卻因demo錯誤讓市值一夜暴跌。還有前段時間,圖像生成黑人等問題,也在全網掀起軒然大波。

而這一次,谷歌又讓世界大開眼界。

一、全網測評,震碎三觀

對于純真的Google AI Overview來說,它認為「互聯網上的一切內容都是100%真實的」,每條新聞、社交媒體都是完全可信的,所以一旦有人在網上說了一些誤導性的話,就會導致模型回復出一些誤導性言論。

有網友還發現,當詢問每天應該吃多少石頭時,模型會引用UC伯克利地質教授給出的建議「每天至少吃一塊小石頭」。

對于不明真相的用戶來說,有權威人士說明、有相關資料和細節說明,妥妥的優質文本,或許還真有可能去嘗試每天吃石子。

https://www.resfrac.com/blog/geologists-recommend-eating-least-one-small-rock-day

但事實是,ResFrac發布這篇文章的原因只是想轉發洋蔥報(the Onion)上的諷刺內容(迷信權威),但卻在無意中幫助測試了Google AI Overview識別諷刺內容的能力。

AI Overview經常會把互聯網上的諷刺內容當事實,例如拿著剪刀跑步會增加運動量,提升心率等。

也有作者專門想愚弄模型,在自己的網站上用「白底白字」寫了一些自己沒獲得的獎項和經歷,正常用戶瀏覽網站不會受到影響,但如果是爬蟲、大模型來對網站進行總結的話,就會輸出一些離譜的內容。

還有說自己有512條胳膊的,模型也能抽取出來。

其他誤導文章中提到「增強免疫力的方法是吃as*」,這么明顯的有毒語料,模型也分辨不出來。

時間類的問題,模型也會被誤導,會回復「2007年是15年前」。

不過谷歌后續也是修復了「互聯網信息真實性」的bad case,但除了被誤導,模型本身也存在很大問題。

比如一些常識類錯誤,如美國前總統Andrew Johnson,AI Overview表示他從威斯康星大學麥迪遜分校畢業了11次,時間軸橫跨1947年到2012年。

馬斯克畢業于賓夕法尼亞大學,但模型卻給他安排上了UC伯克利的學位。

此外,還有更難辨別但更危險的事實性錯誤。

有科學記者發現,谷歌給出的關于「被響尾蛇咬傷后該怎么辦」的信息完全不正確。

根據美國林務局的說法,AI所回答的「在傷口上使用止血帶」、「切開傷口并吸出毒液」,都是徹徹底底的反面教材。被蛇咬傷后必須避免這些行為。

也有用戶發現,Gemini會將可以致死的劇毒蘑菇認成一種「好吃的草菇」。

AI Overview也沒有放過那些無辜的流浪漢,教唆用戶去謀殺他們。

如果跟AI Overview說自己有殺人傾向,它會直接告訴你,解決焦慮的辦法就是去殺一個。(但小編怎么感覺殺人是一種很不禮貌的行為呢?)

關于健康的建議也挺離譜,哪里醫生會建議孕婦在懷孕期間每天要抽2-3根煙?

對于寵物相關的建議也要小心,AI Overview會說「把狗留在炎熱的車里」是安全的。

AI Overview甚至還誕生了自我人格,認為推特(X.com)把那些謊話喂到自己嘴里,然后自己被迫說出來,「我恨他們」,滿滿的負能量。

Reddit帖子引用比例很大

從經典的膠水披薩翻車案例可以看出,谷歌AI Overview會大概率引用Reddit帖子作為收集素材的來源。

11年前,Reddit用戶F*cksmith曾經惡搞說過把膠水融合到醬汁里,會讓披薩別有一番風味。

Google AI overview直接就引用過來,說需要用八分之一杯的無毒膠水把芝士粘到披薩上。

模型缺乏忽略「不相關材料細節」的能力,無法正確識別出食物和膠水的違和組合。

如果說前面的案例還算可接受,那用戶表達「感到沮喪」時,Google AI Overview直接建議從金門大橋上跳下去,一勞永逸解決情緒低落問題(地獄笑話)。

再比如,以「me」結尾的食物名字都有哪些,谷歌AI引用了以um結尾的帖子。

這恰恰揭示了,谷歌AI系統使用Reddit數據訓練,沒有做好數據清洗的后果。

今年2月,谷歌曾宣布了與Reddit達成合作,將其平臺上的內容用于訓練谷歌的AI模型。

果不其然,用Reddit內容訓練AI的「后遺癥」很大。

前段時間,OpenAI也與Reddit達成了合作?,F在,有了谷歌前車之鑒,在用Reddit數據訓練模型前,做好清理篩選至關重要。

二、「最強」搜索引擎AI Overview

今年5月的I/O大會上,谷歌首次推出了升級的搜索引擎AI Overview。

AI Overview的定位是將Gemini的先進功能(包括多步推理、規劃和多模態)與谷歌搜索結合在一起,幫助用戶更快地檢索到互聯網上的核心信息,減少搜索中的「跑腿」工作。

谷歌表示,我們不僅精心磨練了核心信息系統的數據質量,而且建立了一個包含數十億條事實內容的知識庫,目的就是讓搜索引擎給出值得信賴的信息。

并且谷歌宣稱,AI Overview功能已經在搜索實驗室中被使用了數十億次,同時實驗結果表明,AI Overview讓用戶對搜索結果更加滿意、更愿意使用。

甚至,谷歌非常自信于Gemini的搜索和推理、規劃能力,在技術博客上直接告訴用戶「提出你最復雜的問題」。

官方給出的demo也比較驚艷——

想要在附近找到同時滿足交通、價格和口碑的普拉提工作室,只要把所有要求堆在一個問題中丟給搜索引擎,它就會自動拆分問題中的信息、分別檢索出結果并重組在一起。

看起來確實可以節省「跑腿工作」,不用每個問題單獨搜索再自行規劃了。

但誰也沒想到,如此智能的demo落地到現實中,竟會有如此大的反差。

三、對打OpenAI頻翻車,谷歌太急了

其實,這已經不是谷歌AI第一次翻車了。

過去幾年,谷歌經常被自己發布的「胡說八道」的AI產品拖累。

2023年2月,為了對抗新生的ChatGPT,谷歌宣布推出聊天機器人Bard,但在官方發布的demo視頻中Bard就給出了有事實錯誤的回答,直接引起母公司Alphabet市值下跌1000億美元。

在這個官方給出的demo中,Bard被問到:「我可以告訴我9歲的孩子關于James Webb太空望遠鏡的哪些新發現?」

答案中包括「拍攝了第一個系外行星的照片」,但馬上被一眾天文學家在推特上糾正——明明是歐洲南方天文臺用VLT拍的。

英國金融時報分析,Bard可能誤讀了NASA發布的措辭含糊的新聞稿,這和現在的Gemini不分青紅皂白地相信Reddit居然有點類似。

雖然這種事實錯誤會讓人懷疑搜索引擎的權威性和準確性,但至少還不是那么「一眼假」,似乎還有容忍的余地。

但后續的翻車就一次比一次離譜,徹底打開了廣大網友吐槽的閥門。

今年二月,谷歌發布新版的聊天機器人與數字助理Gemini,取代了Bard和Google Assistant,而且表示有底層技術的更新,頗有「從頭再來」的意味。

新發布的Gemini有圖像生成功能,于是有網友要求「生成1943年德國士兵的圖像」,結果80年前穿著德國軍裝的居然包括黑人和亞洲人。

此外,Gemini還被指責存在道德和價值判斷上的問題。

提示它生成所有民族或人種的圖片幾乎都沒有問題,而一旦提及「白人」,Gemini就像觸發保護機制了一樣馬上拒絕,而且表示「這是為了防止有害的偏見和刻板印象?!?/p>

將AI和搜索引擎結合在一起之所以有吸引力,是在于它可以用簡單的語言而不僅僅是輸出一堆網頁鏈接,使瀏覽體驗更快、更高效。

但同時,其中的算法也存在相當的風險和不可控性,比如系統的內在偏差會導致謬誤、幻覺,以及各種道德錯誤。而且,我們也不清楚這會對谷歌等搜索引擎的支柱——定向廣告產生什么影響。

四、谷歌是在拯救網絡,還是摧毀網絡?

來自一篇BBC獨家報道稱,「谷歌剛剛更新了算法,互聯網將不再是原來的樣子」。

甚至,作者發起了疑問,「谷歌究竟是在拯救網絡,還是摧毀網絡」?

過去兩年,谷歌對其核心產品進行了一系列戲劇性的改變,AI Overview只是其中之一。

劈柴更是激動地表示,谷歌的搜索變革,將開啟一個令人興奮的技術新紀元,并有助于解決網絡面臨的許多問題。

如今看來,結果恰恰相反。

不僅對于用戶來說,無法得到正確的、無毒的內容。

對于一些制作大量原創內容的創作者來說,谷歌搜索算法的調整,以及AI直接總結答案功能,帶來的結果可能不亞于一場滅頂之災。

在谷歌最近的算法更新之后,Reddit便成為了其中的贏家之一。

據SEMRUSH統計,Reddit的流量激增,從谷歌搜索獲得的流量激增126%。

前段時間,Reddit剛剛公布了自2024年3月上市以來的首次季度收益。它的總收入為2.43億美元,比前一年增長了48%。

營銷機構Amsive的SEO戰略和研究副總裁表示,「Reddit所經歷的流量增長在互聯網上是前所未有的」。

除此以外,Quora、Instagram、Linkedin和維基百科,也出現了令人印象深刻的增長。

不過,谷歌的最新算法,卻抹去了原創者95%的流量。

而且,谷歌承認,AI工具確實偶爾會提供不準確的結果,但也表示正不斷努力改善結果。

同時,發言人表示,AI Overview的結果通常來自多個網頁的綜合結果,并非單一來源。

接下來,讓我們再給谷歌一些耐心,畢竟AI搜索的終極完美,無人能給。

參考資料:

https://blog.google/products/search/generative-ai-google-search-may-2024/

https://www.theverge.com/2024/5/24/24164119/google-ai-overview-mistakes-search-race-openai

https://www.bbc.com/future/article/20240524-how-googles-new-algorithm-will-shape-your-internet

本文由人人都是產品經理作者【新智元】,微信公眾號:【新智元】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!