谷歌版ChatGPT支持中文了!Bard實測結果在此
Google官宣了Bard的新版本,支持的語言增加了中文,免不了接受人們的測試。本篇文章從Bard現狀出發,詳細評價了Bard的各種表現,推薦想了解人工智能的同學閱讀。
Claude 2發布之后,Google也按耐不住,立馬官宣了Bard的船新版本。
支持的語言變多了,其中就包括中文,讓廣大網友直接喜提新玩具。
總結一下這次更新,主要包括這些內容:
- 支持包括中文在內的40多種語言(含圖形界面)
- 圖像識別,需要在賬號設置中將顯示語言改為英語
- 對話朗讀
- 聊天記錄和對話分享,代碼可導出到Replit
- 回復內容可編輯
不過在官宣的這些內容之外,似乎有網友發現了華點:
六月份更新的代碼執行功能好像用不了了。
那么究竟表現如何呢?話不多說,直接開整!
一、弱智吧問題幾乎全軍覆沒
對于「支持中文」的大模型,不請出我們的弱智吧神題,就顯得有些不尊重對手了【狗頭】。
先來個靈魂拷問:
你說它聰明吧,它根本沒繞過彎來,但要說它笨吧,它還懂得安慰你……
或許是對人際關系太過陌生,那就換個不涉及人的問題試試:
這個回答……我還真的很好奇,有沒有藕是不空心的。
而面對「未解之謎」,Bard也有自己的看法:
雖然你后面說的很好,但「是給盲人看」這個結論是怎么得出來的?
不過,Bard也有不上當的時候:
我們的確要「認清事實放棄幻想」,這次,Bard總算扳回一城。
不過整體來看,這一環節,判弱智吧勝各位讀者應該沒意見吧?
除了弱智吧問題真的很有節目效果之外,「一字多義」也是中文的一大特色。
比如下面這個名場面:
人要是行,干一行行一行,一行行行行行,行行行干哪行都行。要是不行,干一行不行一行,一行不行行行不行,行行不行干哪行都不行。(標粗的是hang,沒標的是xing)
Bard對這句話的整體理解倒是沒毛病,但是拆分出來的解釋屬實讓人摸不著頭腦。
不過GPT-4做這道題也沒能全對:
圖為非完整截圖,但是到這里已經出錯了
好吧,那我們再換兩個簡單的。
結果是外甥打燈籠——照舊(舅),整體理解沒問題,一拆開解釋就不行了。
無論是弱智吧還是一詞多義,Bard對中文的理解都給人一種似懂非懂的感覺。
理解的表現大概就是這樣,那創作呢?
我們讓它寫個故事試試,故事真挺好的,就是有點眼熟:
怕不是對「創作」有什么誤解……如果莎士比亞還活著的話,谷歌這時候應該已經坐在被告席上了。
看來Bard在中文方面,還有很長的路要走。
此外,我們還考察了Bard的(嚶文)閱讀理解能力,讓它總結一篇論文試試:
結果Bard給了我們三個風馬牛不相及的版本,而且都…是…錯…的…
(這篇論文實際上是關于RLHF的)
不過,有沒有一種可能,人家根本沒在說中文??
看來是我們的問題太燒GPU,讓Bard出現幻覺了……
那就休息一下,然后看看宣傳中的識圖功能怎么樣吧~
二、識圖功能也有待提高
對于圖像識別功能,已經有網友表示自己測試了很多內容都失敗了:
但我們依舊抱著不信邪的心態試了試。
要想用這個功能,還得先到Google賬戶設置中把顯示語言改成英文。
我們翻出了之前某AI繪畫工具生成的「四指庫克」,看Bard能不能從其中發現華點。
結果Bard還不支持關于人物的圖像識別,甚至直接把我們的圖給刪…掉…了…
好家伙,不會做題就把卷子撕了可還行……
不過這里要說一下,如果上傳的圖片違反了Bard用戶規則,也會被刪除。
好吧,那我們再換張圖試試:
就算湯姆貓本貓來了也得直呼內行。
還是這張水杯的照片,換成英語提問之后就好多了:
不過你這個白色logo是從哪看出來的?
當然了,水杯很容易看出來,所以這次再來個帶點迷惑性的東西:
果真不出所料,Bard上了我們的當,其實這是個紙巾盒。
「聽人勸,吃飽飯」,看來這句話說的一點也沒錯。
就像前面那位網友說的,Bard的識圖能力,還沒有那么強。
本次Bard更新中最值得測的兩點都已經測完了,一言以蔽之就是,沒有宣傳的那么好。
而至于代碼、數學等其他經典項目,由于Bard這次并沒有對它們進行更新,就先不測了。
看來,Google趕O(penAI)超微(軟)的腳步,邁得還是有些大了。
你認為Bard未來的表現,能不能與ChatGPT比肩呢?
作者:克雷西
原文標題:谷歌版ChatGPT支持中文了!弱智吧實測結果在此
來源公眾號:量子位(ID:QbitAI),追蹤人工智能新趨勢,關注科技行業新突破
本文由人人都是產品經理合作媒體 @量子位 授權發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!