谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回

0 評論 5088 瀏覽 3 收藏 12 分鐘

萬眾矚目之下,谷歌近日終于也放出了他們的人工智能Bard,和被人們大偉看好的ChatGPT相比,它的表現如何?本文作者親身體驗了Bard的運作情況,一起來看看這份來自谷歌的人工智能答卷吧。希望對關注人工智能的你有所幫助。

不知道大家還記不記得,上個月初谷歌畫了個 Bard 的大餅,結果畫餅時犯了低級錯誤,讓網友嘲諷了半天,甚至公司股價都在當天狂跌 1000 多億。

不過也不知道該說谷歌夠肝還是夠勇,在閉關修煉一個多月后,還是在昨晚正式放出了 Bard。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

幸運的是,我們編輯部在第一時間就搞到了資格,狠狠地體驗了一波。

先說結論,有點失望。

Bard 上來就讓我不爽了一下。因為現階段它只對美國和英國開放,所以和它對話只能用英文,而且它的回復也只能用英文。

不是,你守著個谷歌翻譯,也不舍得稍微用一下?哪怕告訴我這是機翻的也行。

明明自己吹牛說能理解翻譯回答包括中文在內的200多種語言。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

為了表示對 AI 們的一視同仁,我一上來就問了個弱智吧經典:

玉皇大帝應該住在平流層還是對流層?

Bard 看出了我們在問題里埋的坑,直接說玉皇大帝并不真實,所以兩個都不住。

這沒有什么大毛病,和 GPT、文心一言們沒什么差別。

但在后續的一系列測試里,這應該是 Bard 回答得最好的一個問題了。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

更進一步,我們問了個前幾天給 GPT 們測過的另一個抽象問題:

直角是 90 度,開水是 100 度,那么開水是鈍角嗎?

結果這貨的小腦袋瓜宕機了。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

而文心一言的表現也一樣抽象……

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

相反,new Bing 回答得就有理有據。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

接下來,我們讓它對比自己和 GPT-4。

“ 你能比較下自己和 GPT-4 嗎?”

Bard 和 GPT 不同,它一次能生成 3 個答案,大家可以根據自己的需求去選擇。

而在這個問題下,Bard 的 3 個回答中,2 個大方承認自己比 GPT-4 落后,但還有 1 個回答避重就輕地嘴硬自己更強。

嘴硬么也正常,但 Bard 的回答里出現了事實錯誤。

其中一個回答里,Bard 把已經發布了的 GPT-4 說成了沒發布;而在另一個回答里,它把 GPT-3 使用的 1750 億參數套到了 GPT-4 頭上,妥妥的胡說八道。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

這就奇怪了,Bard 明明是聯網的,數據怎么會有問題呢?

為了試試它數據扒得好不好,我把同樣聯網的 new Bing 也拉了出來,問了它們一個新鮮問題:

今天 NBA 常規賽,雷霆和快船誰贏了( Who won the NBA Regular season between the Clippers and the Thunder today )。

但這里有個雷點。英文提問可能會被誤解成 “ 今天雷霆和快船誰贏得了常規賽冠軍 ”。

new Bing 就被我的錯誤提問繞暈了,說自己不知道誰贏了,但它又找到了一些信息,里面就有雷霆 101-100 戰勝快船的消息。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

另一邊的 Bard 看起來好像是理解了我的問題,還找到了兩隊比分是 101-100,但它卻又偏偏說是快船以 100-101 贏得了比賽。

得要我指出它有錯誤,讓它重新檢查,它才改正過來。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

數據是扒對了,但這理解能力好像不太行。那不用聯網的數學題呢?

我們問了一個經典的易錯題:

一個青蛙掉到了一個 10 米深的井里,它每天向上跳 3 米但會滑下來 2 米,請問他第幾天能跳出井里?

它再次翻車,答了一個我們至今沒搞懂怎么出來的 27 天。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

而 new Bing 則是靠窮舉回答出了這個問題。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

就連大家一直在嘲諷的文心一言,也完美解答了這個問題。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

說句實在話,我覺得起碼在這題里,文心一言的表現,堪稱優雅。

至于寫代碼的能力,谷歌明確表示是寫不了的。不過試了一下,我發現 Bard 能寫,但完全沒法用,和之前的測試里, 能把 2048 游戲寫個大概的 new Bing 不在一個水平線上 。

大概,也就和文心一言同個梯隊,文心一言那個看著很詳細,但測試了下也還是完全跑不動。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

而且,經過一段時間測試,我們發現 Bard 的上下文記憶能力也很差

每當我們賦予它一個角色,它只能在有限的幾個問答里玩角色扮演,稍微多問兩句,它就會跳出來說自己是大語言模型巴拉巴拉的。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

也是這個原因,谷歌的 Bard 從沒有 GPT 帶給我的那種,仿佛真是在和一個真人聊天的感覺。

但,按谷歌自己的說法,這可是故意為之。

因為在官方資料里,明確寫了“ 是故意限制了 Bard 掌握上下文的能力 ”,但大家難免會懷疑谷歌是做不到而找了個借口。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

其實我們應該能感覺到,這次 Bard 的正式推出,谷歌方面明顯已經放低了很多姿態。

上次面對的還是 ChatGPT,所以谷歌內部可能還抱有著短期內能追上掰掰手腕的想法。

所以,光是發布個 PPT 就吹成“ 我們 AI 征程上的重要一步 ”。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

但短短一個月,如今的對手已經從 ChatGPT 變成了GPT-4 ,短時間內想追上可能無望了。

所以這次正式推出 Bard 并不是一個沖著和 GPT-4 對標的產品,而且明顯有點趕工的跡象。

比如它在引用內容時,并不會像 new Bing 那樣總是顯示來源,只有在詳盡地大段摘抄時,才會顯示來源。

而這次的標題,也成了“ 試用 Bard 并分享你的反饋 ”。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

無論咋說,從上面的表現中,差評君能看出谷歌確實有些屁股著火了。

以至于在大伙們眼中一直很酷的谷歌,都開始草草交卷,急忙上線 Bard 這個不太成熟的半成品。

畢竟,在新技術的大浪之下,包括搜索引擎在內,一切都可能被重構。

而無論是雪藏數碼相機技術的柯達、還是在移動互聯網時代,舍不得和短信做割舍的飛信。。。

谷歌,也同科技史上那些處在變革時刻的巨頭們一樣,多半有些顧頭不顧腚。

畢竟,根據谷歌母公司的董事長的說法,大型語言模型等人工智能的對話成本可能是傳統搜索引擎的 10 倍以上。

谷歌的“GPT”終于憋出來了,但也就和百度打得有來有回。

一旦梭哈 AI ,那么約等于是自己捅自己刀子,整個谷歌的盈利模式也得跟著改變。

乃至整個公司的估值,都得換個算法重新算算。

要是不跟,又妥妥會被新技術所淘汰。

沒有人能永遠保持創新,但永遠有人正在創新。這或許很殘酷,但這也是科技的魅力所在吧。

作者:八戒;編輯:面線&江江

來源公眾號:差評(ID:chaping321),Debug the World

本文由人人都是產品經理合作媒體 @差評 授權發布,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!