爆火的ChatGPT,先顛覆誰?

2 評論 8994 瀏覽 6 收藏 12 分鐘

新上線的ChatGPT迅速成為了現(xiàn)象級的AI應(yīng)用。它代表了AI技術(shù)怎樣的飛躍進(jìn)步?它的出現(xiàn)又將顛覆現(xiàn)有的哪些應(yīng)用?本文以ChatGPT實際使用案例詳細(xì)分析了這款應(yīng)用的技術(shù)路線,以及它在信息搜索可能引發(fā)的顛覆性影響。希望能給你帶來啟發(fā)。

這兩天,新上線的ChatGPT實在是太火了!首富馬斯克一馬當(dāng)先,帶著大家玩得不亦樂乎,看起來,人工智能的奇點就要到來了!沒玩過的朋友,我也不多作介紹了,自行搜索即可。

爆火的ChatGPT,先顛覆誰?

作為一名二手人工智能從業(yè)者,好多人催我寫寫,人類是不是懸了?當(dāng)然,人家源代碼我沒地看去,看了沒人給講也是一頭霧水,外面那些信息,我看也半真半假。

所以,咱們也不講什么技術(shù)框架,就從實際的使用案例來看看,這款現(xiàn)象級的AI應(yīng)用,采用的是什么樣的技術(shù)路線,能顛覆現(xiàn)有的哪些應(yīng)用。

篇幅有限,今天只聊以下幾個問題:

  • 這次的ChatGPT,為啥一下子這么猛?
  • 這家伙準(zhǔn)備先顛覆誰,是搜索引擎么?
  • AI關(guān)底的圖靈測試,馬上要被KO了么?

一、ChatGPT這次為啥這么猛?

與其前一代相比,ChatGPT的效果太驚艷了!大家體會最深的一點,是機(jī)器人說的“像人話”了。這個像人話,有兩層意思,首先是對一些知識性內(nèi)容的回答準(zhǔn)確率大大提升,這個例子就太多了,咱們隨便貼兩條:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

您看這專業(yè)程度,至少比問我靠譜!它反映了什么技術(shù)進(jìn)展呢?

自然語言處理的大模型,一直有個問題:如果完全無監(jiān)督訓(xùn)練,無法甄別語料的真假和質(zhì)量;這次ChatGPT從回答質(zhì)量上有質(zhì)變,應(yīng)該是對某些高質(zhì)量內(nèi)容做了加權(quán),采用了類似有監(jiān)督訓(xùn)練的方法。從結(jié)果上來看,是相當(dāng)成功的。

最讓我感到驚訝的,是ChatGPT這次在倫理方面給出了諸多令人稱贊的限制,不用說,這肯定也得有點監(jiān)督。除了大家熟悉的“未來預(yù)測類問題不作答”以外,下面這兩個例子的對比,也相當(dāng)出彩:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

除了內(nèi)容,ChatGPT回答的條理性和語言流暢度也特別好?;旧蠒迅鞣矫娴男畔⒕C合成一二三點的模板,頗有點領(lǐng)導(dǎo)講話的派頭。因此,我認(rèn)為在語言生成的結(jié)構(gòu)上,也應(yīng)該是特意選擇了一些高質(zhì)量的嚴(yán)肅帖子,同樣采用某種程度的有監(jiān)督學(xué)習(xí)。

所以您也能看出來,它說話老是脖子沖南臉沖北的老干體,一點兒也不像在論壇里混出來的語言風(fēng)格。

后來有消息說,ChatGPT這回采用了強(qiáng)化學(xué)習(xí)的方案,而強(qiáng)化的具體做法,就是找?guī)讉€人盯著結(jié)果標(biāo)注,這本質(zhì)上跟有監(jiān)督意思也差不多。

二、ChatGPT將首先顛覆誰?

那么,ChatGPT是不是能夠如很多人所期盼的那樣,成為搜索引擎的殺手呢?

熟悉搜索的朋友應(yīng)該了解,搜索查詢分為兩類:信息型搜索(Informational search)和瀏覽型搜索(Navigational search),咱們分別來看看。

信息型搜索,就是要找某個具體的信息或知識,要求當(dāng)然就是準(zhǔn)確、清晰。從清晰性來說,ChatGPT給的這種結(jié)構(gòu)性呈現(xiàn),比傳統(tǒng)搜索引擎強(qiáng)多了!可是從準(zhǔn)確性來說,坦率地說,目前還差點兒,經(jīng)常會有些似是而非回答,關(guān)鍵是——人家還倍兒自信:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

特別是中間那個,給我氣樂了:要這么找富婆,恐怕活不過正月十五!

再來說說瀏覽型搜索,說白了就是用戶給個關(guān)鍵詞用搜搜引擎幫忙逛街呢,這時候不要求信息每條都準(zhǔn)確,但是全面性和實時性很重要。

拿實時性來說,這個模型目前還是做不到準(zhǔn)實時更新的,并且可能因為訓(xùn)練成本相當(dāng)高,目前其信息的橫截面,應(yīng)該還停留在去年的《紐約時報》。

從語言相關(guān)的信息覆蓋度來看,ChatGPT說只有英文語料,中文的問答都是通過機(jī)器翻譯轉(zhuǎn)換成英文進(jìn)行的。這一點也通過實測得到了驗證,如果要用到只有中文語料中才有的背景知識,它基本上回答得是驢唇不對馬嘴的:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

所以,總結(jié)一下:我認(rèn)為ChatGPT對于搜索引擎來說,肯定算是一個重要對手了。只不過,由于用單條回答替代了信息羅列,對準(zhǔn)確性的挑戰(zhàn)相當(dāng)大,目前還是任重道遠(yuǎn);另外,現(xiàn)有的技術(shù)棧看起來還不能支持準(zhǔn)實時的信息索引,這對其實用性限制非常大。

(順便說一下,關(guān)于秦明夜走瓦礫場的事兒,普遍認(rèn)為是被宋江所害,然而金圣嘆認(rèn)為,是花榮出的主意。)

然而,目前的ChatGPT,替代百科、Stackoverflow這種非實時專業(yè)信息社區(qū),前景十分光明。這不,Stackoverflow應(yīng)該已經(jīng)感到了寒意,開始禁止上傳ChatGPT生成的內(nèi)容了。

爆火的ChatGPT,先顛覆誰?

當(dāng)然,對那些情緒性、非專業(yè)性的圖文社交網(wǎng)絡(luò),比如微博、Twitter,這么個說話人五人六、又不知疲倦的機(jī)器人,很可能給整個社區(qū)內(nèi)容生態(tài)帶來巨變,那就不是顛覆了,有可能直接就給干挺了!

三、圖靈測試要被通關(guān)了么?

最后,再說說圖靈測試的事兒。

ChatGPT一出,有群眾驚呼:圖靈測試要被終結(jié)了!我的看法是,這恐怕還是大大言過其實了。

圖靈測試的標(biāo)準(zhǔn),其實遠(yuǎn)超普通人的想象。要想讓計算機(jī)聊一會不露餡兒,關(guān)鍵并不在于寫代碼、問攻略這些專業(yè)問題,而在于人類看起來非常淺近的一些日常聊天。

會聊的人,聊一兩句對方就現(xiàn)原形了。比方說,我問ChatGPT的這兩個問題,您看看它怎么回答的:

爆火的ChatGPT,先顛覆誰?

爆火的ChatGPT,先顛覆誰?

前一個問題,正常的人類回答多半是:“你為啥會關(guān)心1.25億這個奇怪的數(shù)???”

后一個問題,正常的人類回答應(yīng)該是:“這事兒哪能提醒領(lǐng)導(dǎo),多尷尬呀!”

看到這兩個問題的回答,我知道,雖然ChatGPT在理解和表達(dá)上已經(jīng)取得了長足的進(jìn)步,但是一些核心的困難點還是如常,并不容易解決。

當(dāng)然,也沒必要要求人工智能一定要通過圖靈測試,即使通過不了,它潛在的商業(yè)應(yīng)用場景也很多了。只是,客觀地說,在目前的技術(shù)棧和方法體系下,通過圖靈測試,短期內(nèi)我認(rèn)為還看不見希望。

毫無疑問,ChatGPT是人機(jī)自然語言交互的一個重要里程碑,并且已經(jīng)具備了在非實時、專業(yè)性知識領(lǐng)域替代原有社區(qū)和垂直搜索的巨大潛力。

當(dāng)然,客觀地說,就目前的狀態(tài)而言,如果說它就能替代搜索引擎,甚至通過圖靈測試,那無疑是過于樂觀了。

大家不要誤會,我可并不是唱衰ChatGPT!恰恰相反,我覺得這玩意應(yīng)該早點商用,隨著大量用戶反饋的累積,質(zhì)量的提高很可能一日千里,適用的場景也越來越多。只是,就像咱們一開始分析的,如果在大規(guī)模的用戶反饋中甄別高質(zhì)量語料,實行有監(jiān)督的模型進(jìn)化,可能還真是個挑戰(zhàn)!

當(dāng)然,作為一個老碼畜,看到ChatGPT寫的哪些程序,我是為很多碼農(nóng)朋友的未來捏一把汗的。怎么樣,你的后脊梁發(fā)涼了嗎?

作者:北冥乘海生,公眾號:計算廣告(ID:Comp_Ad)

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 最后就有倆問題問得好,一旦涉及到人類那種敏感情緒才能回答的內(nèi)容,機(jī)器就不行了,說白了,現(xiàn)在只是從被動搜索變成了主動搜索,還是冰冷的現(xiàn)成答案,我個人觀點,無法通過圖靈測試

    來自浙江 回復(fù)
    1. 也可能文化差異導(dǎo)致的

      來自天津 回復(fù)