別讓ChatGPT跑了

0 評論 5431 瀏覽 7 收藏 16 分鐘

ChatGPT的出現引發了互聯網圈的熱烈討論,而隨著時間的流逝,不少人開始猜測ChatGPT是會走向沉寂,還是掀起更大AI浪潮。但不管如何,ChatGPT的出現已經一定程度上預示了我們,如果想在AI浪潮中搶占先機,我們需要抓緊當下的機遇和挑戰。

一、ChatGPT 只是另一場AI噱頭嗎?

明面上,ChatGPT的熱度在最近降了下來,這實在是符合許多唱衰AI產業的人一貫的論調——就像擊敗國際象棋冠軍的深藍、國際圍棋冠軍的AlphaGo一樣,爆紅的AI工具總是最終歸于平靜。

因為這些炫酷的工具往往有一個無法回避的問題:商業化的前景在哪里?

從使用場景上說,除了專業棋手,沒有人會需要每天和機器人對弈,而ChatGPT作為一個吸收了無數語言材料,光是模型參數就有一千七百多億的大模型,目前最適用場景似乎只有完成學術論文中內容梗概撰寫和統一注釋格式,以及幫助論文作者規避查重風險。說實話,ChatGPT在這方面完成的不錯,幾乎成了留學生中的不傳之秘,以至于有華裔學生專門寫了一個名為GPTZero的app負責辨認作業中ChatGPT生成的內容。

但也僅此而已。從成本角度說,動輒數千萬美元的開發和部署成本讓外界有了堅定看衰它的理由,這個所謂智能聊天工具實在太過昂貴,更何況它最讓人驚艷的那部分:對人類語言和對話邏輯的理解,對回答內容的“生成式”創作,都隨著越來越多的“翻車”實例而迅速“祛魅”。那些認為它將取代搜索引擎、顛覆智能語音助手的樂觀論調正在消失。

ChatGPT在大眾視角中似乎即將走上過往那些AI工具的老路,流星一樣炫目,然后歸于沉寂。

但,真的僅此而已嗎?

二、第一個造出飛機的人

Sheng談到ChatGPT時充滿了一種興奮和緊張混合的口吻,他是在清華從事預訓練大模型研究的博士生。

“就在兩年前,要不要走預訓練大模型的方向,整個學界還在討論中?!盨heng說到,而原因正是上面提到的,大模型一次的訓練成本實在太過高昂,能得到什么結果也是未定之數,很少有人愿意冒險。國內相關方向的玩家一度傾向使用大小模型協同配合的方法提高AI工具效果,因為傳統觀點認為,在規模相對較小的模型上進行訓練,效果并不一定比大模型差。

而不止一位AI方向的從業者也表示,過去業內對人工標記數據的重視也遠遠不夠,大家沒料到ChatGPT采用的基于人類反饋的強化學習效果會如此之好。

直到OpenAI推出了ChatGPT。

“有多少人工,就有多少智能?!边@是人工智能領域經常被拿來調侃的一句話,用來形容ChatGPT再合適不過。作為預訓練大模型,它很好的體現了“大”這個字。一方面,相比GPT1,GPT3的參數規模提升了將近1500倍。另一方面,由于運用了所謂的“自監督學習(self-supervised learning)”機制,模型可以使用互聯網上海量的文本數據進行訓練。

這種級別的大模型是前所未見的。

“最近的研究告訴我們,當模型達到一定規模后,會有 emergent ability(突現能力)的東西出現?!盨heng說到。

某種程度上講,ChatGPT 的開發者 OpenAI 也是在賭博,沒有人知道這條路究竟能不能走通,而正是它們持之以恒不惜血本的投入,最終證明了預訓練大模型擁有一般模型所不具備的認知理解能力和泛化能力。換而言之,預訓練大模型和人們理想中的AI“通用模型”非常相似。

不像是AlphaGo專門針對圍棋度身定做,ChatGPT不是針對一個特定的狹窄領域問題開發出來的AI工具,相反,它可能更像某種尚顯稚嫩的通用AI計算模型,有回答開放問題的能力,顯示出可被靈活部署應用在各種領域的潛力。

這正是ChatGPT重要的原因,它向人們展示了預訓練大模型的強大威力。這意味著第三次AI浪潮在經過十多年的發展后,走到一個關鍵節點。

“ChatGPT / GPT-3.5 是一種劃時代的產物,它與之前常見的語言模型幾乎是導彈與弓箭的區別,一定要引起最高程度的重視?!币黄噲D幫助開源社區復現GPT3.5技術路線圖的文章在開篇就嚴肅指出了這一點。(https://zhuanlan.zhihu.com/p/593519656)

Sheng則把ChatGPT的誕生比作萊特兄弟發明飛機:“大家都知道飛機理論上是可以做出來的,但從來沒人真的見過飛機。ChatGPT就像是有人突然把飛機擺到你面前,雖然它可能只能飛100公尺,很容易有故障,但它出現了?!?/p>

三、Bigger than bigger,大模型的潛力還有多少?

同ChatGPT揭示的AI發展浪潮中的關鍵節點的意義相比,ChatGPT本身的缺陷和孱弱的商業化前景都顯得渺小了不少。更何況,對許多從業者來說,ChatGPT暴露出來的缺點并非不可解決。

其中一個為許多人指摘的是所謂數據庫時限問題。ChatGPT訓練是基于一個固定的數據庫,截止日期是2021年9月,也就是說ChatGPT無法掌握從那以后世界上發生的任何事的信息,從iPhone 14的發布到美國期中選舉,甚至今天的天氣狀況都不行,在這個方面,ChatGPT的表現甚至趕不上時下任何一款智能語音助手。

但從技術層面這個問題并不難解決。實際上,根據外媒爆料,和Open AI 達成戰略合作關系的微軟即將在3月推出具有AI對話能力的新版必應Bing,它的原理正是將搜索引擎同ChatGPT的能力相結合,甚至,微軟還打算在Office 套件中引入相應的能力。

最為引人關注的成本問題,在算法層面同樣有許多優化迭代的思路。比如,既然ChatGPT在回答問題過程中通過專門的針對訓練很好展示了機器模擬人行為的能力,那么在算法層面,讓ChatGPT通過模仿人查閱資訊的方式,在涉及純粹知識和信息的問題時不再調用本身數據庫而是直接從網絡抓取內容將是非常值得探索的方向。如此一來,大模型可以在不降低自身表現的情況下縮小規模,訓練成本也將隨之降低。

至于商業化落地場景,除了已經比較確定的文本生成、智能助手領域外,實事求是的說,還有大片的荒蕪地帶亟待開發,但不少從業者都表示了樂觀。

“難的是從0到1的原始創新,至于后面的都不是問題?!币晃还┞氂诖髲S的AI研究從業者說道,“尤其在中國,市場這么大,大家又這么卷,既然大模型的路子被證明是可行的,那么很快所有的聰明人都會加入進來?!盨heng同樣預計,短則一兩年,就會出現基于預訓練大模型的商業化產品。

四、必須攀登的山峰

事實上,今年在投資領域,AI是少有的異軍突起的熱門賽道。然而成本像一道緊箍咒,束縛著每個自身不具有預訓練大模型開發能力的玩家。

ChatGPT這樣級別的預訓練大模型跑一次的成本是千萬美元級別,而將其商業化部署,落地到類似聊天機器人這樣多用戶高并發任務中,成本只會更高。小冰CEO李笛給出的一個估計數字是3億每天。這也就意味著,國內夠資格玩這場燒錢游戲的只能是極個別組織,大部分的初創企業,乃至許多高校,都會被這樣的高昂成本“勸退”。

Sun 是來自一家國內一線投資機構的投資經理,在看過無數AI相關項目的PPT后,他今年一次都沒有出手:“商業化項目是很現實的,你是不是掌握了核心技術?你的競爭壁壘又有多高?”

很少有中國企業能夠回應這樣的詰問。

在這種情況下,想要讓產品具有AI能力,只能調用公開的大模型接口(比如GPT3.0),等于讓自己的核心能力掌握在別人手中。

一個非常殘酷的例子是Jasper.AI。文本生成領域估值一度高達15億的Jasper.AI同樣在底層調用GPT3.0模型,在ChatGPT 幾乎是沒有預警的橫空出世后,Jasper的業務立刻受到沖擊(這個故事被the information 寫成了一篇報道 ),因為Jasper 的收費計劃最便宜的也高達29美元,且只能生成20000個單詞,相比之下,ChatGPT的使用成本簡直可以忽略不計,而交互和效果甚至更好。

更何況,OpenAI本身也面臨著經營壓力。從OpenAI內部傳出的消息說,預訓練大模型的成本之高,OpenAI同樣也叫苦連天,從GPT3.0后OpenAI的模型不再開源,而是力推其訂閱付費服務(Jasper即是向OpenAI繳納一定的費用從而獲得GPT調用接口)。

開發屬于自己的大模型,顯然是每個在AI領域有野心的企業所應該做的事。

國外們的巨頭行動很快,除了OpenAI,提出transformer模型的Google同樣擁有專門針對對話應用的大語言模型LaMDA和多模態任務模型MUM,這兩個模型被認為與ChatGPT擁有相同的能力。而在硅谷,像Perplexity、YouChat這樣的創業公司也正在大預言模型的基礎上開發新的聊天機器人。OpenAI也預示了GPT4.0的存在,從版本號上就能看出,屆時這個業界領先的大語言模型將有進一步的能力提升。

因此對中國來說,時不我待,預訓練大模型是一塊必須啃下來的硬骨頭,中國絕不能錯過這場AI“軍備競賽”。不僅因為一味模仿或者尋求開源模型接口支持,等于讓別人始終掌握掐脖子的科技主動權,同時也將在未來的AI產業競爭中處于不利地位。

Sun舉了個或許不太貼切的例子:質能方程在1905年就由愛因斯坦提出,原子彈在40年后的1945年由美國人試爆成功,而新中國為了掌握這項技術,又花了近20年時間。

一日千里的AI技術發展不會給中國這么長的追趕時間。

好消息是,AI技術并不像芯片制造一樣有著高不可攀的技術壁壘,盡管沒有公布ChatGPT的論文,但不止一位AI工程師表示,僅靠現在公開的知識,頂級AI工程團隊很大概率就能復現和ChatGPT差不多的模型,因為“技術本身都是現成的?!?/p>

壞消息則是,留給我們的時間已經不多。

如果說ChatGPT誕生來自巨量資金的投入、充分的技術和人才儲備,這些條件國內巨頭們尚能夠勉強滿足的話,那么隨著時間推移,如果不在目前這個非常重要的機會窗口期迎頭趕上,算法迭代所累積的經驗將給以OpenAI為代表的AI公司帶來結構性的技術壁壘與代差,這種代際差一旦形成,再想追趕將分外吃力。

雖然機器本質上仍然無法思考或創新,但預訓練大模型“涌現”出的“智能”以及它出色的泛化能力,將使得AI產業本身不再成為一個賽道,而是演變為類似石油、電網一樣的基礎生產力資源,徹底改變整個信息產業的格局。

經過十多年的發展,基于深度學習框架的AI浪潮已經找到了一個明確的發力方向,隨之而來的將會是如同西部掘金大潮一般的熱烈景象,無數機會和突破將涌現出來,想要在這場烈火烹油的AI革命中跟上,我們必須擁有屬于自己的ChatGPT。否則讓它跑太遠,再追就來不及了。

參考資料:

  • ChatGPT進化的秘密 https://zhuanlan.zhihu.com/p/593519656
  • The Best Little Unicorn in Texas: Jasper Was Winning the AI Race—Then ChatGPT Blew Up the Whole Game https://www.theinformation.com/articles/the-best-little-unicorn-in-texas-jasper-was-winning-the-AI-race-then-ChatGPT-blew-up-the-whole-game

作者:Neil Shen

來源公眾號:未來科技力(ID:smartechworld),關注中國未來創新技術產業發展,講好科技創新的中國故事。

本文由人人都是產品經理合作媒體 @品玩 授權發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!