這么好玩的ChatGPT,不會只是拿來玩的吧?

0 評論 2585 瀏覽 4 收藏 15 分鐘

OpenAI在12月1日發布了NLP(自然語言識別)新模型ChatGPT,其免費公測版本的服務器很快被熱情的測試用戶擠爆了,業內人士認為這將是對NLP以及人工智能領域有重要意義的一款模型。ChatGPT到底有多厲害?它是怎么發展的?本篇文章將一一分析。

OpenAI在12月1日發布的NLP(自然語言識別)新模型ChatGPT,剛剛與廣大網友度過了一個愉快而又有意義的周末。

該模型是OpenAI在2020年推出的NLP預訓練模型——GPT-3的衍生產品。在此之前,一直有預測OpenAI將在今年底或明年初推出GPT-4,雖然本次放出的ChatGPT被稱為GPT-3.5,而不是GPT-4,但業內人士同樣認為這將是對NLP以及人工智能領域有重要意義的一款模型。

ChatGPT一經發布就被OpenAI掛到官網上,接受廣大網友的“檢測”。 免費公測版本的服務器很快被熱情的測試用戶擠爆了。

一時間,針對ChatGPT的調戲、探討、詢問、閑聊貼刷屏了Twitter和朋友圈。周末沒有跟蹤ChatGPT新聞的“紐約時報”甚至遭到了已離開OpenAI的創始人馬斯克發推奚落。

這么好玩的ChatGPT,不會只是拿來玩的吧?

TED負責人Chris對紐約時報沒有報道ChatGPT表示震驚,馬斯克也在下面奚落紐約時報應該改名叫“社會正義時報”

一、ChatGPT有多厲害?

GPT-3目前的能力已經接近人類,甚至超過人類了。

ChatGPT模型看起來比以往的人機對話模型更強大,例如,其敢于質疑不正確的前提和假設、主動承認錯誤以及一些無法回答的問題、主動拒絕不合理的問題、提升了對用戶意圖的理解以及結果的準確性。與之前的GPT3不同,相比于此前海量學習數據進行訓練,ChatGPT中,人對結果的反饋成為了AI學習過程中的一部分。

這么好玩的ChatGPT,不會只是拿來玩的吧?

馬斯克發推稱:ChatGPT厲害的嚇人,我們距離危險而強大的AI不遠了。

ChatGPT 使用監督微調訓練了一個初始模型:人類 AI 訓練員提供對話,他們在對話中扮演雙方——用戶和 AI 助手,AI 訓練員可以訪問模型編寫的對話回復,以幫助 AI 調整回復內容。

為了創建強化學習的獎勵模型,該研究需要收集比較數據,其中包含兩個或多個按質量排序的模型回復。該研究收集了 AI 訓練員與聊天機器人的對話,并隨機選擇一條模型編寫的消息,抽取幾個備選回復,讓 AI 訓練員對這些回復進行排名。此外,該研究還使用近端策略優化算法(PPO)微調模型,并對整個過程進行了數次迭代。

目前已經有網友嘗試讓ChatGPT參加美國高考;誘騙ChatGPT規劃如何毀滅世界;甚至讓ChatGPT扮演OpenAI,在系統內構建ChatGPT套娃。

這么好玩的ChatGPT,不會只是拿來玩的吧?

這么好玩的ChatGPT,不會只是拿來玩的吧?

這么好玩的ChatGPT,不會只是拿來玩的吧?

這么好玩的ChatGPT,不會只是拿來玩的吧?

這么好玩的ChatGPT,不會只是拿來玩的吧?

ChatGPT在網友的引導下創作的小說

更多新功能還在持續等待網友開發中……

二、這么好玩的東西不會只是拿來玩的吧?

在網友排隊“調戲”AI的同時,ChatGPT商業落地問題亦成為產業界關心的話題。

ChatGPT或將衍生出一批強大的NLP商業應用。一位人工智能行業專家告訴虎嗅,通用大模型的普及預計會在3-5年內實現,人工智能將很快替代簡單重復勞動,甚至是一些流程性的技術崗位,比如翻譯、新聞簡訊編輯等。通用大模型很可能會在短時間內改變現在生產和生活的很多方式,大量基礎性的工作流程會被基于大模型的智能應用滲透甚至取代。

那么代表著最新AI訓練趨勢的ChatGPT,在商業化方面有可能面臨哪些挑戰呢?

多位業內人士向虎嗅證實,今天的ChatGPT距離實際落地還有一段距離。其中最為核心的問題,在于模型的準確性和部署成本。

首先,ChatGPT的回答并不能保證準確性,這對需要準確回答具體問題的商業應用來說是致命傷。這也是ChatGPT要在C端大規模推廣,所需要面臨的挑戰。一些業內人士擔心,如果AI輸出虛假信息的速度太快,可能會在互聯網中淹沒真實信息,甚至對整個社會產生誤導。

這樣的擔心不無道理,也并非沒有先例。Meta早些時候推出的一款大型科學預言模型Galactica,就因為回答問題過于“放飛自我”,在網上輸出了大量憑空捏造的虛假內容,僅上線三天就匆匆下架了。

ChatGPT也并不能避免這個問題,OpenAI的科學家John Schulman在此前接受采訪時曾表示,他們在解決AI編造事實的問題上取得了一些進展,但還遠遠不夠。

商業化考慮的另一個問題就是經濟性。ChatGPT目前尚處在免費的測試階段,眼前最接近實際的應用場景是搜索引擎優化、營銷媒體內容創作輔助和開發者編程。

由于,ChatGPT現在還處在一個優化迭代的階段,目前開放的公測應該也是希望搜集大眾使用的反饋對模型持續改進。OpenAI首席執行官Sam Altman曾提到過,OpenAI未來的重點更新功能之一,是對ChatGPT生成的內容提供Citation。

GPT-3參數量達到1750億,在2020年6月發布之后, OpenAI開始嘗試對GPT-3進行商業化。目前OpenAI以API的形式向開發者客戶有償提供GPT-3模型,并根據token使用量來收費。其客戶包括傳媒、營銷等多個領域,基于GPT-3產生的App達300多個。

這么好玩的ChatGPT,不會只是拿來玩的吧?

這么好玩的ChatGPT,不會只是拿來玩的吧?

從OpenAI官網公布的API價格來看,收集莎士比亞作品集的價格在48-24000美元不等

訓練階段的沉沒成本過高,也導致人工智能應用早期很難從商業角度量化價值,也就是算不好“經濟賬”。隨著算力的不斷提高、場景的增多、翻倍的成本和能耗,將成為橫梗在所有公司面前的問題。盡管OpenAI的估值目前為200億美元,但此前亦有觀點認為OpenAI應該是一家萬億估值的公司,而這家公司目前階段主要產品和技術仍停留在實驗階段。

盡管很多小規模的預訓練模型在今天的人機對話領域已經有很多成功的商業應用,但像ChatGPT這樣大規模的模型,在To B領域中部署的難度很高,部署速度慢、成本高,商業價值也不明確,因此僅能停留在搜索、文化、娛樂等應用領域。

容聯云AI科學院院長劉杰對虎嗅表示,To B行業對人工智能要求更嚴肅、嚴謹,目前的人機對話內容主要集中在客服、外呼、營銷等領域,需要有針對的模型庫,利用BERT(預訓練的語言表征模型)基礎上的UniLM框架等規模小一些的模型進行快速訓練。

劉杰認為,包括ChatGPT在內的NLP,在商業化上還處在一個螺旋上升的階段,未來應用場景很廣,但當下技術和商業模式還需要盡快找到一個“共振”的頻率。

不過,也有很多人認為ChatGPT未來的應用領域未必局限在人機對話,可能會擴展到更多應用領域,例如程序問題的識別和搜索引擎等。只是不論是哪一點,其都無法避免那些商業化的難題。

三、依托云廠商生長

數據是一切AI算法、AI模型的原料。

依附于云廠商,顯然是一種聰明的做法,原料越豐富,做出來的菜色更多樣。

2019年,OpenAI收到來自微軟的10億美元投資,此后一直與微軟保持緊密合作。ChatGPT和GPT 3.5的訓練也都是基于微軟的Azure AI的超算基礎設施完成的。

憑借著大規模通用AI模型在實際應用中對算力的需求,Azure AI可以利用ChatGPT秀一波肌肉。

去年11月,微軟宣布,OpenAI的GPT-3將通過新的Azure OpenAI服務提供給開發人員。大幅加強了微軟在NLP方面的技術能力。OpenAI的直接競爭對手DeepMind則在2014年被谷歌母公司Alphabet收購。谷歌和DeepMind合作的主要項目之一,是后者開發的人工智能推薦系統,這也大大提高了谷歌數據中心的效率。

微軟和谷歌在與頂級人工智能研究實驗室的合作中收獲頗豐,而在這方面亞馬遜的AWS可能已經落后于另外兩家云業務不那么出眾的競爭對手。Gartner于2021年3月發布的關于云人工智能的Magic Quadrant報告發現,AWS遠遠落后于微軟、谷歌和IBM等競爭對手。

不過,在人工智能研究方面,AWS在2017年也推出了自己的機器學習解決方案實驗室,提供機器學習專業知識,用于識別和構建識別AWS客戶端的機器學習解決方案。在今年9月還推出了一款據說在機器學習任務上表現優于GPT-3的seq2seq模型AlexaTM 20B。

四、人工智能發展的瓶頸

一位在人工智能領域耕耘多年的業內人士告訴虎嗅,人工智能領域一直以來面臨的瓶頸是建立在基礎理論之上的,對于算法和架構的突破——大家習慣了用筷子夾丸子,但有沒有想過,可能用簽子串,效率更高。90年代末期,正在攻讀博士的他就經歷了一次AI的浪潮,過去40年,發生在AI產業上有三次浪潮,每一次都是由于理論發展的瓶頸最終退潮。

另一個瓶頸是倫理道德。一提到人工智能的倫理道德問題,多數人會想到自動駕駛定責等嚴重的問題,一位人工智能領域投資人向虎嗅指出,如今自動駕駛的技術走在了法律法規的前面。而如今,隨著生成式AI的逐步成熟,AIGC的版權以及AI的價值觀問題都成了制約人工智能發展的大問題。

在人類與AI交流的過程中,AI如何學習,能否輸出正確的價值觀?

大規模訓練部分取決于數據的質量,AI無法主觀判斷什么是正確的,所以AI很容易“學壞”。雖然ChatGPT在“防騙”方面有了很大進步,但它仍然會在“不懷好意”的圍觀群眾誘導下表達出一些不那么“政治正確”的觀點,這可能會是通用AI模型商業化的阻力之一。

作者:齊健;編輯:陳伊凡;出品:虎嗅科技組

來源公眾號:虎嗅APP(ID:huxiu_com),從思考,到創造

本文由人人都是產品經理合作媒體 @虎嗅 授權發布,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!