ChatGPT火了,中國人工智能圈有點上火
幾個月前,人工智能組織OpenAI推出的大模型ChatGPT,驚艷四座。這讓中國人工智能圈“有點上火”。國內業界在迅速反思和行動:我們的差距在哪里?我們將如何正視和改進不足?哪些又是中國從業者的機會?這篇文章詳細分析了ChatGPT,推薦給從事人工智能行業的小伙伴們閱讀。
春節前,人工智能組織OpenAI推出的大模型ChatGPT,在國內業界引起了不小的轟動。
一名AI從業者告訴數智前線,人工智能每五六年都有一波浪潮,上一波AlphaGO讓大家震撼,這一波就是ChatGPT。
但這兩次大家的心態迥然不同,當谷歌的AI下棋戰勝圍棋世界冠軍時,大家當新聞看,但這一次許多人是從消費者的角度來體驗它。一個月里,全世界100萬用戶在使用和體驗它,這是非常顛覆性的體驗。這也是AI第一次大規模的自傳播。
數智前線獲悉,除了感嘆于ChatGPT的驚艷體驗外,國內業界也在迅速反思和行動:我們的差距在哪里?我們將如何正視和改進不足?哪些是中國從業者的機會?
一名從業人士告訴數智前線,ChatGPT出現后,行業重新變得熱鬧而有活力,前幾年青黃不接、垂頭喪氣的局面一掃而空。
01 中美差距究竟有多大
在ChatGPT推出后,一位百度資深人士告訴數智前線,他“沒有興趣”談論ChatGPT,言語之間,五味雜陳。一位人工智能企業創始人稱,面對ChatGPT的驚艷表現,心癢癢也迷茫,失眠了。他坦承,從模型的規模到效果,差距還比較遠。
有人用同樣的問題向國內某廠商的大模型和ChatGPT同時發問,ChatGPT從回答的邏輯性和完整度上都遠超國內大模型,國內大模型的答案帶有明顯的拼湊感,夾雜著不少主題之外的胡編內容。而且,在回復速度上,ChatGPT也領先一截。
從事數字人研發的特看科技CEO樂乘認為,目前全球還沒有能跟ChatGPT抗衡的大模型,業界共識是差距在兩年以上。國內先不談彎道超車,趁早追趕反而是更重要的。
雖然一些人工智能資深人士認為,在ChatGPT所涉及的技術上,中美是“平級”的,但華為諾亞方舟實驗室語音語義首席科學家劉群,在黃大年茶思屋的討論中坦承,中國在技術上還是有差距的。
其中一個是基礎模型本身的差距,雖然我們訓練了很多萬億模型或者是幾千億的模型,但訓練的充分程度,是遠遠不夠的。“我估計到現在為止,沒有哪個模型能吃GPT那么多數據。”
清華大學計算機科學與技術系長聘副教授黃民烈提到,在GPT-3之后,OpenAI所有的模型都沒有開源,但它提供了API調用。在這個過程中,它干了一件事,就是建立起了真實的用戶調用和模型迭代之間的飛輪,它非常重視真實世界數據的調用,以及這些數據對模型的迭代。當然,在此過程中,它也養活了美國一大幫創業公司,建立了一個生態。
“你看我們國內的大模型研究,是A公司訓練了一個,B公司也訓練了一個,打個廣告就完了,模型開源,你愛用不用。至少目前還沒看到一家比較好的公司,把數據和模型的飛輪完整轉起來。所以,我覺得這是我們趕超ChatGPT的難點?!币晃粯I內人士坦言。
除此之外,業界人士都提到了算力問題。由于GPU芯片等問題,在一定程度上,國內算力已被卡脖子了。即使國內頭部公司,從算力上跟谷歌等相比,差距也是比較明顯的。
從數據質量來說,整個互聯網的中文數據質量,相比于英文還是有明顯差距。“我們可能要想辦法,做中英文不同語言之間的數據互補?!庇袠I內人士稱。
此外,幾乎所有受訪人士都提到了OpenAI這家人工智能組織,所體現的純碎創新精神和長期主義?!捌鋵崗脑砗头椒?,他們所做的東西業界都是了解的,倒沒有說什么是美國做得了、我們做不了的?!?/p>
云知聲董事長梁家恩對數智前線說,但像OpenAI和DeepMind,他們可能是業界唯二的兩家機構,無論在創新性、投入、決心,還是在頂尖人才儲備上,都是一如既往堅持的?!拔覀兛吹降氖浅晒?,但里面可能已經有很多失敗的嘗試?!?/p>
有資深AI從業者認為,在看不到前景和沒有明顯效果的階段,OpenAI非常堅定地做了投入,相反國內傾向于在技術出現突破后,快速追隨?!皣鴥却蠹业谝徊较氲氖?,我們現在怎么用起來,但在不能用的時候,人家就在長期投入。”
“這件事其實是值得我們學習的,我們真的需要有足夠多的錢,有這么一幫熱血的人才,能夠在一個方向上這樣持續積累發力,我覺得這是一個非常必要的條件。”黃民烈稱。
最近一段時間,業界也在討論中國企業能否超越。容聯云AI研究院院長劉杰告訴數智前線,圍繞業務,尤其是國內的場景,是有超越機會的。在局部應用中開始超越,這也是業界的共識。
02 對中國人工智能界有何啟發
ChatGPT是一種大模型。在它推出之前,國內外實際上已有不少大模型。相比其他大模型,它有了業界意料之外的突破,也給國內業界帶來啟發。
首先,ChatGPT有一個非常強大的技術底座,也就是InstructGPT模型。但這個模型的論文剛發出來時,沒有引起特別大的反響,大家覺得也就是 OpenAI的一篇論文而已。
梁家恩也告訴數智前線,此前,GPT與BERT模型路線一直在競爭,2018年時BERT模型先贏了,但GPT模型路線一直沒放棄,模型參數和數據規模越做越大,最終結合人工反饋增強學習(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路線。
因此,業內公司正在關注投入更大精力到GPT模型路線上,技術路線交替競爭,在業內是常態。
其次,ChatGPT引入了強化學習機制。容聯云劉杰告訴數智前線,ChatGPT不僅僅像以前的大模型,利用了沒有人工標注的數據去學習,還在新版本上引入了人工標注的數據,通過人類的反饋,有針對性地進行優化?!斑@是ChatGPT一個重要的進展,給了我們很大的啟發。”
“這是它核心的一點?!比A為終端云服務搜索與地圖BU總裁趙世奇稱,“今天,我們的模型越來越大,它就像一股洪荒之力,有人會害怕未來它會不會控制人類?
但引入了這種強化學習機制后,就相當于給洪荒之力一個引導,讓大模型的產出朝著可控的方向走,生成符合預期的結果。”比如,你去問它一些倫理安全的敏感話題,它都能答得很好。
這里的難度是建立怎樣的強化學習機制。此前,在下圍棋的AI中,強化學習是用勝負做反饋。但對于ChatGPT如此開放的系統,是沒有明確的反饋機制的。
黃民烈稱,過去大家也嘗試了強化學習機制,但很多都不太成功。ChatGPT在這件事上取得了突破。
第三,它在數據質量和多樣性上非常講究。OpenAI雇傭了一個數十人的數據團隊,其實ChatGPT強化學習的數據量并不大,但對數據多樣性、標注體系都有精巧的設計,讓數據發揮出了強大的作用。業內認為,這確實是值得我們借鑒的地方。
當然,ChatGPT也有明顯的不足。大家公認的,是它善于一本正經地胡說八道。劉杰告訴數智前線,ChatGPT是一個黑盒計算,當下在內容的可信性和可控性上有一定局限。
“我們要給它足夠正確的知識,再引入知識圖譜這類知識管理和信息注入技術,還要限定它的數據范圍和應用場景,使得它生成的內容更為可靠,這是我們在做的?!?/p>
ChatGPT在AI的技術路線和訓練方式上的變革,讓人關注它對產業帶來的改變。特看科技CEO樂乘預計,很多單點環節里,用不用大模型會有天壤之別。
沒用大模型,只基于自己上一代小模型做產品的企業,跟應用了大模型且還做了業務垂直化的公司,將無法競爭。
多名創業者談及,這兩年創業市場垂頭喪氣,所有人都在探尋能夠大幅度提升生產力的技術是什么?!癈hatGPT其實提供了一種新的范式。垂頭喪氣、青黃不接的狀態可能會成為過去。這個領域出幾家千億級別的公司是完全有可能的?!睒烦苏f。
03 中國企業的動作
ChatGPT推出后,很多人在講谷歌、百度的焦慮。但大多數中國業內人士認為,目前ChatGPT還是一個對AI技術范式的探索,它并不能代替搜索。
ChatGPT當下一個很大的弊端是無法實時獲取互聯網信息。由于它只是一個端到端的生成模型,能夠自我構造虛假答案,這些都是它替代搜索的障礙。而如果以目前每一條幾美分的成本來看,它會讓商業搜索引擎公司入不敷出。
它作為搜索引擎的補充是有機會的,因為搜索引擎也講求“所問即所答”,但這還有一個發展過程。
劉杰認為,ChatGPT主要的產業化路徑,目前可能性比較大的首先還是在C端。由于ChatGPT展現出的大模型的創造性,以及對長篇上下文的理解能力,它可能會聚焦于一些開放性、創意性和通用性的任務上。
不過,中國企業在行業市場的探索已經開啟。比如,在智能客服領域,云蝠智能CEO魏佳星告訴數智前線,上個月他們在一些場景嘗試引入ChatGPT來做外呼的Demo測試,調用ChatGPT來回復客戶的問題。
“在智能客服領域應用這項技術,核心點在大模型的NLP(自然語言處理)能力和此前企業里已有的NLP之間怎么結合。”魏佳星說。
例如幫助順豐去做回訪的快遞通知體系,是基于幾個標準動作而進行,在這個封閉條件下應該優先企業已有的技術,滿足客戶當下的核心需求。
在這個需求之外,此前智能客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,語料信息不充分時,AI沒辦法對問題做出反應,ChatGPT大模型能夠補全這方面的能力。
魏佳星反饋,云蝠智能外呼的Demo測試效果較好。在其他行業里這項技術可能仍處于娛樂狀態,但在智能客服領域,ChatGPT已具備商用潛力。
從事通訊及數字化服務的上市企業容聯云,從2021年圍繞著人機智能對話,做核心技術和產品研發,比如智能客服。目前,在研發與ChatGPT類似的人工智能內容生成產品。
但就模型的規模,劉杰有不同的看法。“ChatGPT的優勢是它的大帶來的,但在應用落地上,由于它過大,也帶來了挑戰和局限。”他告訴數智前線,“脫離場景去談大和小是沒有意義的。在特定應用場景、特定條件約束下、在特定的數據上,去訓練規模適宜的模型,是我們努力的目標。”
劉杰還稱,AI是一個鏈條比較長的產品技術,如果沒有建立一個好的反饋機制,在部署運營階段,從最前線發現的問題,就很難有效定位解決,所以要讓模型去持續成長和優化,“它不是靜態的,不是交付了就不再管它?!?/p>
云知聲梁家恩告訴數智前線,他們一直密切跟進業內最前沿的算法,是最早把BERT和GPT2模型方法用到實際業務系統的團隊之一,“現在相當于是把基于BERT的技術框架做個升級,目前已納入云知聲今年的技術升級目標規劃中?!绷杭叶髡f,ChatGPT的優勢是意圖理解、上下文對話管理和高質量內容生成,技術升級后,預計會帶來顯著的體驗提升。
與其他企業一樣,云知聲的目標是先走通,之后在既有的業務比如在IoT智能語音交互對話,以及醫療行業應用中落地。梁家恩也提到了模型的規模問題,考慮商業化成本,實用模型的參數量最終可能要壓到10億量級。
商湯科技數字文娛事業部總經理欒青告訴數智前線,團隊更多是利用GPT等生成式內容進行短視頻等創作,讓大家在創作的過程當中,把生產效率提升,“這是我們的核心點”。同時,商湯已訓練了超過300億量級超大基模型。
出門問問創始人李志飛則告訴數智前線,出門問問從2019年底開始做生成式應用,2020年GPT-3出來后一直在跟蹤大模型。目前發力的一個行業應用是寫文案。
某游戲人工智能的資深開發者告訴數智前線,這項技術在游戲的用戶互動環節和制作環節能看到應用前景。比如用戶和NPC(一種角色)互動對話時調用,由于ChatGPT對自然語言的優秀理解能力,用戶和NPC互動的開放性能大幅提升。
另外在制作環節里,應用ChatGPT,可通過關鍵詞生成故事線,能給策劃在劇情走向設計時提供參考。
另外,在數字人領域,特看科技CEO樂乘告訴數智前線,大模型讓數字人的內容生產和交互方式發生了變化。
在沒有引入大模型之前,數字人說話和行動基本要靠真人行為去驅動。有了大模型之后,內容的輸出可以通過大模型來完成。
以直播帶貨為例,數字人公司先給本地生活、知識付費和直播商家等建立一個數字人的虛擬主播形象,而后可以將大模型接入,讓大模型輔助撰寫數字人直播帶貨的話術和腳本,“未來在我們關注的泛生活和電商賽道,可能有30%內容能夠通過大模型生成來完成。”樂乘說。
04 ChatGPT在行業落地難
不過,業界資深人士提出,當下ChatGPT在行業里要真正落地還面臨困難。
“商業模型上跑不通?!?/strong>魏佳星對數智前線說。ChatGPT目前調用一次的費用在幾美分,智能客服一天的問答場景,通常可能要調用幾十萬次。“我們一通電話收費才1.2毛,利潤可能也就2分錢,現在的成本使得它根本跑不起來。“魏佳星認為,當這項產品的調用成本降到1分錢時,行業里可能就會大范圍使用起來。
游戲行業的開發者們也坦言,調用ChatGPT的成本和它當下所帶來的回報可能并不成正比。幾美分只是調用費用,還不算運營費用?!皼]有一個老板能接受,NPC回復一句話要花掉幾毛錢,即使它說得再好?!倍脩舻挠螒蝮w驗是個系統工程,文本互動只是其中的一環。當下即使有廠商愿意不顧高成本使用ChatGPT,最終的用戶體驗也依然可能無法有質的飛躍。
在游戲制作環節,ChatGPT可能也只能作為策劃和游戲設計環節的參考,“乍看中規中矩要素齊全,但細品會發現缺少靈魂,在觀念性的創造上仍有待提升”。
不過,樂乘對ChatGPT的成本問題相對樂觀。OpenAI公司自己也是初創團隊,沒有那么有錢。隨著競爭加劇,大模型會像水電煤一樣,是大家都用得起的狀態。
刨除成本考量,在對企業的落地中,ChatGPT這類大模型,也有典型的問題。
容聯云劉杰舉例,首先,很多客戶有私有化部署要求,但這些模型非常大,對資源要求高,當前不太可能實現私有化部署。其次,這些大模型在一些特定行業或特定任務上,專業性是欠缺的,需要去適配。
而對于ChatGPT這類非開源的大模型應用來說,對它在下游任務上的微調,如何兼顧成本、靈活性和數據隱私則是一個關鍵問題。這些問題也造成,這種模型還沒有走到服務企業級客戶,尤其是大型企業客戶那一步。
除此之外,現在人工智能技術都在與企業的核心業務流程做深度融合,而像ChatGPT這個基于大模型的應用服務,更像一個獨立的外掛,如何深度綁定,這也成為企業使用它的一個待解決問題。
業界人士期望ChatGPT未來在商業模式上有更好的呈現方式。目前ChatGPT對外提供的API還非常單一,影響了應用。
05 創業公司會被ChatGPT吞噬嗎
大家在期待OpenAI的下一個版本。GPT-3大模型發布于2020年, ChatGPT則基于它的改進版本創建。此前盛傳,GPT-4將于今年一季度或下半年推出,不過OpenAI的首席執行官 Sam Altman在1月份回應,沒有具體的時間表。
一些創業者已經開始關注到,隨著大模型被越來越多地應用,細分賽道的創業公司在大模型的強大推力加持下,如何尋找自己的生存空間。
它涉及到兩點,首先是如何深化對垂直行業的認知,真正把大模型融入到企業的創新業務流中。特看科技樂乘認為,垂直行業的小模型,考驗的是創業公司對垂直行業的know-how。
創業公司需要基于對行業的認知深度,采集足夠多的場景數據,并基于這些細分數據更好服務用戶。用戶越多,反饋越多,最終形成數據反饋的閉環。
創業公司在小模型的競爭終局比拼的是,誰家的小模型跟業務結合得緊,且能解決好跟大模型結合的問題。
另一點是,大模型被充分使用、喂得很肥后,是否會成為最強大的AI,最終吞噬細分賽道上小創業公司的發展空間。
海外初創公司Jasper的命運頗能反映這種境況。Jasper是一家基于GPT-3大模型來生成營銷文案的AI服務商,去年10月它宣布以15億美元的估值獲得1.25億美元A輪融資。
一個月后,基于GPT-3改進版本搭建的ChatGPT大火,智能程度更泛化的ChatGPT徹底蓋過了Jasper的風頭。
“對創業者而言,在充分利用已有大模型的情況下,也要盡可能要把小模型的閉環數據保護好?!碧乜纯萍紭烦苏f,這也是他們公司未來會重點攻克的方向。
不過,當下底層大模型還在高速迭代階段,行業內都在等 GPT-4 出來。樂乘認為,從GPT-3到GPT-4的變遷,很像移動互聯網早期 iPhone 1和 iPhone4 階段iOS的升級速度,它的發展速度也許會超出大家的認知。
一些人士猜測, GPT-4將在多模態上有進展,也就是會引入視頻、音頻等。國內某游戲人工智能的資深開發則告訴數智前線,他們關注的是下一代的大模型能不能在理解上下文上有突破。“如果大模型能讓人工智能打贏辯論賽,那么它的能力就算是有質的突破了?!?/p>
“短期內可能大家會高估這個東西,但長期可能有很多人會低估這個東西。”這名游戲AI資深開發評價。
作者:趙艷秋 徐鑫(微信公眾號:數智前線,關注數字化和智能化,匯聚最專業的人,提供有料有趣有價值的內容。)
來源:https://mp.weixin.qq.com/s/tWX_1W3y04LW4UziBxMIxw
本文由 @數智前線 授權發布于人人都是產品經理,未經作者許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!