通用智能面臨巨大掣肘,國產AIGC還在尋找光明

0 評論 5836 瀏覽 5 收藏 14 分鐘

在AIGC的熱潮下,相關企業紛紛對此進行投入。而在國外競品大踏步前行之際,國內的通用智能企業境遇如何?對此,本文從來自OpenAI的壓力、國產AIGC的進擊障礙、國內AIGC的擴散難三個方面做了分析,希望對你有所幫助。

AIGC背后充滿了故事,在一家家企業手握巨額融資之時,人們耳邊再次響起了警鐘。誠然,在新的浪潮之下,符合商業規律的企業才能笑到最后。在國外競品大踏步前行之際,國內的通用智能企業境遇如何?

前景很樂觀,但當下似乎并沒那么好過。

一、來自OpenAI的壓力

似乎OpenAI的進步更快。

“我覺得我們和OpenAI的差距越來越大了”,一位AIGC從業者對數科星球(ID:digital-planet)這樣表述。前些日子,在ChatGPT推出后,不僅是英文對話,在中文領域,該系統的用戶體驗也超越了國內的眾多產品。以至于,一時間,人們的朋友圈被ChatGPT的對話刷屏。

“最早,我測試過一些特殊的中文語境,ChatGPT表現不好,不過最近我在測試的時候發現它進步很快”,這位技術人員曾以諸如“關公戰秦瓊”等有中文歷史背景的話術測試機器人,他發現,最近這款產品在中文適配方面有了明顯進步。

赤裸裸的對照實驗結果出現后,技術派的內心是焦慮且復雜的。一些國內企業對我們表示,以目前的進度來看,光是追上OpenAI,就感覺“很吃力”。

雖然,目前OpenAI的終端產品由于眾所周知的問題未在國內市場全面鋪開,但對于具有技術理想的相關企業來說,這種滋味是十分難受的。有人將這種情況描述為北斗未出現時的導航行業,“從信創的角度考慮,中國的AIGC是肯定要有的,但技術差距也是不可忽視的”,一位投資人評價道。

客觀來說,造成國內AIGC落后于同行的原因是多方面的:有A100顯卡的獲得受到制約、國內人才隊伍發展較慢等諸多原因。其中,在硬件方面,大模型訓練過于依賴進口GPU顯卡,雖行業間出現了便宜的國產替代品,但以目前的技術水平,還不能給出滿意的性能支持;而在人才隊伍方面,一些行業人士稱“算法工程師多,但會大模型的鳳毛麟角”。

全局來看,當下,似乎僅有百度公司、清北高校等團隊立志于全身心投入于此。大模型所談者甚多,但行業“孤勇者”數量寥寥。

二、國產AIGC的進擊障礙

擺在通用智能或大模型發展之路的另一個障礙是小模型。

我們在文章中所提到的“大模型”概念是一個術語。之所以稱之為大模型,因其在訓練數據過程中引入多模態等數據,讓數據標注的數量大規模增加,使之展現可打破行業藩籬的普適性。相對于小模型而言,具有通用性好、邊際成本低、效率高等特點。

后來,OpenAI再次點燃人們對通用智能的期待。在一些具有前瞻思維的技術派眼里,大模型對于各行各業的影響將是摧枯拉朽式的,他們一致認為大模型是“當之無愧”的未來發展方向。也就是說,技術上,大模型的發展上限更高,其會在未來某個時間點達到各種小模型的用戶體驗閾值。

由于大模型的橫空出世,小模型統治AI的格局被打破。應該說,就本質而言,兩種技術路線背后代表著不同的利益。以至于,互聯網上,網友對兩種技術路線的討論十分熱烈:一會有人指責大模型是“大煉鋼鐵”,一會又有人攻訐小模型是“亞當斯密小作坊”式的抱殘守缺。

客觀來說,小模型在當今的市場競爭中仍然具有重大影響:從業者們通過算法微調、反復訓練數據等措施下,一些產品收到了不錯的效果,對于客戶而言,甚至在一些領域內的結果要好于大模型產品。

其次,國內通用智能的AIGC缺少數據訓練場景。

類似ChatGPT的訓練場景尤為缺乏。在上文提到過的,這款產品之所以短時間之內進步神速,因大量用戶為其充當了免費的數據標注員。不過,已目前情況來看,可與ChatGPT相較的數據訓練場景在國內還鮮有見到。

另外,產業界對大模型有著濃烈的觀望情緒。

在對談多家相關企業后,數科星球(ID:digital-planet)發現了產業界對AIGC持觀望態度的主要原因。概括來說,業界普遍存在這樣的憂慮:目前大模型應用不成熟,驟而上馬將會對原有業務造成沖擊。

以電商售后和銀行電話客服場景為例,目前行業內仍采用主流智能客服公司推出的QA問答庫技術??蛻羝髽I希冀大模型產品能夠解決QA庫無法承擔的長尾問題,覆蓋到檢索式問答路徑無法涉足的領域,但金融行業的語料庫等數據又不對外開放,讓大模型企業不得不重頭開始。

這都延遲了大模型進軍具體行業的時間表。

目前,一些從業者透露,金融科技公司愿意為大模型企業提供“必要但不致命”的應用場景。在這些場景中,客戶企業可以承受一定程度的容錯,也愿意投入時間和資源支持大模型的進一步發展。“我們的主要客戶來源于金融機構的創新部門,因為他們支持一些通用智能的事情”,一位銷售人員對數科星球(ID:digital-planet)這樣說。

“死馬當活馬醫,反正沒辦法解決長尾,不如讓大模型試試”,這是金融行業業內給出的真實看法。甘愿“冒風險試一試”的場景有公文寫作、情感理解等。

總結而言,通用智能企業需要客單價高、數據訓練場景豐富的派單需求,但這個問題又與企業的現實考量和預算投入相互矛盾。

沒得數據用來訓練、沒得大錢(投資除外)養活產品,是擺在現實的兩大難題。

三、國內AIGC的擴散難

元宇宙爆火,燃遍各行各業。它能否成為助力通用型AIGC擴散的有力平臺?

這是一個有趣的想象。答案是,可以,但很難。

目前,AIGC和元宇宙的發展雖然存在相關性,不過就目前的情況來看,二者還未完全合流,處在“你做你的、我做我的”的階段。

舉例來說,在一些社群中,我們曾討論這樣的使用場景:在在線繪畫App中嵌入AIGC功能,使用戶在提交繪畫作品后自動生成AIGC圖片。面對這個問題,某些供應商對數科星球(ID:digital-planet)分享:“實際上,在第三方App中嵌入AIGC難度很大,要有能力處理高并發,要低延時,從而不影響用戶體驗”,在他的想法中,甲方的需求可以滿足,但如若在實時在線的基礎上,成本頗高。

退而求其次,供應商給出了離線生成或自建圖庫的方式滿足需求(自建圖庫是預先在系統保存大量已經生成的圖片,用戶有需求時直接調用)。但很明顯,這種折中的方式違背了AIGC設計的初衷。時間長了,對于訓練大模型更是無從談起。

在同樣爆火的數字人中,AIGC的應用場景也不算多。目前,市面上絕大多數數字人均屬“服務型數字人”。它們被廣泛應用在虛擬的辦事大廳、博物館、手語電視臺的手語節目等場景之中。

剖開數字人產業鏈可以看得更加直觀:在這個產業鏈中,底層為算法層,負責驅動面部表情和手勢動作;中層為渲染層;上層為構成層,負責建立數字人圖像。但除了底層“數字腦”領域,其他層面與通用智能結合較少。

在某知名投資機構投資人看來,“未來的數字人會相當多”,他認為,人們會擁有具有服務和陪伴屬性的虛擬分身。但在技術上,想讓人工智能具備情感陪伴功能還尚需時日,“至少目前技術是達不到的”,一位技術人員補充說。

整體來看,目前的數字人大多承擔著IP形象功能,能說話的數字人還比較少。在一些先進的數字人中,“中之人”又是必不可缺的因素(其承擔動作捕捉、虛擬拍攝、表情抓取和后期合成、渲染精修等工作的真人)。表面上,這種數字人比較高端,但其背后通常有大量人員為其服務,制作成本雖有所降低,但整體制作成本也并不低廉。

以上原因都阻止了AIGC或通用智能擴散至尋常百姓家。

四、結尾

企業顯然不會坐以待斃。他們給出的策略大體分為三塊:對外投資以擴充數據訓練場景、夯實客戶關系以獲取現金流、堆人堆設備砸錢砸出大模型。

以上基本盤是投資機構給出的巨額投資。

“這好比把高科技做成了勞動密集型企業”,一個業內人士哂笑。不過,在當下的時間點,這是沒辦法的辦法。技術上,只要機器足夠、標注正確,哪怕是“堆”,也可達到預期目的。

錢的方面,高科技企業已下定決心“內卷”數字經濟同行,有銷售人員將其稱之為“關系是第一生產力”。不過這種思路面臨一個問題,就是大模型和通用智能的認知度要高。

“我們拜訪了很多客戶,但很多人其實根本不理解大模型”,一位業內人士對數科星球(ID:digital-planet)表述。在他的眼里,傳統數字經濟在新技術面前有巨大的提升空間。

舉例來說,比如政務大屏。

“之前為調取一個地方數據,大屏只能靠下拉、下拉、再下拉的方式調用,而現在對語音助手說‘我要今年的生產情況’,就能自動生成”,這位業內人士解答,在他眼里,東西是好東西,但在買家面前變成了另外一個景色:“如果一個領導想做,他只需要1個理由去做,如果他不想做,他會找出100個理由不做”。

AIGC熱潮高企,但一線銷售人員往往會頻頻碰灰。在高科技浪潮風起云涌的當下,很多人承擔著不能言說的苦衷。

作者:苑晶;編輯:十里香;公眾號:數科星球(ID:digital-planet)

本文由 @數科星球 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!