搶人、搶數據,AI原生應用“難產”困局
國內已經涌現出了數量相對龐大的大模型,而與之相對的,基于大模型的應用產品數量卻仍然較少。這也牽扯出一個問題,即AI原生應用的發展,究竟面臨著哪些困局?一起來看看這篇文章的解讀與分析。
自ChatGPT發布以來,大模型風潮在國內外如雨后春筍般涌現。
從百模大戰的火熱到如今對原生應用的推崇,短短一年間,大模型經歷了千山萬水的“奇妙征程”。
2023年3月16日,百度率先發布首個和ChatGPT競爭的大模型“文心一言”,截至10月,國內已經涌現出了238個大模型,幾乎每一天都有新的大模型問世。2023年第一季度,超過17萬家中國AI企業如涌泉般冒了出來。
然而,與競爭激烈的賽道形成鮮明對比的是,基于大模型的應用產品卻寥寥無幾。
過去幾個月,無數互聯網巨頭反復強調AI原生應用的重要性。百川智能創始人、CEO 王小川認為,大模型的創業核心,是好技術如何匹配產品;360集團創始人周鴻祎表示,360的人工智能戰略用四個字形容就是“兩翼齊飛”,先占據應用場景,同步全力發展核心算法技術;李彥宏更是直言不諱:“中國的大模型很多,但是基于大模型開發出來的AI原生應用卻非常少?!?/p>
其實大廠們也并非“光說不練”,今年下半年,百度一口氣發布超過20款AI原生應用;騰訊云推出高性能應用服務 HAI,號稱10分鐘開發專屬AI應用;字節跳動成立新部門Flow發力AI應用層……但事實是,截至目前,相比國外動輒千百個大熱的AI原生應用,國內真正稱得上火熱的應用仍然“難產”。
如此現狀不得不讓人追問,AI原生應用,究竟還要跨過幾道坎?
一、變現之難:賺取真金白銀的門檻提高
如何賺錢,是每一家人工智能公司無法回避的問題。
身處大模型賽道,即使是“家大業大”的大廠,也面臨著“大象難以轉身”的問題。零一萬物CEO李開復曾表示,大廠的優勢是資源多、GPU多、人多、錢多、數據多,但大廠們有一個挑戰:很難放棄已有的商業模式。
“開發一個新應用需要克服兩個主要問題:一是要超越已有的大型應用,這非常困難;二是要開發新的應用取代舊的應用,就像一家公司很難在擁有QQ的同時再開發一個微信一樣,因為已有的平臺價值巨大,不愿意放棄。在這種情況下,創業公司雖然沒有豐富的資源,但他們的優勢在于沒有歷史包袱。”
然而,創業者們的處境同樣艱難,事實證明,像OpenAI那樣直接面向C端用戶的模式,在國內市場面臨著巨大的挑戰,因為國內C端用戶的付費意愿相對較弱。因此,更多的大模型創業公司選擇為特定垂直行業,如醫療、金融、法律等開發專門的解決方案,為不同行業提供定制化的大模型服務,為B端客戶提供服務并收取費用。
這些公司需要面對To B型產品的固有問題,包括依賴高續約率、回款周期長等,對于“燒錢如燒紙”的大模型賽道,無疑提高了門檻。
北京開放傳神科技有限公司創始人、CEO陳冉在接受媒體采訪時表示,國內應用都在試圖產生價值,但很少實現盈利,做數字人的“小作坊”倒是真掙錢了。
更雪上加霜的是,隨著企業在大模型領域布局的時間越長,需要的資本就越多,融資輪次越多,投資人對于企業在技術實力和盈利轉化能力方面的要求就越嚴苛。
多位接受《IT時報》采訪的業內人士表示,當前投資人對于大模型賽道初創公司的熱情正在“降溫”。與過去“井噴期”投資者慷慨解囊不同,現在投資者在考慮投資大模型項目時,會對市場需求、技術實力、商業模式以及團隊能力等方面進行更為全面的評估,他們對于“投概念”和“產生收入”的容忍期正在縮短。
量子位智庫發布的《2023十大AI商業落地趨勢》顯示,今年上半年,國內約有二十家大模型公司獲得超過60億元的融資,全球金額占比僅為6%,國內實際交易金額較少。
“目前的環境是雷聲大雨點小,公司多收入少?!北本┽t者信息科技有限公司CEO劉呈輝此前在接受《IT時報》記者采訪時表示,國內應用層能產生實際應用和實際收入的場景和公司還非常少,相比之下,有自己的垂直模型、場景能掙到錢的公司,才能真正獲得投資者青睞。
二、數據之爭:高質量數據成本高、獲取難
近日,谷歌發布的Gemini新模型陷入數據使用爭議,據稱其中文部分使用了文心一言進行訓練,這一事件引發了全球關于大模型數據短缺問題的廣泛討論。
圖源:谷歌
無論是原生應用還是其底層基礎大模型,數據至關重要。然而,高質量的語料匱乏已成為限制這一領域發展的關鍵瓶頸之一。
業內人士指出,盡管公有數據如互聯網上的信息易于獲取,但質量和針對性往往難以滿足專業模型的需求。
相比之下,私有數據具有高度的專業性和針對性,對于訓練精準的垂直類模型具有極高的價值。
以醫療數據為例,獲取高質量的數據集至關重要,但由于醫療數據的獲取和標注需要大量的人力、物力和時間,因此其成本相對較高,獲取的渠道也十分有限。這類數據不僅難以在互聯網上找到,而且由于涉及個人隱私,獲取和使用也需遵守嚴格的法規和倫理標準。
浦因科技(上海)有限公司首席科學家秦興虎告訴《IT時報》記者,在其所負責的醫學大模型項目中,團隊初期購買了英國生物銀行的公共數據進行大模型訓練,這些數據主要來自歐洲人群。為確保模型在國內的普適性,他們還需要使用中國人群的數據來更新和訓練模型,這在無形中增加了項目成本。
對于國內企業而言,他們還面臨著即使有錢也難以購買到合適數據的困境。中文語料庫的內容相對匱乏,進一步加劇了數據獲取的挑戰。
因此,對于企業來說,如何合法、有效地獲取和使用高質量數據,將其轉化為模型訓練、開發AI原生應用的寶貴資源,確實是一個重要的戰略問題。
五、人才之困:5個崗位爭奪2個人才
AI原生應用作為大模型產業的核心產品,在研發和落地試錯過程中面臨諸多不確定性。人才成為決定成功與否的關鍵因素,也成了現階段大模型競爭中的重要砝碼。
關于國內人工智能人才的儲備,回顧中國的大模型產業發展史,可以發現“清華系”的身影無處不在。
當國內對人工智能的研究還是一片空白的時期,清華大學最早開出的人工智能課程,也孕育出了目前國內人工智能領域的熠熠群星。無論是王小川還是智浦AI聯合創始人唐杰,抑或欲打造“中國版OpenAI”光年之外的原美團聯合創始人王慧文,都來自這里。
在此輪大模型創業背后的投資方中,“清華系”的創投者們也頗為矚目,包括圖靈創投、卓源資本、清華控股、水木清華校友種子基金、無限基金SEE Fund等清華系創投機構也頻頻出手。
盡管如此,必須看到的是,由于大模型技術門檻較高,國內大模型人才主要分布在少數頂尖高校和科研機構,人才短缺問題日益嚴重,許多創業公司甚至面臨著招聘困難。
“現在國內做基座類模型的人才90%都出自清華,國內真正會調模型、訓練模型的甚至不超過200個人?!眲⒊瘦x表示,由于行業本身的人才儲備有限,加上大模型的突然“火爆”,人才短缺問題顯得尤為突出,如果不在高校具備一定的人才資源,創業公司連招人都會變得很困難。
知名咨詢公司麥肯錫一份關于人工智能的報告顯示,預計2030年中國對AI專業人員的需求將增至2022年的6倍,人才缺口將達到400萬人。
據脈脈高聘11月發布的《2023人工智能人才洞察》報告顯示,2023年1—8月,人工智能新發崗位量已與2022年全年持平。2022年人工智能行業人才供需比為0.63,而2023年1—8月下探至0.39,相當于5個崗位要爭奪2個人才。
圖源:脈脈高聘
可以看到,AI原生應用“難產”的背后,面臨著變現之難、數據之爭和人才之困等多重挑戰。Gartner發布的《2023年中國數據分析和人工智能技術成熟度曲線》指出,當前國內生成式AI技術仍處于“期望膨脹期”。只有當整個AI行業在“期望膨脹期”中保持謹慎,才能意識到將大模型的潛能轉化為創新應用尚需克服不小的挑戰。
作者:賈天榮,編輯:潘少穎,孫妍
來源公眾號:IT時報(ID:vittimes),做報紙,也懂互聯網。
本文由人人都是產品經理合作媒體 @IT時報 授權發布,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!