LLM/AIGC帶來的創新機會
2023年6月10日~11日,人人都是產品經理舉辦的【2023數字化產品經理大會·深圳站】完美落幕。遠望資本創始合伙人@程浩老師,為我們帶來《LLM/AIGC帶來的創新機會》為題的分享。
ChatGPT的出現仿佛平地一聲驚雷,無異于第四次工業革命。大模型對于人類的價值遠超互聯網的價值,互聯網是搜索信息,大模型是理解信息。舉個例子,圖書館有成千上萬的書,互聯網能幫我們做的是找到這本書,而大模型可以幫你理解、看懂、消化這本書。
而未來大模型對人類工作的替代會從初級白領開始,比如幫忙訂酒店機票的助理,發展到后面可能也會取代高級白領,比如律師、醫生等。
這就帶來一個問題:未來,知識不是必選項。純知識性的、重復性的工作將會被取代,留下來的崗位,都是在做創新的崗位。這也將會對國內的教育體系造成沖擊。
接下來講什么是LLM。這是一種壓縮技術,提示語(Prompt)是解壓縮。涌現是解壓縮中,隨機組合出現新的內容。它就相當于基因突變,但大部分基因突變都是錯誤的,涌現是好的基因突變。
泛化是LLM核心能力。什么是泛化?以前我在百度時,做問答的、客服的、新聞的都有自己的大模型和算法,但他們都只在垂直領域達到了59分,還不能商業化。而ChatGPT這個通用的模型,在每一個垂直領域都達到了80分,具有很好的泛化能力。
訓練大語言模型模型,需要三個步驟。第一步是預訓練,去互聯網找很多語料,無監督學習。接下來第二步就是指令微調,給Q&A,預訓練做得好,指令微調的成本越低。第三步是reinforcement learning。根據用戶反饋不斷調整,你問AI一個問題,AI給你回答,你可以告訴他是對的,給他正向回饋;也可以告訴他是錯的,要他進行修正,讓AI不斷優化。還包括對齊,比如對其價值觀,不能有地域歧視、殘疾人歧視等等。
這三個步驟中,預訓練的成本是最高的,沒有上億都不要搞預訓練。很多創業公司都是先找好一個預訓練模型,再進行后面兩個步驟。
從大模型角度來說,數據質量是最重要的,其次是數據多樣性,然后是數據規模,再是模型,最后才是模型參數。這也解釋了為什么英文狀態下的大模型效果會更好,因為不管是從數據質量還是數量或者多樣性上,英文都是遠超其他語言的。
如今,千億參數可能是極限,未來的趨勢是小型化,比如把大語言模型集成到手機里。
未來,還有一個趨勢是從GUI(圖形界面)到NLUI(自然語言交互)?,F在打車還需要用滴滴,訂外賣還要用美團,未來可以直接拿手機說打車去機場,訂票去上海。
現在幾乎每個企業都有自己的數據庫,未來大語言模型也會像數據庫一樣,成為企業的重要基礎措施。
未來大語言模型會讓那些行業受益呢?主要是以文字語言交互為主導的行業,對純數字化行業影響不大。
在C端領域,受益的可能是寫作、問答、總結、法律、招聘、售前、客服、營銷等這些以文字交互為主的行業。
那么,想要做大語言模型,是用開源模型還是閉源模型呢?像ChatGPT、文心一言這些都是閉源模型,但開源模型的趨勢正愈演愈烈。
創業公司選擇開源還是閉源呢?各有優勢。開源你只需要買TOKEN就好了,再加上 Prompt engineering和向量數據庫等。閉源的優勢在于,保護數據隱私,并且可以不斷用數據填充完善自己的模型。
C端有做開源的也有閉源的,但是B端幾乎都是開源的。在做demo的時候,通常會用閉源的,效果最好,還不用買云計算資源,等到要形成行業壁壘了,再改回到開源模型。
那么,大語言模型,也就是通用模型,它的泛化能力足夠好之后,是不是不需要垂直模型了?
不是的。通用模型很難替代垂直模型。
因為80%的有價值的行業知識和數據都在企業防火墻內,通用模型沒辦法接觸到這些數據,自然也就沒辦法推導出答案。并且,通用模型具有一定的模糊性,所以它更適合一些容錯率高的、低價值的行業。垂直模型更適合容錯率低的、高價值的行業。
比如炒股票、自動駕駛這類需要精確、可控的事情顯然不能用通用模型,但是聊天、寫作就可以。
大語言模型有四個架構,最底層的是Infrastructure,例如算法、算力,這些和創業公司都沒關系,都是巨頭在參與。
第二層是large language models,比如ChatGPT、文心一言、通義千問都是屬于第二層的。
第三層是LLMOPs,這層實際上是工具層,像向量數據庫就是典型的LLMOPs。
第四層是應用APP。
最下面兩層沒有上億的資金很難做出來,適合大公司去做,上面兩層比較適合創業公司,尤其是應用層,可應用的行業太多了。
那么,創業公司能不能做通用大語言模型呢?很難。
首先,缺乏先發優勢。創業公司能突破大公司的包圍,核心原因就是你跑得快,有先發優勢。要么是大公司沒看上、沒看懂或者走錯方向了,所以創業公司能沖出來。但在大語言模型這塊,這些情況都不成立,每個大公司都無比重視。
第二,沒有Dummy Period。現在做大模型已經成為了共識,但是創業公司要想跑出來,那就得留有一定的非共識期來發育。
第三,缺乏場景。大公司都有很好的落地場景,比如百度可以把問答和搜索引擎結合,騰訊的語言模型可以和微信結合。但是創業公司有什么可落地的場景呢?
在垂直領域,創業的機會還是挺多的。我分成B端、C端、國內、國外四個方面來講。
在國內做TO C的好處是什么呢?高爆發。在國內幾個月做成幾百萬DAU是非常有可能的。但問題是什么呢?第一,壁壘低。你能做的,競爭對手也能做。第二,C端的流量紅利沒了。想想大家手機的首頁APP已經有多久沒更新過就知道了,幾年都不會下載一個新應用。第三,巨頭抄襲。你做了一個APP,那字節跳動、騰訊跟你做一個類似的,你怎么辦?第四,合規成本高。做C端的大語言模型,用戶問的問題是千奇百怪的,指不定哪個問題就違規了。第五,只能用國內的大模型。
在國內做TO B的好處是離錢近,壁壘相對高一些。但問題是,天花板低。在中國做TO B最大的痛苦就是企業的付費能力不好,這是受限于國內B端市場的規模。中國的IT Spending只有美國的六分之一,國內上市SaaS公司的人均產值只有30—60萬人民幣。所以在中國做企業服務就比較辛苦,核心原因就是民企沒錢。
在國際做C端的好處是增長快,問題同樣是壁壘低,而且市場已經是紅海了。并且,即使是海外AIGC獨角獸也面臨巨頭競爭。
在國際做B端的好處是海外企業付費好,天花板高。有垂直壁壘,巨頭不會進入,而且國外的大模型相對更成熟。但問題是團隊得懂海外的企業服務市場。
最后,我們在創業的時候,是AIGC+還是+AIGC呢?這兩者的區別是你是用AIGC原生還是用AIGC賦能。比如要做一個客服系統,一個團隊是之前就做AI的,先做好了問答機器人,再去添加客服系統的其他功能;另一個團隊是本來就是做客服SaaS的,只不過之前的SaaS不是智能的而是人在后面回答,現在要把AI的自動回答功能加到已有的客服系統里去。
如何判斷你更適合哪一種?第一個判斷依據,如果公司70%的價值鏈都是AI,那么很顯然就適合AIGC+的賽道。如果本身是SaaS,而AI只占到10%,那顯然更適合+AIGC。第二個判斷依據,看AI本身的技術壁壘怎么樣。如果你選擇AIGC+的賽道,那就必須補充業務工作流,完善價值鏈。未來,AIGC+和+AIGC一定會相互滲透的。
大會直播回放
產品經理大會舉辦至今,已經成為了產品經理職業發展的風向標。每一年的大會,我們都聚焦行業發展的前沿動態、熱點趨勢,重點圍繞產品經理人群的職業發展,為大家帶來新方向、新思考。
今年的產品經理大會,在各自領域已經取得結果的嘉賓們將現身說法,從不同的視角告訴你如何應對當下的需求變化,探尋產品經理的進化方向!
目前,北京站https://996.pm/7gX2B,深圳站https://996.pm/zaGbp,大會視頻回放已上架,戳鏈接購買,即可收看!
本文為直播專場分享整理內容,由人人都是產品經理運營 @Darcy 整理發布。未經許可,禁止轉載,謝謝合作。
題圖來自Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。息存儲空間服務。儲空間服務。
- 目前還沒評論,等你發揮!