婷婷五月深爱憿情网六月综合,亚洲精品色婷婷在线影

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

LLM/AIGC帶來的創新機會

人人都是產品經理

2023-06-21

0 評論 8457 瀏覽 17 收藏

12 分鐘

2023年6月10日~11日，人人都是產品經理舉辦的【2023數字化產品經理大會·深圳站】完美落幕。遠望資本創始合伙人@程浩老師，為我們帶來《LLM/AIGC帶來的創新機會》為題的分享。

ChatGPT的出現仿佛平地一聲驚雷，無異于第四次工業革命。大模型對于人類的價值遠超互聯網的價值，互聯網是搜索信息，大模型是理解信息。舉個例子，圖書館有成千上萬的書，互聯網能幫我們做的是找到這本書，而大模型可以幫你理解、看懂、消化這本書。

而未來大模型對人類工作的替代會從初級白領開始，比如幫忙訂酒店機票的助理，發展到后面可能也會取代高級白領，比如律師、醫生等。

這就帶來一個問題：未來，知識不是必選項。純知識性的、重復性的工作將會被取代，留下來的崗位，都是在做創新的崗位。這也將會對國內的教育體系造成沖擊。

接下來講什么是LLM。這是一種壓縮技術，提示語（Prompt）是解壓縮。涌現是解壓縮中，隨機組合出現新的內容。它就相當于基因突變，但大部分基因突變都是錯誤的，涌現是好的基因突變。

泛化是LLM核心能力。什么是泛化？以前我在百度時，做問答的、客服的、新聞的都有自己的大模型和算法，但他們都只在垂直領域達到了59分，還不能商業化。而ChatGPT這個通用的模型，在每一個垂直領域都達到了80分，具有很好的泛化能力。

訓練大語言模型模型，需要三個步驟。第一步是預訓練，去互聯網找很多語料，無監督學習。接下來第二步就是指令微調，給Q&A，預訓練做得好，指令微調的成本越低。第三步是reinforcement learning。根據用戶反饋不斷調整，你問AI一個問題，AI給你回答，你可以告訴他是對的，給他正向回饋；也可以告訴他是錯的，要他進行修正，讓AI不斷優化。還包括對齊，比如對其價值觀，不能有地域歧視、殘疾人歧視等等。

這三個步驟中，預訓練的成本是最高的，沒有上億都不要搞預訓練。很多創業公司都是先找好一個預訓練模型，再進行后面兩個步驟。

從大模型角度來說，數據質量是最重要的，其次是數據多樣性，然后是數據規模，再是模型，最后才是模型參數。這也解釋了為什么英文狀態下的大模型效果會更好，因為不管是從數據質量還是數量或者多樣性上，英文都是遠超其他語言的。

如今，千億參數可能是極限，未來的趨勢是小型化，比如把大語言模型集成到手機里。

未來，還有一個趨勢是從GUI（圖形界面）到NLUI（自然語言交互）?，F在打車還需要用滴滴，訂外賣還要用美團，未來可以直接拿手機說打車去機場，訂票去上海。

現在幾乎每個企業都有自己的數據庫，未來大語言模型也會像數據庫一樣，成為企業的重要基礎措施。

未來大語言模型會讓那些行業受益呢？主要是以文字語言交互為主導的行業，對純數字化行業影響不大。

在C端領域，受益的可能是寫作、問答、總結、法律、招聘、售前、客服、營銷等這些以文字交互為主的行業。

那么，想要做大語言模型，是用開源模型還是閉源模型呢？像ChatGPT、文心一言這些都是閉源模型，但開源模型的趨勢正愈演愈烈。

創業公司選擇開源還是閉源呢？各有優勢。開源你只需要買TOKEN就好了，再加上 Prompt engineering和向量數據庫等。閉源的優勢在于，保護數據隱私，并且可以不斷用數據填充完善自己的模型。

C端有做開源的也有閉源的，但是B端幾乎都是開源的。在做demo的時候，通常會用閉源的，效果最好，還不用買云計算資源，等到要形成行業壁壘了，再改回到開源模型。

那么，大語言模型，也就是通用模型，它的泛化能力足夠好之后，是不是不需要垂直模型了？

不是的。通用模型很難替代垂直模型。

因為80%的有價值的行業知識和數據都在企業防火墻內，通用模型沒辦法接觸到這些數據，自然也就沒辦法推導出答案。并且，通用模型具有一定的模糊性，所以它更適合一些容錯率高的、低價值的行業。垂直模型更適合容錯率低的、高價值的行業。

比如炒股票、自動駕駛這類需要精確、可控的事情顯然不能用通用模型，但是聊天、寫作就可以。

大語言模型有四個架構，最底層的是Infrastructure，例如算法、算力，這些和創業公司都沒關系，都是巨頭在參與。

第二層是large language models，比如ChatGPT、文心一言、通義千問都是屬于第二層的。

第三層是LLMOPs，這層實際上是工具層，像向量數據庫就是典型的LLMOPs。

第四層是應用APP。

最下面兩層沒有上億的資金很難做出來，適合大公司去做，上面兩層比較適合創業公司，尤其是應用層，可應用的行業太多了。

那么，創業公司能不能做通用大語言模型呢？很難。

首先，缺乏先發優勢。創業公司能突破大公司的包圍，核心原因就是你跑得快，有先發優勢。要么是大公司沒看上、沒看懂或者走錯方向了，所以創業公司能沖出來。但在大語言模型這塊，這些情況都不成立，每個大公司都無比重視。

第二，沒有Dummy Period。現在做大模型已經成為了共識，但是創業公司要想跑出來，那就得留有一定的非共識期來發育。

第三，缺乏場景。大公司都有很好的落地場景，比如百度可以把問答和搜索引擎結合，騰訊的語言模型可以和微信結合。但是創業公司有什么可落地的場景呢？

在垂直領域，創業的機會還是挺多的。我分成B端、C端、國內、國外四個方面來講。

在國內做TO C的好處是什么呢？高爆發。在國內幾個月做成幾百萬DAU是非常有可能的。但問題是什么呢？第一，壁壘低。你能做的，競爭對手也能做。第二，C端的流量紅利沒了。想想大家手機的首頁APP已經有多久沒更新過就知道了，幾年都不會下載一個新應用。第三，巨頭抄襲。你做了一個APP，那字節跳動、騰訊跟你做一個類似的，你怎么辦？第四，合規成本高。做C端的大語言模型，用戶問的問題是千奇百怪的，指不定哪個問題就違規了。第五，只能用國內的大模型。

在國內做TO B的好處是離錢近，壁壘相對高一些。但問題是，天花板低。在中國做TO B最大的痛苦就是企業的付費能力不好，這是受限于國內B端市場的規模。中國的IT Spending只有美國的六分之一，國內上市SaaS公司的人均產值只有30—60萬人民幣。所以在中國做企業服務就比較辛苦，核心原因就是民企沒錢。

在國際做C端的好處是增長快，問題同樣是壁壘低，而且市場已經是紅海了。并且，即使是海外AIGC獨角獸也面臨巨頭競爭。

在國際做B端的好處是海外企業付費好，天花板高。有垂直壁壘，巨頭不會進入，而且國外的大模型相對更成熟。但問題是團隊得懂海外的企業服務市場。

最后，我們在創業的時候，是AIGC+還是+AIGC呢？這兩者的區別是你是用AIGC原生還是用AIGC賦能。比如要做一個客服系統，一個團隊是之前就做AI的，先做好了問答機器人，再去添加客服系統的其他功能；另一個團隊是本來就是做客服SaaS的，只不過之前的SaaS不是智能的而是人在后面回答，現在要把AI的自動回答功能加到已有的客服系統里去。

如何判斷你更適合哪一種？第一個判斷依據，如果公司70%的價值鏈都是AI，那么很顯然就適合AIGC+的賽道。如果本身是SaaS，而AI只占到10%，那顯然更適合+AIGC。第二個判斷依據，看AI本身的技術壁壘怎么樣。如果你選擇AIGC+的賽道，那就必須補充業務工作流，完善價值鏈。未來，AIGC+和+AIGC一定會相互滲透的。