99久久精品免费视频,欧美日韩综合在线精品,亚洲精品无码久久毛片波多野吉衣

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

拆解騰訊的“大模型觀”

數字力場

2023-09-15

0 評論 1040 瀏覽 2 收藏

15 分鐘

就在國內大量大模型產品爭相亮相時，可以注意到，騰訊卻一直保持著自己的節奏。而就在最近，騰訊混元大模型也終于亮相了，那么如何解讀這“遲來”的到場？這篇文章里，作者嘗試拆解了騰訊的“大模型觀”，一起來看一下。

在《5000天后的世界》中，著名未來學家凱文·凱利預言：“在未來的50年里，AI將成為可以與自動化和產業革命相提并論的，不，應該是影響更為深遠的趨勢?！?/p>

而今，大模型似乎就是那根杠桿。自ChatGPT問世以來，“工業革命級的生產力工具”“有史以來最大的平臺革命”“新范式的新拐點”之類的說法，已將大模型“封神”。

公開數據顯示，截至今年7月底，國內已經有130個大模型產品亮相或宣布?！鞍倌４髴稹敝械摹鞍佟?，已非虛指。

有意思的是，在大廠們爭前恐后入局之時，騰訊卻一直保持自己的節奏。

9月7日，在2023騰訊全球數字生態大會上，騰訊混元大模型正式亮相，騰訊宣告全面擁抱大模型。

在廠商們爭搶頭啖湯時不出來，在大模型密集發布期不出來，等大模型的喧鬧消退后終于現身。

有人說這是“遲”，雖遲但到的遲，但騰訊方面更想說它是“實”，腳踏實地的實。這跟騰訊的“大模型觀”有些內在相通——它追求的就是實用至上。

01

說到“混元”，許多人可能會想到道家的“混元即無極，無極生太極”?；煸?，是鴻蒙狀態，是萬物根源。

道可道，非常道。道家始祖老子曾說過“我有三寶，持而保之”，其中之一就是信奉敢為天下后。

而在“中國巴菲特”段永平的闡釋中，“敢為天下后”還有后半句：后中爭先。

騰訊早在2021年就推出了千億和萬億參數的NLP（自然語言處理）稀疏大模型，打破了CLUE三大榜單記錄，但混元大模型的推出也是千呼萬喚始出來。

“做三四月的事情，在八九月自有答案。”有些玩家在打通概念炒作跟對韭當割鏈路后一哄而上，“三四月”的事情剛開始做就掏出了PPT，騰訊卻在“六七月”里不事張揚，直到“八九月”有了答案才讓其面世。

騰訊董事會主席兼CEO馬化騰的那番話，為此提供了解釋：“我們最開始以為這（指AI大模型）是互聯網十年不遇的機會，但是越想越覺得這是幾百年不遇的、類似發明電的工業革命一樣的機遇。”

他認為，“對于工業革命來講，早一個月把電燈泡拿出來，在長的時間跨度上來看是不那么重要的。關鍵還是要把底層的算法、算力和數據扎扎實實做好?！?/p>

馬拉松長跑中，方向對、策略準往往比起步快更重要。

騰訊的通用大模型發布節奏，也被解讀為以慢為快，后中爭先。

混元大模型參數展示的樸實，似乎可堪佐證——沒有狂堆參數，也沒展示打了多少榜，騰訊方面主要披露了兩個數字：超千億參數規模，幾乎是當前通用大模型的標配；預訓練語料超2萬億tokens，和目前最強開源模型Llama 2持平。

與樸實對應的是實用取向：混元大模型不追求Chat（聊天）上的花哨，而追求應用場景上的實效；不是基于國外開源模型訓練求快，而是從零開始、全鏈路自研。

02

實用取向，指向的是讓大模型從“可用”變為“好用”。

不得不說，當下的大模型正陷入“又強大，又弱雞”的悖論：一方面，很多大模型在問答時能秀得一手好打油詩、抖出一番機靈，另一方面，在行業應用中又沒太多實質性用處。

大模型研究者李莉就認為，現在很多模型的研究者和應用的制作者，考慮的是如何讓別人記住自己，所以效果特別視覺化，“每個視頻讓人看得血脈賁張，我們紛紛表示太酷炫了，但是靜下心來，我們對于技術該怎么用一般都沒有答案……如果真正放到經濟中，你會發現根本用不上。”

這正是ChatGPT熱度滑坡的主要原因：前不久，Newsweek調查顯示，ChatGPT的用戶數量已經比今年年初高峰時期下降了近95%。用戶選的最多的理由就是，感覺“ChatGPT對工作的促進能力沒有想象那么強”。

這難言奇怪：在行業應用場景中，用戶在意的，可不是大模型能玩什么梗、扯什么淡，而是能否提供專業知識和行業數據?！按蟆辈皇亲钪匾模皩！辈攀?。ChatGPT上生成的很多回答，就被指看上去專業，專業人士一看卻似是而非。

而今，隨著大模型進入Gartner曲線的相對冷靜階段，越來越多的人已意識到，應用場景是決定大模型能否走遠的關鍵因素。沒有落地場景，就沒商業前景，也就難以走遠。

正因如此，大模型行業正在從拼參數變為拼落地，B端行業應用已成主戰場。這勾勒出的，是大模型正從“技術力”轉向“生產力”的商業化圖譜。

▲中國大模型，很多都很注重跟應用場景結合。

很早之前，騰訊對大模型的認知就是：大模型的長期價值將通過行業應用來體現，絕不僅限于聊天機器人這樣簡單的問答場景。

這次發布會上，騰訊就強調面向產業，明確要以提效為第一要義。騰訊高級執行副總裁、云與智慧產業事業群CEO湯道生就表示，“大模型需要基于產業場景，與企業數據融合，才能釋放出最大的價值?！?/p>

以垂（垂直大模型）應垂（垂直細分行業的需求），方為實用。今年6月，騰訊云從產業客戶需求場景出發，依托騰訊云TI平臺打造模型精選商店。這次發布的混元大模型，則將作為騰訊云MaaS服務的底座，為各業務領域提供支持。

推出的是為應用而生的“從實踐中來，到實踐中去”的實用級大模型，而非花里胡哨的AI“大玩具”，就是“實”的體現。

03

實用取向，內在要求是讓大模型更成熟更靠譜。

大模型要走入行業產業場景，就得減少“幻覺（即胡言亂語）”、避免“誘導（即誘導偏見或欺騙等）”。

克勞德·香農認為，信息的本質是消除不確定性。但體驗過的用戶都知道，當下的大模型都有著很強的“不確定性”——它經常會變成CheatGPT，給你胡編亂造一通。

若這只是大模型跟用戶相互“調戲”，那無非是提供了些笑料，可行業場景專業度要求高、邊際容錯率低，若是提供了錯誤信息，很可能引發嚴重后果。

正因如此，面向產業的大模型必須變得更專業更成熟更靠譜，不能是初看什么都懂、細看什么都不“專”。

騰訊為此采取的策略可以歸結為兩點：1，全鏈路自研；2，將內部業務場景當“磨刀石”。

騰訊的混元大模型，從高速網絡、底層服務器到網卡、高速組網和平臺、模型、算法都是自研，AI基礎設施、機器學習框架、語料庫與模型算法等也是從零訓練。

騰訊解鎖全鏈路自研，瞄準的既是運用自身的技術棧體系，實現根本的業務技術能力突破，也是利用自主體系的研發道路，更好地應對旗下海量高并發業務的沖擊。

客觀上講，基于國外開源模型進行“本土化改良”固然是一條更容易的路子，可大模型既然是工業革命級的機會，只依靠國外的“開源模型”遠不夠。

▲BAT大模型的對照。

騰訊集團副總裁蔣杰說：“外界其實一般多會用到知識圖譜，甚至搜索外掛來讓模型的檢索支持能力變得更強，騰訊也會用，但不能用的比例很高。我們一定要在整個的大模型的預訓練階段把這個問題解決掉，控制掉?！币劳凶匝械摹疤秸妗彼惴?，混元大模型幻覺比例比其他開源大模型下降了30%到50%。

騰訊還在向外部推出大模型前，將其在騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等50多個內部業務中先行驗證。

先打磨好大模型產品，再拿出來服務行業產業，看上去，也是主打一個“實”。

04

實用取向，還得讓大模型回歸服務屬性。

湯道生說：“從一個大模型，到提供一個用戶可以感受到的服務，中間有很多的環節和工序。騰訊其實是提供整個端到端的AI服務流程中所需要的‘全鏈條工具’。我們的TI平臺就是一個能滿足整個工序、環節的需求，給客戶提供高效模型搭建服務的重要工具。這可能是大家比較少從友商那里聽到的?！?/p>

將基于自研的大模型技術能力開放，將其用于從田間到產線的很多角落，這注重的還是落地效果。

大模型很熱，但本質上，大模型是信息化的下一幕。過去十多年的信息化對應的時代大幕上，寫著的主題是“數字化”。大模型同樣是數智化變革的助推器。

只不過，以往互聯網發展撬動的是流通環節減少、流通效率提升，以AI為代表的數字化工具要介入的層次更深——其核心是要增加基礎價值。

這就需要，將數字化觸角伸向生產端與供應側，覆蓋包括從工業制造到冶金采礦、從港口運輸到農林牧副漁的各行各業。

這對國內大模型的發展不無啟示：自從ChatGPT面世后，中國大模型廠商跟OpenAI差距有多遠，就成了行業關心的話題。

應用場景，或許正是中國大模型彎道超車的突破口。

國家信息中心專家張振翼就指出，當前美國在大模型發展中具備一定的領先優勢，我國需要加強自身獨特優勢的探索。在他看來，當前我國發展大模型人工智能主要有三個方面的優勢：應用場景資源極為豐富、數據要素政策設計較為領先、在相關領域的技術創新上已經具有一定積累等。

可以看到，在移動互聯網時代，中國互聯網企業就憑著衣食住行康樂教和產業領域的豐富場景，跑通了模式，做大了規模。

在今天，中國龐大市場上積累了海量數據，包括物流、電商、醫療等各個領域的，各個行業數字化轉型的強烈需要，又為大模型落地提供了需求端支撐。

順勢而為，以實用實干之“實”，加速大模型的產業應用，中國大模型從跟跑到并跑再到領跑的圖景，才會愈發可期。

作者：佘宗明

來源公眾號：數字力場（ID：shuzilichang），抵抗熵增，打撈有趣。

本文由人人都是產品經理合作媒體 @數字力場授權發布，未經許可，禁止轉載。

題圖來自?Unsplash，基于 CC0 協議

該文觀點僅代表作者本人，人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容，請關注人人都是產品經理微信公眾號或下載App

數字力場

抵抗熵增，打撈有趣。公眾號：數字力場

99篇作品 349859總閱讀量

明星直播帶貨，老套路能否拯救小紅書商業化？

03-151832 瀏覽

用產品思維破局，為四位老人安排云南旅行攻略

12-196753 瀏覽

身為 ChatGPT 概念股，知乎卻想做下一個晉江？

03-142288 瀏覽

盤點元宇宙的2022：3次洗牌，1個機會

01-173813 瀏覽

重塑求職新場景（視覺篇）

11-282466 瀏覽

評論

目前還沒評論，等你發揮！

Kindle關停：十年興衰，今朝落幕

07-015872 瀏覽
ChatGPT爆發，30億AI造人神話背后的玩家、技術和應用

02-102672 瀏覽
為了對抗封面黨，網友開始眾籌標題和封面

06-301583 瀏覽