華為盤古,過河拆“Chat”
7月7日,華為盤古大模型發布,其策略方向為“不作詩,只做事”。那么,盤古大模型的市場是怎樣的?未來又將會如何發展?接下來,讓我們看看作者的解讀。
經歷了漫長期待與紛紜猜測,華為盤古大模型最新進展悄然面世。
7月7日,華為云在年度開發者大會上鄭重其事地揭曉了盤古大模型3.0的面紗,華為常務董事兼華為云CEO張平安喊出“不做詩,只做事”,正式給盤古大模型定調。
此前,外界猜想華為的大模型可能會與ChatGPT正面競逐。在中文語言處理(NLP)大模型的領域中,華為可能會構建一款主要面向消費者端的對話式AI聊天應用。
然而,華為內部的一位消息人士很快進行了辟謠。他透露華為并未正式提及將發布一個可以與ChatGPT相提并論的產品,華為不會采用類似于“盤古Chat”這樣的名稱,也不會去“對標”任何一個具體的產品。
上述人士還披露,華為主要是做針對行業的B端業務,因此將大模型應用在這些領域會更加合適。盡管語言處理是重要的,但他坦白認為,這并非華為的強項。如果業務不是主攻方向,華為在當前階段可能會暫時停止研發,以更專注于保障公司的生存與發展。
從此次大會的內容來看確實如此,華為已經把盤古大模型明確定位為面向各行各業的B端產品。他們試圖通過投入盤古大模型的能力,來賦能各個行業。
一、又一個發力行業的大模型
結合4月8日的人工智能大模型技術高峰論壇來看,盤古大模型并未突破預期。
在那次論壇中,華為云人工智能領域的首席科學家田奇出席,并詳細介紹了華為云盤古大模型的發展進程以及在實際應用中的情況。因此,這次華為云大會上的內容,實際上是對之前信息的一種延伸。
在前述論壇上,田奇先是提出了一種類似于自動駕駛的等級劃分方式,將大模型的發展階段劃分為“L0至L2”,分別對應著基礎通用模型、行業模型以及針對細分場景任務的特定模型。
這正是華為盤古大模型3.0的核心理念,即通過三層次的模型設計,實現大模型在各個行業的落地應用。
具體來看:
- 第一層L0,是盤古基礎大模型的所在。在這一層,包含了五個技術領域的大模型,分別是NLP(自然語言處理)大模型、CV(機器視覺)大模型、多模態大模型、預測大模型和科學計算大模型。
- 第二層L1,專注于行業大模型的構建。華為給行業客戶提供基于公有領域行業數據訓練過的行業通用大模型。此外,也協助客戶使用他們自己的數據來訓練行業大模型,從而形成屬于他們自己的大模型。
- 第三層L2,關注更為垂直的細分領域,專注于解決某個細分領域內的應用問題,這往往需要大模型與深度技術緊密結合。在這個層級,華為給客戶提供開箱即用的大模型服務,致力于解決更具深度的技術問題。
發布針對行業的大模型產品,早已不是什么新鮮事了。對此田奇指出,行業內大量的業務場景迫切需要更多專業的大模型和專業的AI應用來解決問題,以填補通用大模型在行業落地時的短板。
他認為,通用大模型在應用于行業時,面臨著專業性、技能和數據安全合規三方面的挑戰。
- 首先,雖然通用大模型的適用范圍廣,但在專業性上相對較弱,需要具備行業專業知識才能給出專業且準確的答案。
- 其次,盡管通用大模型具備廣泛的知識基礎,但在技能方面不足,而企業場景復雜,需要模型擁有多樣的技能。
- 最后,數據安全和合規性也是一大挑戰,數據是企業的核心資產之一,因此在訓練和使用大模型時必須保障企業的數據安全和合規。
為了解決這些挑戰,華為云基于實踐經驗,構建了分層解耦的大模型架構,也就是之前提到的三層結構,以加速大模型在各行各業的落地應用。
至于如何從基礎大模型煉成行業大模型,田奇介紹了華為的四大關鍵舉措:沉淀行業知識、淬煉行業技能、對話專業工具、保障安全合規。
另一方面,計算能力是構建大模型的核心。大會上,華為云正式發布了華為昇騰AI云服務。這項服務以擁有2000P Flops算力的單集群為基礎,在華為云的烏蘭察布和貴安AI算力中心同步上線。
華為構筑了一個以鯤鵬和昇騰為基礎的AI算力云平臺,該平臺包含昇騰的計算引擎CANN、AI框架MindSpore,以及AI開發平臺ModelArts,共同組成針對大模型的解決方案。
二、緣何缺位C端市場
華為在大模型領域的積淀已經歷時數年。
從2020年11月的盤古計劃開始,到2021年4月發布的盤古NLP大模型、盤古視覺大模型、盤古科學計算大模型,再到現在的盤古3.0。華為在人工智能方面的深入研發和實際應用一步步地展露,只是核心策略更傾向于服務B端市場,而非C端市場。
從此次發布會來看,盤古大模型在L0層主要由五個模型組成,分別是CV、NLP、多模態、科學計算、預測。但這五個方向的發展成熟度完全不一樣。
很明顯,盤古大模型的服務更側重于B端客戶,特別是在較為成熟的CV領域。這從兩次大會上對CV大模型的關注程度可見一斑。而對于行業內倍受關注的類似ChatGPT的NLP大模型,華為公開的相關細節相對較少。
對此張平安表示:目前全球已發布數百個大模型,中國發布了超80個,To C類應用百花齊放。很多To C的大模型會寫詩作畫,華為盤古大模型不會寫詩,只會做事,致力于深耕行業,為行業帶來價值。
這番言論看似貶低了以ChatGPT為代表的語言大模型,但也暴露了華為盤古大模型在應用廣度和豐富性上可能存在的不足。
據業內人士透露,華為在NLP領域還相對較弱,生成性最多能應用于一些封閉場景下的客服,語義理解相關的可以應用于輿情的管控、法律司法文書的理解、審計文書的理解,但在輸出性、內容生成性方面,盤古大模型之前并未將其作為一個發展重點。
客觀來看,這其實與應用場景有關。NLP大模型的應用場景主要是自然語言、智慧旅游、金融領域。而CV大模型的應用場景主要是機器視覺,例如交通行業的高速巡檢;電力行業的日常巡檢、設備的缺陷識別;制造業的缺陷識別等。
華為能找到的高價值的數字化賦能場景主要以視覺為主,所以這就是盤古大模型更多的研發項目主要圍繞這一領域的原因。而NLP方面的力度不大,主要還是商業驅動力不足,華為一開始做AI就未將C端作為一個重點。
此外,這也與企業獨特的基因生態結構密切相關。
雖然華為、騰訊、百度等大模型開拓者在執行戰略構建和商業模式落地方面存在一些相似性,但真正區分它們的核心依舊在于各自的生態系統。
作為互聯網巨頭,百度和騰訊通過其廣闊的C端用戶業務網,比如百度深入的搜索引擎業務以及騰訊在社交網絡、電子游戲和營銷領域的強大陣容,能夠依托其業務豐富性,在數據樣本的收集上獲得比競爭對手更為顯著的優勢。
華為則對B端行業的深度理解領先于二者。盤古大模型已在多個行業中得到應用,因此主要關注點更多的是B端市場。
三、“不做詩,只做事”的局限性
“不作詩,只做事”這種“行業優先”的策略,滿足了一部分市場需求——為特定行業解決具體問題。
然而,需要深思的是,當華為將AI的視線只聚焦在行業應用上,可能會遺失掉更廣闊領域中的發展機會。
事實上,AI技術的潛在應用價值,遠超出了眼下所見的“做事”。如果將AI的應用范圍僅限于特定行業,這種偏見或許會限制在其他領域尋找AI的價值。
拿詩歌創作來說,AI的詩歌創作不僅僅是在藝術領域的一種創新形式,更是一種科技的展示。通過此種方式,可以向公眾展示AI的學習能力、自然語言處理能力等各種能力。這不僅能拓寬AI的應用領域,而且能吸引更多的公眾來關注和理解AI技術。
此外,AI的創新性并非與實際應用相互沖突,反而可能互為促進,相輔相成。藝術與科技的融合長久以來都是推動創新的重要力量,其中就包括像圖像識別、自然語言處理等技術。借由將AI應用于藝術創作,能更深入地理解并優化這些基礎技術,從而提升AI在實際應用中的效果。
比如說,ChatGPT這樣的大模型,就是通過其強大的語義理解和推斷能力,以及其能提供個性化和情境化回復的能力,得到了廣泛的關注和討論。這種強大的自然語言處理能力,使得AI模型不僅可以在行業任務中發揮其價值,還能在C端市場中提供更加人性化、有趣且富有創造力的服務。
實際上,C端市場對于AI模型的發展至關重要。許多創新性的技術和產品往往首先在C端市場得到接納和普及,然后才逐漸滲透到B端市場。因此,如果大模型產品只將其目光聚焦于行業應用,可能會錯過在C端市場建立更深度連接,提供更個性化和情境化體驗的機會。
華為自身就是個很好的例證。雖然華為以前的產品在某些B端企業中已經得到了使用,但影響力并不顯著,反而通過ChatGPT的爆火而為人熟知。
隨著AI技術的不斷發展和普及,越來越多的普通消費者開始接觸和使用AI產品。在這樣的背景下,那些擁有良好用戶體驗和人性化交互能力的產品,將會擁有更大的市場需求和發展空間。
總的來說,華為盤古大模型若是只顧“低頭做事”,也可能在一定程度上忽視了AI的廣泛性、創新性和人性化。一款出色的AI大模型,不僅能“做事”,也能“作詩”,才能實現真正的平衡和全面的發展。
作者:樟稻;編輯:伊頁
來源公眾號:科技新知(ID:kejixinzhi),洞察技術變化背后的產業變遷。
本文由人人都是產品經理合作媒體 @科技新知 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
其實這何不是華為清晰自身形式的體現呢
我很好奇,“作詩”瞧不上,你拿什么來訓練它“做事”?