強強聯合背后,國產大模型迎來“WIntel時刻”?
隨著更多的產業生態的簡歷與完善,國產大模型進入WIntel時刻。下面是筆者分享的關于國產大模型的情況內容,大家一起來看看吧!
在ChatGPT持續引爆行業通用大模型之后,國內諸多互聯網巨頭、AI企業,也都選擇紛紛跟進,參與到國產通用大模型的角力之中。值得注意的是,與上半年“熱鬧非凡”的行業境遇不同,具備實力且具備滿腔“產業抱負”的巨頭玩家,正在為大模型的大規模落地創造機會。
其中,以科大訊飛為代表的科技公司,正在積極與包括華為等在內的國內合作伙伴一起通力合作,為構建人工智能時代的中國“Wintel聯盟”做準備。而隨著越來越多的實力型玩家大踏步入場,“大模型+”的應用拐點正在加速到來。
一、大模型邁入產業“落地”加速期
從國內大模型的發展狀況來看,隨著各路技術企業的紛紛參與,無論是通用大模型還是垂直行業大模型,國內企業均有涉足。一波接一波的行業浪潮席卷而來,正在推動整個“大模型+”應用時代的來臨。
首先,大模型不再局限于聊天、答題、內容生產等C端應用,而是轉向更偏重實體領域的B端應用,以“實用”為導向的大模型日漸成為行業趨勢。
在上半年的持續“爆火”之后,進入下半年大模型的風向明顯變了。市面上越來越多的“面向B端”的應用開始出現,這種“實用主義”的風向,大大加速了生成式AI產業化的進程。從上半年以來,陸續有京東、攜程、網易有道、用友等不同領域的巨頭,發布相關的行業大模型應用,包括騰訊、華為等在內的巨頭,也將“實用”作為大模型應用的重點,推動大模型滲入產業實體之中。
其次,具備通用能力的大型企業,正在加強與各行業大模型企業的合作,新的大模型生產機制正在成型。
目前來說,業內通用的做法是,通過開放自身的大模型能力,為行業大模型開發提供必要條件。
比如,訊飛星火大模型采用了“1+N”的整體布局,即借助訊飛星火大模型平臺的7大通用能力,將其文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力等賦能給其他行業場景,形成在教育、醫療、汽車、法律等諸多領域的行業大模型應用的生產機制。
依托這種生產機制,各行業的大模型廠商,都不再需要“重復造輪子”,只需要專注應用開發,即可推動行業的大模型場景落地,這些條件的具備,為大規模的大模型場景落地奠定了很好的基礎。
二、“實用”大模型并非一蹴而就
如前文所述,隨著國內大模型逐步深入產業,以及通用大模型廠商逐步對外開放自身能力,“實用”大模型的難度已經大大降低,但這并不意味著做“實用”大模型可以一蹴而就,甚至可以說與之恰恰相反。
其一,“實用”的大模型,通常需要企業具備很深厚的行業經驗和專業數據積累,以確保數據的精準性和專業性,而這通常需要大模型企業對行業有很深的了解。
就拿本次1024開發者節上科大訊飛發布的智能編程助手iFlyCode2.0來說,其自發布以來就持續升級,目前已成為行業重要的提效工具(內測數據,在編程的設計階段提效50%、編碼階段提效37%、測試階段提效44%)。
然而,這樣的能力很多企業并不具備,就如同射箭比賽,它們可能還不具備“畫靶子”的能力。
以教育行業為例,大模型中關于“小學生英語學習”的版塊,首先需要了解小學英語的學習目標,還要定義小學生英語學習的范圍,不能超綱(比如詞匯量范圍、語句類型、語句長度等等),并要找到適合孩子學習習慣和學習階段的方法——這些標準,都要先定義,這就是“畫靶子的能力”。
相比之下,從2004年至今,科大訊飛已經在智慧教育領域深耕19年了,多年來其深度參與了中國的教育信息化整個進程,從中小學到高等教育,從教學過程到教學結果諸多場景,系統積累了諸多從0到1的關鍵性技術,這使其積累了其他廠商難以企及的專業經驗和專業數據,而這正是其他廠商短時間難以企及的。
在本次發布會上,搭載了星火大模型V3.0 訊飛AI學習機再度升級,首次發布啟發互動式英語AI答疑輔學功能,實現個性化解決、啟發引導式提問、互動探究式學習。
同時,基于訊飛星火打造的AI心理伙伴正式發布,它具備多模態情感識別、共情表達、尋因式提問、個性化心理指導四大核心能力,全方位呵護孩子的心理健康。
實際上,科大訊飛在細分行業領域積累的經驗不僅限于教育,包括醫療、智慧城市、金融、法律、工業等諸多領域,科大訊飛也均有豐富的經驗,而這正是其可以面向諸多垂直行業推出“大模型+”的底氣所在。
比如,在此次科大訊飛1024開發者節上,科大訊飛推出了醫療大模型和訊飛曉醫APP,為每個家庭提供健康助手,正是基于科大訊飛在智慧醫療行業的多年積累,科大訊飛的智醫助理在2017年就以456分(合格線360分)通過了國家臨床執業醫師資格考試,目前已覆蓋426個覆蓋區縣,累計輔助診斷次數6.9億次。
此外,為了進一步加速大模型行業落地,科大訊飛聯合行業龍頭共同發布12個行業大模型,包含金融、汽車、運營商、工業、住建、物業、法律等行業,加速產業升級。
其二,行業大模型本身的門檻,使得它對大模型企業提出了很高的戰略要求。
從大模型技術密集、資金密集、技術迭代快的特點來看,任何不具備超強研發實力的企業,都很難經得起市場的考驗。但從國內人工智能行業發展現狀來看,目前我國“人工智能+行業”的投入最多不過10來年時間,專業的人工智能人才成長起來,則至少需要5年以上的技術和行業經驗,但當下很多行業內的人員,遠遠達不到這一水平。
而作為國內最早做人工智能的科技企業,訊飛在該領域深耕已經25年了,人才基礎好、團隊信任度高,高中腰部人才梯隊完備,這使其具備很強的研發實力,因而在大模型上它更夠實現有效轉化,對市場風向的預測也更加精準,更容易推陳出新、加速技術迭代。
其三,大模型本身的復雜性,使得大模型的落地并不能僅僅依靠一家企業的能力,而是需要有號召力的科技巨頭來發揮牽引作用,推動整個產業生態的完善和壯大。作為一家有影響力的技術巨頭,科大訊飛具備強大的產業協作能力,這是其能夠實現技術成果“井噴”的重要因素。
比如,在本次科大訊飛1024開發者節上,其不僅展示了為數眾多的各種大模型產品,還展示了龐大的產業生態,這里匯集了幾十種展品,更有搭載星火認知大模型的開放平臺,聯合550多萬開發者,共同打造技術、場景、服務多元賦能的共創共榮的AI生態。也正是基于以上諸多優勢,科大訊飛才能夠在推動大模型落地行業方面先人一步。
三、搶占算力制高點已成破局關鍵
從行業來看,大模型的復雜性要求廠商必須做到“十項全能”,算力、算法、數據、資金、人才,團隊都必須足夠優秀,缺一個都不行,可見AI大模型本質上是一場贏家通吃的游戲。而在諸多因素之中,搶占高性能算力,已經成為當下國產廠商突破技術瓶頸的核心關鍵。
一方面,是中國AI算力需求呈現出高速增長的態勢。另一方面,隨著國內大模型的蓬勃發展,支撐AI核心算力的高性能算力面臨短缺,算力吃緊的局面日益凸顯。硬件層面,由于國內高端GPU芯片的缺乏,使得國外發布的高性能算力芯片一經發布就遭到了哄搶,產品價格也水漲船高,還時刻面臨“缺貨”的風險。
軟件層面,AI時代大量使用的張量計算也跟傳統計算機時代的方式不同,AI算力需求的迅速增長,要求國產大模型廠商不僅要注重算力芯片的硬件建設,還需要注重基礎軟件的創新。也就是說,想要做好大模型訓練,不僅要做到硬件層面的更新換代,還需要軟件層面的持續創新。
目前來看,想要發展大模型要么發力自研,要么高價購買外國芯片承擔風險,而科大訊飛選擇了第三條路,與華為展開合作,共同致力于國產AI大模型的自主創新。
作為當前國產自主算力的代表作之一,華為昇騰平臺憑借華為自研的達芬奇架構技術,實現了業界最佳性能與能效,支持云邊端全棧全場景應用。目前華為昇騰的AI集群已經全面升級,已經從最初的4000卡集群擴展到16000卡集群,是業界首個萬卡集群,擁有更快的訓練速度和30天以上的穩定訓練周期。
早在今年7月份,就有報道介紹,在充分利用昇騰這樣的國產化算力平臺基礎上,訊飛搭建了自研的火石平臺。該平臺突破了大模型數據的系數化,低精度的量化以及高效適配等問題,加速了AI大模型的落地。同時訊飛星火也實現了訓練和數據閉環的全流程設計,大模型訓練和推理的一體化設計等等創新工作。
在10月24日的開發者節上,科大訊飛更是宣布將聯合昇騰AI打造算力底座“飛星一號”,進一步將雙方的合作提升到一個新的高度。
自主算力和自研平臺的結合,對于國產大模型來說有著深遠的意義。
據預計,借助雙方不斷升級的算力基礎設施,科大訊飛將參與到更大規模的參數訓練之中去,為趕上乃至超越GPT-4奠定基礎。
同時,借助高效、穩定、安全可控的國產算力基礎設施,更多普惠行業的國產AI應用成果或將迎來“大爆發”。比如,在本次開發者節上,科大訊飛就展示了包含金融、汽車、運營商、工業、住建、物業、法律等諸多行業大模型,這些技術成果的集中涌現,充分說明了底層原生技術的重要性。
四、國產AI大模型“Wintel時刻”已至
從業內來看,目前業界對于大模型落地的探索,已經初步分化出了不同的路線。具體可分為三種類型:
- 按照使用量收費模式,就是通過AI公司研發大模型并對外提供應用產品或API;
- 谷歌模式,即從底層TPU芯片,到云基礎設施再到大模型產品全部自研;
- “OpenAI+微軟”模式,雙方各自發揮自身的優勢相互配合,共同助力大模型產業的發展,有點類似PC時代的“Wintel聯盟”,這和科大訊飛與華為的合作有異曲同工之妙。
作為個人計算機歷史上的一大里程碑,Wintel聯盟無疑是史上最成功的產業聯盟之一,其成功之處在于,通過將微軟Windows操作系統和英特爾硬件融合,使之達到了三個方面的效果:
- 軟硬件的兼容性,極大地降低了產業成本提高了行業效率;
- 微軟的軟件和英特爾的硬件相互配合、優勢互補,各自將自身優勢發揮到最大;
- 軟硬件相互推動,加速產業迭代和創新。比如,微軟軟件的創新,會推動英特爾加速硬件的性能提升;而英特爾硬件性能的提升,也會加速微軟軟件的迭代,由此形成不斷強化的產業飛輪,同時成就了微軟和英特爾兩大PC霸主。
如今,同樣的事情也在人工智能領域開始上演了。比如,全球云巨頭亞馬遜就與HuggingFace等開源新勢力展開了合作,大數據巨頭Databricks豪擲13億美元收購大模型初創公司MosaicML,微軟和OpenAI的合作等都是這一思路的延伸。
而從目前國內大模型企業的發展情況來看,圍繞做產業生態的思路,已經有越來越多的產業聯盟開始在大模型領域漸次鋪開,科大訊飛與華為的牽手,無疑是一個很好的行業示范。作為整個產業鏈、生態鏈中的核心企業,它們的牽手可以起到“牽一發而動全身”的作用,帶動整個產業生態迅速完善起來,從而為更高質量的大模型發展鋪平道路。
科大訊飛董事長劉慶峰在1024開發者節的主論壇演講中說,2014年上半年,訊飛星火將對標ChatGPT4:“這絕不僅僅是一個簡單的技術對標問題,我們要走出自己的技術路線,走出自己的產業方向,形成自己完整的生態。從這個角度來說,大模型時代的序幕才剛剛拉開!”。
相信隨著更多產業生態的建立和完善,國產AI大模型或將迎來屬于自己的“Wintel時刻”,屆時作為核心企業的科大訊飛,也將受益于整個產業的進步構建起更強大的生態壁壘。
專欄作家
劉曠,微信公眾號:劉曠(liukuang110),人人都是產品經理專欄作家。海南三車網絡科技有限公司董事長、購團邦資訊創始人、知名自媒體。
本文原創發布于人人都是產品經理,未經許可,不得轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!