行業(yè)大模型的故事,才剛剛開(kāi)始
大模型的“戰(zhàn)事”在近幾個(gè)月來(lái)愈演愈烈,并且可以看到,這場(chǎng)“戰(zhàn)事”正在向垂直領(lǐng)域的行業(yè)大模型蔓延。那么在這個(gè)過(guò)程中,行業(yè)發(fā)生了哪些變化,從業(yè)者們又有哪些感受?一起來(lái)看看作者的解讀。
本周,一位互聯(lián)網(wǎng)人士分享了一個(gè)小故事——幾天前,他曾遇見(jiàn)一幫創(chuàng)業(yè)青年,在交流的過(guò)程中,對(duì)方告訴他,他們搜集了一大堆修車(chē)相關(guān)的案例和知識(shí),想問(wèn)問(wèn)他能不能提供通用大模型的能力基礎(chǔ),來(lái)幫助他們?nèi)ビ?xùn)練一個(gè)修車(chē)行業(yè)的大模型出來(lái),以便讓中國(guó)1000萬(wàn)修車(chē)工都能擁有20年老師傅的功力。
“這是一個(gè)典型的行業(yè)的能力?!痹谒磥?lái),今天有太多垂直領(lǐng)域,其實(shí)是ChatGPT等通用大模型解決不了的,例如面對(duì)修車(chē)問(wèn)題,他們都只能泛泛而談,“未來(lái)大模型這個(gè)產(chǎn)業(yè)怎么發(fā)展,我覺(jué)得還得往垂直化、產(chǎn)業(yè)化、企業(yè)化,甚至個(gè)人化發(fā)展”。
實(shí)際上,相關(guān)企業(yè)都已摩拳擦掌?;ヂ?lián)網(wǎng)大廠百度、阿里紛紛官宣伙伴計(jì)劃和工具鏈,聲稱(chēng)要讓每一個(gè)行業(yè)都能夠用上自己的大模型。各行各業(yè)的龍頭企業(yè)、創(chuàng)業(yè)公司,同樣馬力十足。金融、教育、醫(yī)療、自動(dòng)駕駛、智能物流、安防等多個(gè)領(lǐng)域的行業(yè)公司都已相繼傳出要推行業(yè)大模型的消息。
“全國(guó)都在煉行業(yè)大模型”, “現(xiàn)在只要是上市公司或規(guī)模稍微大一點(diǎn)的企業(yè),他們都會(huì)有?!毕嚓P(guān)推出行業(yè)大模型的企業(yè)的多位員工告訴數(shù)智前線(xiàn)?!邦A(yù)計(jì)幾個(gè)月后,行業(yè)大模型將會(huì)迎來(lái)一波密集發(fā)布的小高潮?!倍辔粯I(yè)界人士稱(chēng)。
大模型的戰(zhàn)事,已經(jīng)開(kāi)始從通用大模型,迅速卷向面向垂直領(lǐng)域的行業(yè)大模型。
一、行業(yè)大模型卷起來(lái)了
“現(xiàn)在我們?nèi)ジ蛻?hù)談,很多客戶(hù)也不太了解什么是行業(yè)大模型,但是一上來(lái)就說(shuō),我需要你們的行業(yè)大模型。”百度智能云AI平臺(tái)副總經(jīng)理李景秋告訴數(shù)智前線(xiàn)。
她最近和很多企業(yè)進(jìn)行過(guò)溝通,發(fā)現(xiàn)一般會(huì)存在兩種情況,一種需要的是SFT(有監(jiān)督精調(diào))的大模型,只需基于工具鏈去標(biāo)注幾百到幾千或者上萬(wàn)條數(shù)據(jù),就已經(jīng)能達(dá)到企業(yè)需要的效果。但還有一種,一定需要構(gòu)建行業(yè)的預(yù)訓(xùn)練模型才能解決,也即打造一個(gè)行業(yè)大模型。
李景秋發(fā)現(xiàn),尤其是教育、金融、能源方向,很多有行業(yè)數(shù)據(jù)和場(chǎng)景積累的龍頭企業(yè)都希望和大廠合作,構(gòu)建行業(yè)大模型,并進(jìn)一步孵化行業(yè)應(yīng)用,廣泛去服務(wù)上下游相關(guān)企業(yè)。
行業(yè)大模型的重大意義在于,通用大模型雖然具備涌現(xiàn)的能力,但如果原始數(shù)據(jù)里一點(diǎn)行業(yè)數(shù)據(jù)都沒(méi)有,那它對(duì)行業(yè)理解還是會(huì)存在局限性,而一旦存在知識(shí)上的局限性,行業(yè)大模型一定會(huì)有需求?!岸覈?guó)內(nèi)的數(shù)據(jù)生態(tài)沒(méi)有那么開(kāi)放,每個(gè)企業(yè)都有大量沉默的行業(yè)數(shù)據(jù),這些數(shù)據(jù)的價(jià)值,要通過(guò)行業(yè)大模型才能激活并發(fā)揮出來(lái)。”李景秋解釋稱(chēng)。
中科深智CTO宋健認(rèn)為,不管是從一些行業(yè)對(duì)專(zhuān)業(yè)知識(shí)的要求,還是從安全性、成本和效率問(wèn)題來(lái)看,行業(yè)大模型都是必然存在的?!坝绕鋵?duì)我們數(shù)字人領(lǐng)域來(lái)講,實(shí)時(shí)性非常關(guān)鍵,用戶(hù)問(wèn)的問(wèn)題它要在一秒以?xún)?nèi)能回答,這個(gè)是通用大模型達(dá)不到的?!?/p>
但生成式AI大模型的確為數(shù)字人這個(gè)行業(yè)帶來(lái)了巨大的想象空間。宋健透露,之前,一套好用或者可以達(dá)標(biāo)的數(shù)字人后端對(duì)話(huà)系統(tǒng),對(duì)他們來(lái)說(shuō)一直是道難題,數(shù)字人一般只能做到有一套簡(jiǎn)單的問(wèn)答系統(tǒng),很難滿(mǎn)足用戶(hù)需求。例如在電商直播間,用戶(hù)能問(wèn)的問(wèn)題和問(wèn)法基本是被限制的,一旦說(shuō)法發(fā)生變化,后端的問(wèn)答系統(tǒng)可能就無(wú)法匹配。但大模型強(qiáng)大的語(yǔ)義理解能力為這個(gè)問(wèn)題提供了解決方案,讓用戶(hù)可以從“和一個(gè)很傻的白癡在聊天”,進(jìn)化到“可能跟一個(gè)比較聰明的正常人在聊天”。
“這個(gè)區(qū)別是非常大的?!彼谓「嬖V數(shù)智前線(xiàn),這也是他們?yōu)槭裁磸?月份開(kāi)始做相關(guān)準(zhǔn)備,并在5月正式推出面向虛擬人這一垂直領(lǐng)域的行業(yè)大模型——數(shù)智姜尚的原因。中科深智是國(guó)內(nèi)一家虛擬人公司,有數(shù)據(jù)顯示,其虛擬主播產(chǎn)品已服務(wù)超2000家客戶(hù),占據(jù)主流電商平臺(tái)虛擬主播近70%的份額。
無(wú)獨(dú)有偶,大量的行業(yè)企業(yè)也已經(jīng)開(kāi)始行動(dòng)。
今年6月初舉行的2023國(guó)際通信展上,中國(guó)移動(dòng)在展臺(tái)上,展出了他們的“九天”行業(yè)大模型在網(wǎng)絡(luò)運(yùn)維領(lǐng)域的應(yīng)用。現(xiàn)場(chǎng)工作人員演示,在有多個(gè)線(xiàn)頭交錯(cuò)的一臺(tái)電信設(shè)備中,行業(yè)大模型可以識(shí)別幾百個(gè)插線(xiàn)接口的情況,從而讓運(yùn)維人員可快速進(jìn)行光纖線(xiàn)纜的接插。同時(shí),中國(guó)移動(dòng)也正在研發(fā)和內(nèi)測(cè)的一個(gè)客服的行業(yè)模型,未來(lái)可能會(huì)對(duì)外提供,帶頭人是中國(guó)移動(dòng)首席科學(xué)家馮俊蘭。后者自2013年9月加入移動(dòng)以來(lái),就創(chuàng)建并帶領(lǐng)了中國(guó)移動(dòng)人工智能團(tuán)隊(duì) “九天”,至今已近10年。
而在此前的5月29日,中國(guó)聯(lián)通研究院副院長(zhǎng)、首席科學(xué)家唐雄燕也曾向外透露,中國(guó)聯(lián)通正在打造一個(gè)通用的、可適用于各網(wǎng)絡(luò)體系的通信大模型。中國(guó)電信更是早在4月底召開(kāi)的2023云生態(tài)大會(huì)上就表示,天翼云正在自研預(yù)訓(xùn)練大模型,并已進(jìn)入內(nèi)部測(cè)試階段,將在近期適當(dāng)時(shí)候面向市場(chǎng)發(fā)布。
安防行業(yè)的企業(yè)們同樣動(dòng)作頻頻。前不久的2023安博會(huì)上,AI大模型的身影堪稱(chēng)“扎堆涌現(xiàn)”。據(jù)不完全統(tǒng)計(jì),現(xiàn)場(chǎng)至少有包括商湯科技、宇視科技、360智慧生活、熵基科技、聯(lián)匯科技、算能等在內(nèi)的6家不同賽道的頭部企業(yè),都展示了自己的通用或行業(yè)大模型,及相關(guān)的應(yīng)用Demo。
安防行業(yè)“海大宇”三巨頭中的宇視科技在5月推了宇視AIoT行業(yè)大模型“梧桐”,并在此次安博會(huì)上展示了該行業(yè)大模型在Vlog等場(chǎng)景的應(yīng)用。它可將景區(qū)專(zhuān)業(yè)設(shè)備抓拍的游客游覽視頻,自動(dòng)生成vlog,配上文字和表情包。
多模態(tài)生物識(shí)別企業(yè)熵基科技設(shè)了一個(gè)自研大模型及技術(shù)專(zhuān)區(qū),專(zhuān)門(mén)展示自己涵蓋了140億、70億、13億等多個(gè)參數(shù)規(guī)模版本在內(nèi)的BioCV大模型矩陣;人工智能企業(yè)聯(lián)匯科技也用了大量筆墨介紹自己百億級(jí)參數(shù)的視覺(jué)語(yǔ)言大模型OmModel,并表示下半年還會(huì)有一個(gè)V3(OmModel V3 )版本的發(fā)布;算力提供商算能則專(zhuān)門(mén)用了一個(gè)位置,來(lái)展示其與算法合作伙伴千視通合作推出的AI大模型訓(xùn)推一體機(jī),并將應(yīng)用場(chǎng)景定位在了智慧網(wǎng)點(diǎn)、智慧職場(chǎng)、智慧巡檢、風(fēng)控監(jiān)督。
而在金融領(lǐng)域,包括中國(guó)農(nóng)業(yè)銀行、江蘇銀行、度小滿(mǎn)、奇富科技等都宣布推出了行業(yè)大模型。教育領(lǐng)域傳出過(guò)要推行業(yè)大模型的也不在少數(shù),包括網(wǎng)易有道、學(xué)而思、淘云科技、孩子王等。6月11日,中公教育也宣布要與新華網(wǎng)聯(lián)合推出全三維數(shù)智人及職業(yè)教育行業(yè)大模型。
自動(dòng)駕駛、醫(yī)療、房產(chǎn)經(jīng)紀(jì)、智能物聯(lián)等多個(gè)領(lǐng)域也相繼有行業(yè)大模型涌出。4月,毫末智行宣布發(fā)布全球首個(gè)自動(dòng)駕駛生成式大模型DriveGPT;5月,我愛(ài)我家宣布聯(lián)合第四范式推出行業(yè)首個(gè)房產(chǎn)經(jīng)紀(jì)大模型1.0版本,深信服也將自己自研的安全GPT大模型進(jìn)行了首秀;同月底,互聯(lián)網(wǎng)醫(yī)療公司醫(yī)聯(lián)發(fā)布自研的醫(yī)療大語(yǔ)言模型MedGPT……
一場(chǎng)行業(yè)大模型熱潮正在快速到來(lái)。
二、用開(kāi)源還是自研?
當(dāng)市場(chǎng)在短短幾個(gè)月內(nèi),迅速涌現(xiàn)出大量通用大模型和行業(yè)大模型時(shí),一些變化也在悄然發(fā)生。
“GPT的API調(diào)用成本在3月份之后下降到了1/10,更重要的是,開(kāi)源業(yè)界在過(guò)去幾個(gè)月里變得特別繁榮?!痹乞鹬悄軇?chuàng)始人魏佳星告訴數(shù)智前線(xiàn),大量開(kāi)源大模型的出現(xiàn),讓他們?cè)诖蛟烀嫦蛑悄芸头I(lǐng)域的行業(yè)大模型時(shí)有了幾種不同的路徑選擇方案——要么自研,要么基于開(kāi)源大模型進(jìn)行微調(diào),又或是采用閉源但接口價(jià)格不貴的大模型。
在對(duì)比了市場(chǎng)上的各類(lèi)開(kāi)源和閉源大模型的使用效果及成本后,云蝠智能最終采用了“自研小模型+開(kāi)源大模型+垂直語(yǔ)料”的路徑,于近期上線(xiàn)了10億參數(shù)的NLP神鶴大模型,可支持問(wèn)法自動(dòng)擴(kuò)寫(xiě),大幅提高智能客服回復(fù)邏輯的完善度。其中,自研小模型主要負(fù)責(zé)核心的匹配邏輯,清華系公司智譜AI的ChatGLM-6B開(kāi)源大模型則用于支撐小模型完成不了的邊緣部分工作,例如對(duì)問(wèn)題相似度算法進(jìn)行支撐。
也有不少公司選擇“幾條腿一起走路”。
“百度文心一言,以及其他的一些模型,我們也都在用,只是用的地方不太一樣?!敝锌粕钪荂TO宋健告訴數(shù)智前線(xiàn),在一些實(shí)時(shí)性、專(zhuān)業(yè)性以及數(shù)據(jù)安全性等要求較高的場(chǎng)景,例如虛擬助播,他們一般會(huì)用上自己自研行業(yè)大模型,但在一些通用場(chǎng)景,也會(huì)用到文心一言或其他大模型。
“這并不矛盾,這些大的互聯(lián)網(wǎng)公司的千億級(jí)通用大模型還是有它的優(yōu)勢(shì)的,我們并不會(huì)把所有的需求都在我們自己的模型上去滿(mǎn)足?!彼谓≌f(shuō)。在他看來(lái),在這個(gè)各種商業(yè)模型剛推出不久,尚未十分成熟的階段,很多企業(yè)都會(huì)去考慮“還有沒(méi)有其他選擇”。
熵基科技的一位人士也告訴數(shù)智前線(xiàn),他們目前的行業(yè)大模型打造路徑,既有自研的,也會(huì)基于開(kāi)源大模型進(jìn)行微調(diào),二者“互相借鑒”。
值得一提的是,多位業(yè)內(nèi)人士均認(rèn)為,在當(dāng)下的情況下,出于對(duì)成本、進(jìn)入門(mén)檻和速度等的考慮,開(kāi)源大概率會(huì)成為接下來(lái)一個(gè)非常關(guān)鍵的領(lǐng)域。一方面,從事大模型開(kāi)源的可能會(huì)越來(lái)越多;另一方面,在開(kāi)源大模型的基礎(chǔ)上去調(diào)試自己的東西,也會(huì)成為一個(gè)主流。
“我覺(jué)得90%以上的在未來(lái)都會(huì)用開(kāi)源模型?!币晃粯I(yè)內(nèi)資深人士表示,這就像當(dāng)初的Web服務(wù)器、數(shù)據(jù)庫(kù)等互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,最后在市場(chǎng)上留下來(lái)的,除了少量私有,其余絕大部分場(chǎng)景用的都是開(kāi)源的。
“但就現(xiàn)階段而言,你也不能對(duì)某個(gè)大模型依賴(lài)過(guò)重,畢竟戰(zhàn)局還沒(méi)有最后確認(rèn)下來(lái)?!蔽杭研菑?qiáng)調(diào),這就好比10年前安卓、塞班、黑莓等一堆底層操作系統(tǒng)廠商在干架,一旦某家企業(yè)對(duì)某個(gè)操作系統(tǒng)過(guò)于依賴(lài),后期它的方案又長(zhǎng)期跟不上迭代,這家企業(yè)就會(huì)吃虧。
在他看來(lái),基于開(kāi)源大模型做行業(yè)大模型的企業(yè),在盡可能跟市場(chǎng)上這些開(kāi)源大模型結(jié)合的同時(shí),又要解耦。他舉例稱(chēng),云蝠智能的行業(yè)大模型雖然與GLM是對(duì)接的,但都是用的提示詞的形式來(lái)對(duì)接,耦合度很低的,“我隨便換一個(gè)模型,一下就能換掉”。
上述熵基科技的人士也透露,他們自研的大模型參數(shù)目前會(huì)相對(duì)小一點(diǎn),但其會(huì)將基于開(kāi)源大模型微調(diào)的模型作為老師或參照物,在對(duì)比學(xué)習(xí)中持續(xù)進(jìn)步,避免對(duì)開(kāi)源大模型形成過(guò)度依賴(lài),且最終落到產(chǎn)品里面的,都會(huì)是他們的自研大模型。
在終局到來(lái)之前,行業(yè)大模型市場(chǎng)的玩家們都需要在謹(jǐn)慎中前行。
三、故事剛剛開(kāi)始
搞行業(yè)大模型的玩家一個(gè)接著一個(gè),但就目前來(lái)看,大多其實(shí)都還停留在講概念、講技術(shù)、進(jìn)行內(nèi)部測(cè)試或項(xiàng)目定制的階段。
上述熵基科技的人士告訴數(shù)智前線(xiàn),他們目前在探索落地上都還是項(xiàng)目制的,比如他們正和一家醫(yī)院一起,用自研大模型,做一個(gè)導(dǎo)診臺(tái)的問(wèn)詢(xún)機(jī)器人,但現(xiàn)在具體的成熟產(chǎn)品還沒(méi)有,“還在測(cè)”。而在2023安博會(huì)上,數(shù)智前線(xiàn)發(fā)現(xiàn),現(xiàn)場(chǎng)強(qiáng)調(diào)了自己的大模型能力的企業(yè),也大多只展示了他們的大模型技術(shù)或相關(guān)應(yīng)用場(chǎng)景的Demo。
一位互聯(lián)網(wǎng)大廠資深人士也透露,他們目前基本上都還在項(xiàng)目定制階段,著重在提煉需求,積累數(shù)據(jù)。
百度智能云AI平臺(tái)副總經(jīng)理李景秋則表示,現(xiàn)在來(lái)找到他們做行業(yè)大模型的,都是行業(yè)內(nèi)的龍頭,百度雖然在19年就和浦發(fā)銀行、國(guó)家電網(wǎng)一起推出了金融、能源行業(yè)大模型(非生成式),且目前已有11個(gè)行業(yè)大模型(非生成式)的輸出,但具體到最新的生成式行業(yè)大模型的應(yīng)用落地上,還得等幾個(gè)月時(shí)間,預(yù)計(jì)會(huì)在今年之內(nèi)實(shí)現(xiàn)。
一個(gè)毋庸置疑的事實(shí)是,即使離落地還有一段距離,但大家的確都在奔著這一方向去努力。畢竟,國(guó)內(nèi)絕大部分企業(yè)的一大特色正是需要第一時(shí)間考慮落地問(wèn)題,將做的東西盡快變現(xiàn)。而大模型也只有跟用戶(hù)的場(chǎng)景去進(jìn)行大量結(jié)合,才能不斷自我進(jìn)化、修正和完善。正如科大訊飛董事長(zhǎng)劉慶峰在6月9日的一場(chǎng)發(fā)布會(huì)上的斷言,在大模型領(lǐng)域,“誰(shuí)能在具備社會(huì)剛需的應(yīng)用場(chǎng)景落地,誰(shuí)就能最先形成自我造血的良性循環(huán)?!?/strong>
“我們首先要把目前已經(jīng)達(dá)到的能力,盡快去落地,其次則是在語(yǔ)言模型的基礎(chǔ)上去做多模態(tài)的擴(kuò)充?!彼谓「嬖V數(shù)智前線(xiàn),這是他們現(xiàn)階段最優(yōu)先級(jí)要解決的兩大問(wèn)題。為此,他們最近已經(jīng)在將一款基于自研大模型的產(chǎn)品——虛擬助播進(jìn)行市場(chǎng)推廣。據(jù)介紹,基于自有大語(yǔ)言模型GenSense數(shù)智姜尚,虛擬助播將可以與主播及評(píng)論區(qū)進(jìn)行順暢對(duì)話(huà),并保證快速抓屏回答問(wèn)題、反饋低延時(shí)和高識(shí)別準(zhǔn)確率。
不過(guò),宋健也發(fā)現(xiàn),在行業(yè)大模型落地的過(guò)程中,仍然有不少困難和挑戰(zhàn)需要去解決。其中最關(guān)鍵的就在于,當(dāng)把大模型的能力落到某個(gè)實(shí)際場(chǎng)景的應(yīng)用產(chǎn)品上時(shí),由于沒(méi)有參照,其實(shí)是并不好判斷具體該如何用這些模型的,“還是要做非常多的方法的革新,以及處理方式的變化”。
例如在將虛擬助播這個(gè)產(chǎn)品用到電商直播場(chǎng)景時(shí),由于每個(gè)直播間并不一樣,賣(mài)的產(chǎn)品品類(lèi)也不盡相同,進(jìn)而導(dǎo)致促銷(xiāo)方式也大為不同,因此往往需要精確挖掘每個(gè)直播間的需求,探索在成本可控的情況下,如何更好地讓不同直播間的數(shù)據(jù)和語(yǔ)言大模型去做結(jié)合?!笆抢梦⒄{(diào),還是用外部數(shù)據(jù),又或是通過(guò)插件的方式進(jìn)行,這些東西在不同場(chǎng)景下,用法其實(shí)是不一樣的,得到的結(jié)果也不一樣。”宋健解釋說(shuō)。
他判斷,在今年下半年,大部分的行業(yè)企業(yè)可能都會(huì)將主要的時(shí)間花在如何把大模型用下去上,反而是大模型本身怎么煉制這些東西不再是重點(diǎn)。
當(dāng)然,行業(yè)大模型的故事其實(shí)才剛剛開(kāi)始。各行各業(yè)的玩家們,都對(duì)它寄予了不小的期望。
宋健所在的數(shù)字人行業(yè),寄希望于大模型能夠讓數(shù)字人成功邁入下一階段,即變得具有成長(zhǎng)性、全面?zhèn)€性化,而不是像以前一樣“千篇一律”。而魏佳星認(rèn)為,大模型短期內(nèi)有望提高智能客戶(hù)的智能度,并提高增強(qiáng)其事后的BI能力,長(zhǎng)期則有可能形成完全基于生成式的AI智能客服。更多的人,希望它能賦能工業(yè)質(zhì)檢、醫(yī)療導(dǎo)診、教學(xué)等諸多更廣泛的場(chǎng)景。
“但從邏輯上講,行業(yè)大模型一定會(huì)是在精度相對(duì)較低、容錯(cuò)率較高的行業(yè)先引用,再到精度要求高的地方去?!蔽杭研潜硎?。
作者:周享玥????????;編輯:趙艷秋???????????
原文標(biāo)題:行業(yè)大模型,卷卷更健康
來(lái)源公眾號(hào):數(shù)智前線(xiàn)(ID:szqx1991),關(guān)注數(shù)字化和智能化。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @數(shù)智前線(xiàn) 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!