AI大模型技術(shù)層行業(yè)分析(三)萬字解析

0 評(píng)論 361 瀏覽 0 收藏 35 分鐘

從AI大模型架構(gòu)映射到產(chǎn)業(yè)鏈,本文是技術(shù)層的詳細(xì)分析,從宏觀角度,實(shí)現(xiàn)較為全面的分析拆解,但未對(duì)行業(yè)頭部公司和產(chǎn)品做產(chǎn)品分析和競(jìng)品分析,后續(xù)將單開文章做產(chǎn)品分析。

一、現(xiàn)狀分析

1.1 組成部分與市場(chǎng)參與者

在當(dāng)今快速發(fā)展的人工智能領(lǐng)域,AI大模型技術(shù)層的市場(chǎng)參與者構(gòu)成了一個(gè)多元化且相互依存的生態(tài)系統(tǒng)。這包括了提供底層通用大模型的算法基礎(chǔ)供應(yīng)商,他們開發(fā)開源和閉源模型,為AI技術(shù)的發(fā)展奠定基礎(chǔ)。同時(shí),專注于算法和模型研究的機(jī)構(gòu)不斷推動(dòng)技術(shù)邊界,為行業(yè)帶來創(chuàng)新。創(chuàng)作者生態(tài)中的框架供應(yīng)商、AI開發(fā)平臺(tái)供應(yīng)商和開源社區(qū)則為開發(fā)者提供了強(qiáng)大的工具和資源,促進(jìn)了AI技術(shù)的廣泛應(yīng)用和快速迭代。

綜上,市場(chǎng)參與者包括算法基礎(chǔ)方向,即底層通用大模型、相關(guān)算法/模型研究機(jī)構(gòu),以及創(chuàng)作者生態(tài),即框架供應(yīng)商、AI開發(fā)平臺(tái)供應(yīng)商、開源社區(qū)。

1.1.1 組成部分與市場(chǎng)參與者:

1)底層通用大模型:開源模型+閉源模型

AIGC底層通用大模型可分為開源和閉源,閉源模型一般通付費(fèi)的API或者有限的試用接口來訪問。閉源模型的優(yōu)勢(shì)在于前期投入成本低、運(yùn)行穩(wěn)定。國(guó)外閉源模型包括OPENAI的GPT模型、谷歌的PALM-E模型等。國(guó)內(nèi)閉源模型廠商起步較晚。

開源模型采用公開模型的源碼與數(shù)據(jù)集,任何人都可以查看或者修改源代碼。開源模型基于私有化部署擁有較高的數(shù)據(jù)隱私安全保障,并且迭代更新速度快。目前國(guó)內(nèi)互聯(lián)網(wǎng)大廠致力于開發(fā)跨模態(tài)大模型,如騰訊的混元AI和百度的文心大模型,都可進(jìn)行跨模態(tài)生成,但整體尚未普遍形成開源生態(tài),國(guó)外的開源模型開源大模型廠商中,Meta AI(Llama)、歐洲Mistral AI(Mistral)、 Google(Gemma)等廠商的大模型性能保持前列。

2)相關(guān)算法/模型研究機(jī)構(gòu)

定義

相關(guān)算法 / 模型研究機(jī)構(gòu)主要是從事人工智能、機(jī)器學(xué)習(xí)、自然語言處理等相關(guān)算法和模型架構(gòu)研究的組織。它們由學(xué)術(shù)界和產(chǎn)業(yè)界的專家組成,通過開展基礎(chǔ)研究和應(yīng)用研究,探索新的技術(shù)和方法,為 AIGC 領(lǐng)域的發(fā)展提供理論支持和創(chuàng)新思路。

頭部知名領(lǐng)先廠商介紹

  • 斯坦福大學(xué)人工智能實(shí)驗(yàn)室:在人工智能基礎(chǔ)研究方面處于世界領(lǐng)先地位。在算法創(chuàng)新、模型架構(gòu)探索等領(lǐng)域成果豐碩,其研究成果經(jīng)常被應(yīng)用于自然語言處理、計(jì)算機(jī)視覺等 AIGC 相關(guān)領(lǐng)域,對(duì)全球 AIGC 技術(shù)的發(fā)展方向有重要的引領(lǐng)作用。
  • 麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室:匯聚了頂尖的科研人才,在機(jī)器學(xué)習(xí)算法優(yōu)化、復(fù)雜模型架構(gòu)開發(fā)等方面有突出貢獻(xiàn)。與眾多科技企業(yè)有緊密合作,推動(dòng)了學(xué)術(shù)成果的商業(yè)化應(yīng)用,為 AIGC 技術(shù)的工程化提供了關(guān)鍵支持。
  • 清華大學(xué)人工智能研究院:國(guó)內(nèi)頂尖的人工智能研究機(jī)構(gòu),在自然語言理解、計(jì)算機(jī)視覺等多個(gè) AIGC 細(xì)分領(lǐng)域開展深入研究。與國(guó)內(nèi)企業(yè)合作緊密,促進(jìn)了產(chǎn)學(xué)研結(jié)合,在推動(dòng)中國(guó) AIGC 技術(shù)的自主研發(fā)和應(yīng)用方面發(fā)揮了重要作用。

3)框架供應(yīng)商

定義

機(jī)器學(xué)習(xí)框架是為 AI 開發(fā)提供工具和庫的軟件,它們幫助開發(fā)人員更方便地構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。簡(jiǎn)化了原始算法的核心細(xì)節(jié),并提供了一種端到端的機(jī)器學(xué)習(xí)開發(fā)流程,還包括數(shù)據(jù)分析、模型評(píng)估、性能優(yōu)化以及對(duì)復(fù)雜硬件的運(yùn)行支持。

頭部知名領(lǐng)先廠商介紹

  • PyTorch(Meta 開發(fā)):在全球擁有較高的使用率,約 34%。其以動(dòng)態(tài)計(jì)算圖等特點(diǎn)受到開發(fā)者歡迎,在學(xué)術(shù)研究和工業(yè)界都有廣泛應(yīng)用,尤其是在自然語言處理和計(jì)算機(jī)視覺領(lǐng)域,許多先進(jìn)的模型都是基于 PyTorch 開發(fā)的。
  • Tensorflow(谷歌開發(fā)):使用率約 30%,是一個(gè)成熟的機(jī)器學(xué)習(xí)框架。具有高度的靈活性和可擴(kuò)展性,支持多種硬件平臺(tái),被廣泛應(yīng)用于大規(guī)模數(shù)據(jù)處理和復(fù)雜模型訓(xùn)練,在分布式訓(xùn)練等場(chǎng)景表現(xiàn)出色。
  • 百度飛槳:國(guó)內(nèi)使用率為 12%,是百度推出的深度學(xué)習(xí)平臺(tái)。為開發(fā)者提供了豐富的工具和模型庫,在自然語言處理和圖像識(shí)別等領(lǐng)域有良好的性能表現(xiàn),同時(shí)積極推動(dòng)本地化服務(wù),促進(jìn)國(guó)內(nèi) AIGC 產(chǎn)業(yè)的發(fā)展。
  • 華為昇思:使用率 12%,是華為自主研發(fā)的深度學(xué)習(xí)框架。在模型并行和分布式訓(xùn)練等方面有技術(shù)優(yōu)勢(shì),與華為的硬件生態(tài)緊密結(jié)合,為企業(yè)級(jí)用戶提供了高效、安全的開發(fā)解決方案,尤其在工業(yè)物聯(lián)網(wǎng)等領(lǐng)域有廣闊的應(yīng)用前景。

4)AI開發(fā)平臺(tái)供應(yīng)商

定義

AI 開發(fā)平臺(tái)為各行各業(yè)提供一站式的 AI 全流程開發(fā)服務(wù),通過集成數(shù)據(jù)標(biāo)注、模型匹配搭建、模型訓(xùn)練評(píng)估、在線模型等多個(gè)技術(shù)能力點(diǎn),為開發(fā)者提供便捷、靈活、穩(wěn)定和高效的開發(fā)環(huán)境,并降低 AI 應(yīng)用開發(fā)的門檻。

頭部知名領(lǐng)先廠商介紹

  • 國(guó)內(nèi)大型科技企業(yè)開發(fā)平臺(tái):像百度、阿里等國(guó)內(nèi)大型科技企業(yè)推出的 AI 開發(fā)平臺(tái),憑借其強(qiáng)大的技術(shù)實(shí)力和數(shù)據(jù)資源,為企業(yè)用戶提供全面的服務(wù)。這些平臺(tái)在大數(shù)據(jù)處理、模型訓(xùn)練效率等方面有優(yōu)勢(shì),并且可以與企業(yè)自身的其他業(yè)務(wù)系統(tǒng)集成,提供端到端的解決方案。
  • 專業(yè) AI 開發(fā)平臺(tái)廠商:有一些專注于 AI 開發(fā)平臺(tái)的廠商,它們通過不斷優(yōu)化平臺(tái)功能,如提供更好的自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)工具、更友好的用戶界面等,吸引了眾多開發(fā)者。這些廠商在特定領(lǐng)域,如中小企業(yè)市場(chǎng)或者特定行業(yè)的開發(fā)者群體中有較高的知名度。

從開發(fā)模式來看,國(guó)內(nèi)大學(xué)、科研機(jī)構(gòu)、企業(yè)等不同創(chuàng)新主體積極參與大模型研發(fā)。我國(guó)參數(shù)規(guī)模在10億以上的79個(gè)大模型中,企業(yè)、高校/科研機(jī)構(gòu)、校企聯(lián)合研發(fā)的數(shù)量分別為36個(gè)、29個(gè)、14個(gè),分別占比45.57%、36.71%、17.72%,學(xué)術(shù)界與產(chǎn)業(yè)界之間的聯(lián)合開發(fā)仍有較大發(fā)展空間。

5)開源社區(qū)

定義

開源社區(qū)是一個(gè)開放的、由開發(fā)者自愿參與的社區(qū),為 AIGC 開發(fā)者提供了一個(gè)交流和合作的平臺(tái)。在這里,開發(fā)者可以分享代碼、經(jīng)驗(yàn)和見解,也可以獲取開源的 AIGC 項(xiàng)目和工具,如開源的大模型、機(jī)器學(xué)習(xí)框架、數(shù)據(jù)標(biāo)注工具等。

頭部知名領(lǐng)先廠商介紹

  • GitHub:是全球最大的開源代碼托管平臺(tái),幾乎涵蓋了所有的 AIGC 相關(guān)開源項(xiàng)目。眾多知名的開源模型和框架都在 GitHub 上發(fā)布和維護(hù),吸引了全球開發(fā)者參與貢獻(xiàn)。通過提供代碼管理、協(xié)作開發(fā)等功能,為 AIGC 開源生態(tài)的發(fā)展提供了基礎(chǔ)設(shè)施。
  • 國(guó)內(nèi)開源社區(qū)(如 Gitee 等):在國(guó)內(nèi)也有一定的影響力,為國(guó)內(nèi)開發(fā)者提供了本地化的開源交流平臺(tái)。雖然在規(guī)模和國(guó)際影響力上可能不如 GitHub,但在推動(dòng)國(guó)內(nèi) AIGC 開源項(xiàng)目的發(fā)展、促進(jìn)國(guó)內(nèi)開發(fā)者之間的交流等方面發(fā)揮了重要作用。

1.2 商業(yè)模式

1.2.1 算法基礎(chǔ)商業(yè)模式

  • 付費(fèi)API服務(wù):提供閉源模型API,按使用量收費(fèi),如OpenAI的GPT模型。
  • 試用與增值服務(wù):提供有限免費(fèi)試用,后續(xù)推出付費(fèi)高級(jí)版本,如圖像識(shí)別模型。
  • 開源服務(wù)收費(fèi):基于開源軟件提供專業(yè)服務(wù),如TensorFlow的模型優(yōu)化服務(wù)。
  • 企業(yè)發(fā)行版:基于開源軟件提供差異化的企業(yè)版,如Red Hat的Linux發(fā)行版。
  • 云服務(wù):在云上部署開源軟件,用戶按使用付費(fèi),如阿里云的AI服務(wù)。
  • 生態(tài)流量變現(xiàn):通過開源系統(tǒng)吸引用戶,再通過廣告等方式變現(xiàn),如谷歌的安卓系統(tǒng)。

1.2.2 相關(guān)算法 / 模型研究機(jī)構(gòu)商業(yè)模式

  • 項(xiàng)目合作:與企業(yè)合作開發(fā)特定算法,收取研發(fā)費(fèi)用。
  • 技術(shù)轉(zhuǎn)讓:將算法知識(shí)產(chǎn)權(quán)轉(zhuǎn)讓給企業(yè),獲取一次性費(fèi)用或分成。
  • 咨詢服務(wù):為企業(yè)提供算法和模型方面的咨詢服務(wù)。

1.2.3?框架供應(yīng)商商業(yè)模式

  • 授權(quán)收費(fèi):將框架授權(quán)給企業(yè)使用,按授權(quán)范圍收費(fèi),如百度飛槳框架。
  • 定制開發(fā):根據(jù)客戶需求定制框架,收取定制費(fèi)用。
  • 技術(shù)支持與維護(hù):提供技術(shù)支持和維護(hù)服務(wù),收取服務(wù)費(fèi)用。

1.2.4 AI 開發(fā)平臺(tái)供應(yīng)商商業(yè)模式

  • 平臺(tái)訂閱:提供平臺(tái)訂閱服務(wù),用戶按訂閱時(shí)長(zhǎng)付費(fèi)。
  • 資源付費(fèi):用戶按使用的計(jì)算和存儲(chǔ)資源付費(fèi),如Azure Machine Learning平臺(tái)。

1.2.5 開源社區(qū)商業(yè)模式

  • 增值服務(wù):提供高級(jí)技術(shù)支持、培訓(xùn)等付費(fèi)服務(wù)。
  • 廣告:通過項(xiàng)目受眾向廣告商推銷,獲取廣告收入。

1.3. 主流算法

1.3.1 人工智能&機(jī)器學(xué)習(xí)&深度學(xué)習(xí)&強(qiáng)化學(xué)習(xí):包含關(guān)系

1)人工智能&機(jī)器學(xué)習(xí)&深度學(xué)習(xí)&強(qiáng)化學(xué)習(xí)的特征與關(guān)系

? 人工智能(Artificial Intelligence,AI):人工智能是一門研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的綜合性學(xué)科。它旨在讓計(jì)算機(jī)系統(tǒng)能夠像人類一樣進(jìn)行感知、理解、學(xué)習(xí)、推理和決策等智能行為。

? 機(jī)器學(xué)習(xí)(Machine Learning,ML):機(jī)器學(xué)習(xí)是人工智能的一個(gè)重要分支,它是一門讓計(jì)算機(jī)系統(tǒng)通過數(shù)據(jù)和經(jīng)驗(yàn)自動(dòng)學(xué)習(xí)和改進(jìn)性能的學(xué)科。機(jī)器學(xué)習(xí)方法包括但不限于線性回歸、邏輯回歸、決策樹、支持向量機(jī)、貝葉斯模型等,其核心是通過優(yōu)化算法從數(shù)據(jù)中挖掘規(guī)律,以實(shí)現(xiàn)對(duì)未知數(shù)據(jù)的預(yù)測(cè)和決策。

? 深度學(xué)習(xí)(Deep Learning,DL):深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,它主要運(yùn)用深度神經(jīng)網(wǎng)絡(luò)(如深度神經(jīng)網(wǎng)絡(luò) DNN、卷積神經(jīng)網(wǎng)絡(luò) CNN、遞歸神經(jīng)網(wǎng)絡(luò) RNN、長(zhǎng)短期記憶網(wǎng)絡(luò) LSTM、生成對(duì)抗網(wǎng)絡(luò) GAN、遷移學(xué)習(xí)、注意力模型等)作為參數(shù)結(jié)構(gòu)進(jìn)行優(yōu)化的一類機(jī)器學(xué)習(xí)算法。深度學(xué)習(xí)在圖像處理、自然語言處理、語音識(shí)別等領(lǐng)域取得了巨大的成功。深度學(xué)習(xí)通常需要大量有標(biāo)簽的數(shù)據(jù)進(jìn)行訓(xùn)練,以學(xué)習(xí)數(shù)據(jù)中的特征和模式,從而實(shí)現(xiàn)對(duì)新數(shù)據(jù)的準(zhǔn)確預(yù)測(cè)和分類。

? 強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL):強(qiáng)化學(xué)習(xí)也是機(jī)器學(xué)習(xí)的一個(gè)重要分支,它是一種通過智能體與環(huán)境不斷交互,以獲得最大累積獎(jiǎng)勵(lì)為目標(biāo)的學(xué)習(xí)方法。與深度學(xué)習(xí)不同,強(qiáng)化學(xué)習(xí)通常不需要大量有標(biāo)簽的數(shù)據(jù),而是通過智能體在環(huán)境中的探索和實(shí)踐來學(xué)習(xí)最優(yōu)策略。強(qiáng)化學(xué)習(xí)在動(dòng)態(tài)環(huán)境中的決策問題上具有獨(dú)特的優(yōu)勢(shì),例如機(jī)器人控制、游戲智能體、自動(dòng)駕駛等領(lǐng)域。強(qiáng)化學(xué)習(xí)的過程是智能體根據(jù)當(dāng)前環(huán)境狀態(tài)選擇動(dòng)作,環(huán)境反饋獎(jiǎng)勵(lì)信號(hào),智能體根據(jù)獎(jiǎng)勵(lì)信號(hào)調(diào)整策略,不斷循環(huán)以提高性能。

? 深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL):深度強(qiáng)化學(xué)習(xí)是將深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相結(jié)合的一種機(jī)器學(xué)習(xí)方法。它利用深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的函數(shù)逼近能力來處理強(qiáng)化學(xué)習(xí)中的復(fù)雜問題,例如高維狀態(tài)空間和動(dòng)作空間的表示和學(xué)習(xí)。深度強(qiáng)化學(xué)習(xí)在一些具有挑戰(zhàn)性的任務(wù)中取得了顯著的成果,如復(fù)雜游戲的通關(guān)、機(jī)器人的自主學(xué)習(xí)和控制等。

2)機(jī)器學(xué)習(xí)的分類

機(jī)器學(xué)習(xí)按照任務(wù)目標(biāo)、訓(xùn)練方法、學(xué)習(xí)算法維度,可以分為如下幾類。

1.3.1.2.1 任務(wù)目標(biāo)維度

1.3.1.2.2 訓(xùn)練方法維度

1.3.1.2.3 學(xué)習(xí)算法維度

3)深度學(xué)習(xí)相關(guān)算法

4)強(qiáng)化學(xué)習(xí)相關(guān)算法

深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning):

將深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)相結(jié)合。

通過智能體與環(huán)境的交互,學(xué)習(xí)最優(yōu)的決策策略。

在大模型中,可以用于游戲、機(jī)器人控制等領(lǐng)域。例如在圍棋游戲中,通過自我對(duì)弈和不斷學(xué)習(xí),能夠達(dá)到超人類的水平。

策略梯度算法(Policy Gradient):

一種常用的深度強(qiáng)化學(xué)習(xí)算法。

通過優(yōu)化策略網(wǎng)絡(luò),使智能體能夠獲得更高的累計(jì)獎(jiǎng)勵(lì)。

在大模型中,可用于優(yōu)化復(fù)雜系統(tǒng)的控制策略。例如在自動(dòng)駕駛中,通過學(xué)習(xí)最優(yōu)的駕駛策略,提高行駛的安全性和效率。

1.3.2 監(jiān)督學(xué)習(xí)VS無監(jiān)督學(xué)習(xí):互斥關(guān)系

監(jiān)督學(xué)習(xí)特征:監(jiān)督學(xué)習(xí)的特點(diǎn)是訓(xùn)練數(shù)據(jù)需要進(jìn)行標(biāo)注,特征識(shí)別人工輔助識(shí)別。就像學(xué)生在學(xué)校里上課,老師會(huì)明確給出每個(gè)問題的正確答案。在監(jiān)督學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)帶有標(biāo)注,相當(dāng)于老師給出的答案,特征識(shí)別人工輔助識(shí)別就如同老師引導(dǎo)學(xué)生認(rèn)識(shí)不同問題的關(guān)鍵特征。

比如,你想訓(xùn)練一個(gè)能分辨蘋果和橘子的模型。那你就得先準(zhǔn)備好多張?zhí)O果和橘子的照片,然后把蘋果的照片都放在一個(gè)標(biāo)著 “蘋果” 的盒子里,橘子的照片放在標(biāo)著 “橘子” 的盒子里。這里,“蘋果” 和 “橘子” 這兩個(gè)盒子的名字就相當(dāng)于數(shù)據(jù)的標(biāo)注或者標(biāo)簽,而里面的照片就是訓(xùn)練數(shù)據(jù)。這個(gè)過程就像老師告訴你哪些題的答案是對(duì)的,哪些是錯(cuò)的。然后模型就會(huì)根據(jù)這些標(biāo)簽去仔細(xì)觀察照片里水果的特征,比如蘋果是紅紅的、圓圓的,橘子是橙色的、有點(diǎn)扁圓形的。慢慢地,模型就學(xué)會(huì)了怎么分辨蘋果和橘子啦。

監(jiān)督學(xué)習(xí)訓(xùn)練流程:

? 首先,收集大量帶有標(biāo)注的訓(xùn)練數(shù)據(jù)。這些數(shù)據(jù)可以來自各種來源,如人工標(biāo)注的數(shù)據(jù)集、歷史記錄等。

? 然后,選擇合適的監(jiān)督學(xué)習(xí)算法,如決策樹、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等。

? 將標(biāo)注好的訓(xùn)練數(shù)據(jù)輸入到算法中,算法通過學(xué)習(xí)數(shù)據(jù)的特征和對(duì)應(yīng)的標(biāo)簽之間的關(guān)系,調(diào)整模型的參數(shù),以最小化預(yù)測(cè)誤差。

? 在訓(xùn)練過程中,通常會(huì)將數(shù)據(jù)集分為訓(xùn)練集和驗(yàn)證集。訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于評(píng)估模型在未見過的數(shù)據(jù)上的性能,以便調(diào)整超參數(shù)和防止過擬合。

? 經(jīng)過多次迭代訓(xùn)練,當(dāng)模型在驗(yàn)證集上的性能達(dá)到滿意程度時(shí),訓(xùn)練過程結(jié)束。

無監(jiān)督特征:無監(jiān)督學(xué)習(xí)的特點(diǎn)是不需要給數(shù)據(jù)進(jìn)行標(biāo)注,特征識(shí)別機(jī)器自主識(shí)別。好比一個(gè)人在圖書館自由探索書籍,沒有特定的任務(wù)或答案。無監(jiān)督學(xué)習(xí)不需要數(shù)據(jù)標(biāo)注,特征由機(jī)器自主識(shí)別就像這個(gè)人自己在書籍中發(fā)現(xiàn)不同的主題和模式。

比如,無監(jiān)督學(xué)習(xí)就像你走進(jìn)一個(gè)雜亂的圖書館,里面有各種各樣的書,但是沒有任何分類標(biāo)簽。有人給你一大堆不同主題的書混在一起,沒有告訴你哪些是小說、哪些是傳記、哪些是科普書籍等。這時(shí)候,模型就得像你在圖書館整理書籍一樣自己想辦法去分類。模型可能會(huì)發(fā)現(xiàn)有些書文字很生動(dòng)、有很多虛構(gòu)的情節(jié),于是把它們歸為一類,雖然一開始不知道這具體是啥類。接著,模型又可能發(fā)現(xiàn)有些書有很多專業(yè)術(shù)語和圖表,就把它們分成另一類。但模型還是不知道這些類別具體叫啥名字。沒有明確的目標(biāo),全靠自己去發(fā)現(xiàn)規(guī)律和特點(diǎn)進(jìn)行分類。

無監(jiān)督學(xué)習(xí)訓(xùn)練流程:

? 收集大量無標(biāo)注的原始數(shù)據(jù)。這些數(shù)據(jù)可以是各種類型的,如文本、圖像、音頻等。

? 選擇合適的無監(jiān)督學(xué)習(xí)算法,如 K-Means 聚類、主成分分析(PCA)、自編碼器等。

? 將無標(biāo)注的數(shù)據(jù)輸入到算法中,算法根據(jù)數(shù)據(jù)的內(nèi)在特征進(jìn)行學(xué)習(xí)。例如,K-Means 聚類算法會(huì)自動(dòng)將數(shù)據(jù)分成不同的簇,使得同一個(gè)簇內(nèi)的數(shù)據(jù)具有較高的相似性,不同簇之間的數(shù)據(jù)具有較大的差異。

? 在訓(xùn)練過程中,通常不需要?jiǎng)澐钟?xùn)練集和驗(yàn)證集,而是通過評(píng)估算法在數(shù)據(jù)上的內(nèi)部一致性或其他指標(biāo)來判斷模型的性能。

? 經(jīng)過多次迭代,當(dāng)算法達(dá)到穩(wěn)定狀態(tài)或滿足一定的停止條件時(shí),訓(xùn)練過程結(jié)束。

1.4. AI大模型的相關(guān)算法

在此不是想單列出ai大模型涉及哪些算法,而是想從ai大模型的開發(fā)流程和應(yīng)用,識(shí)別在開發(fā)流程和應(yīng)用中,ai大模型分別涉及什么算法,且明確哪些算法在開發(fā)流程和應(yīng)用中是主流。

1.4.1 開發(fā)流程

1. 數(shù)據(jù)收集與預(yù)處理:數(shù)據(jù)清洗算法(去除噪聲、異常值等)、數(shù)據(jù)采樣算法(平衡數(shù)據(jù)集)。

2. 模型選擇與構(gòu)建:Transformer 架構(gòu)相關(guān)算法(自注意力機(jī)制、多頭注意力機(jī)制等)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)用于計(jì)算機(jī)視覺任務(wù)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及其變體(LSTM、GRU)用于序列數(shù)據(jù)處理。

3. 模型訓(xùn)練與測(cè)試:

  • 預(yù)訓(xùn)練階段:無監(jiān)督學(xué)習(xí)算法如掩碼語言模型(BERT、RoBERTa 等)
  • 微調(diào)階段:監(jiān)督學(xué)習(xí)算法,包括最小二乘法、隨機(jī)梯度下降法等優(yōu)化算法在預(yù)訓(xùn)練模型基礎(chǔ)上針對(duì)特定任務(wù)進(jìn)行微調(diào),還可能涉及到遷移學(xué)習(xí)相關(guān)算法,如特征提取后進(jìn)行特定任務(wù)層的訓(xùn)練。
  • 獎(jiǎng)勵(lì)建模階段:基于規(guī)則的獎(jiǎng)勵(lì)分配、基于價(jià)值函數(shù)的獎(jiǎng)勵(lì)估計(jì)(如深度 Q 網(wǎng)絡(luò)等強(qiáng)化學(xué)習(xí)算法可用于估計(jì)價(jià)值函數(shù)從而輔助獎(jiǎng)勵(lì)建模)、基于機(jī)器學(xué)習(xí)的獎(jiǎng)勵(lì)模型(如使用神經(jīng)網(wǎng)絡(luò)構(gòu)建獎(jiǎng)勵(lì)預(yù)測(cè)模型)。
  • 強(qiáng)化學(xué)習(xí)微調(diào)階段:策略梯度算法(如 REINFORCE 算法)、近端策略優(yōu)化算法(PPO)、深度確定性策略梯度算法(DDPG)、軟 actor-critic(SAC)算法等。

4. 上線與部署:模型壓縮算法(剪枝、量化等)、模型優(yōu)化算法(針對(duì)特定硬件平臺(tái)進(jìn)行優(yōu)化)。

1.4.2 應(yīng)用

1. 計(jì)算機(jī)視覺:CNN、生成對(duì)抗網(wǎng)絡(luò)(GAN)用于圖像生成、目標(biāo)檢測(cè)算法等。

2. 語音識(shí)別:RNN 及其變體(LSTM、GRU)、卷積神經(jīng)網(wǎng)絡(luò)與循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)合的架構(gòu)。

3. 語音合成:算法:WaveNet、Tacotron 等。主流算法:Tacotron 及其改進(jìn)版本在語音合成中較為常用。

4. 認(rèn)證能力:知識(shí)圖譜構(gòu)建算法(如基于規(guī)則的抽取、基于機(jī)器學(xué)習(xí)的抽取等)、自然語言推理算法(如 Transformer 架構(gòu)在文本推理中的應(yīng)用等)等。

5. 創(chuàng)造能力:生成對(duì)抗網(wǎng)絡(luò)(GAN)、變分自編碼器(VAE)等生成模型。

二、趨勢(shì)分析(技術(shù)趨勢(shì)、商業(yè)趨勢(shì))

2.1 技術(shù)趨勢(shì)

2.1.1 算法方面

1. 注意力機(jī)制:

o 自注意力機(jī)制成功應(yīng)用于 Transformer 架構(gòu),未來會(huì)有更復(fù)雜高效的變體,探索多模態(tài)跨模態(tài)注意力以融合不同信息。多頭注意力機(jī)制將繼續(xù)發(fā)展,出現(xiàn)更多組合方式和更精細(xì)子空間劃分,增強(qiáng)模型表達(dá)能力和適應(yīng)性。

2. 預(yù)訓(xùn)練與微調(diào):

o 預(yù)訓(xùn)練方法不斷改進(jìn),利用大規(guī)模未標(biāo)注數(shù)據(jù),出現(xiàn)新自監(jiān)督學(xué)習(xí)任務(wù)和預(yù)訓(xùn)練目標(biāo)。微調(diào)更智能化高效化,自動(dòng)選擇策略和優(yōu)化超參數(shù),提高特定任務(wù)性能和泛化能力。

3. 網(wǎng)絡(luò)結(jié)構(gòu):

o 殘差連接在深層網(wǎng)絡(luò)中持續(xù)發(fā)揮作用,可能出現(xiàn)新連接方式和架構(gòu)設(shè)計(jì),解決深層網(wǎng)絡(luò)訓(xùn)練問題,提高學(xué)習(xí)效率。歸一化技術(shù)不斷發(fā)展,出現(xiàn)新方法適應(yīng)不同數(shù)據(jù)和任務(wù),穩(wěn)定訓(xùn)練過程,改善模型性能。

4. 位置編碼:

o 對(duì)語言模型理解序列位置信息至關(guān)重要,未來會(huì)有更靈活有效的方式,適應(yīng)不同長(zhǎng)度和類型序列數(shù)據(jù),并可能與其他技術(shù)結(jié)合,提高模型對(duì)位置信息的利用能力。

5. 優(yōu)化算法:

o 自適應(yīng)學(xué)習(xí)率算法如 Adam、RMSprop 等繼續(xù)優(yōu)化,適應(yīng)不同模型和任務(wù),可能出現(xiàn)新優(yōu)化算法,提高收斂速度和訓(xùn)練效率。還可能與其他技術(shù)結(jié)合,提高模型性能和穩(wěn)定性。

6. 正則化技術(shù):

o Dropout 和權(quán)重衰減等正則化技術(shù)繼續(xù)防止過擬合,可能出現(xiàn)新方法適應(yīng)大規(guī)模模型訓(xùn)練,與其他技術(shù)結(jié)合提高模型泛化能力和效率。

7. 無監(jiān)督學(xué)習(xí):

o 降噪自編碼器和生成對(duì)抗網(wǎng)絡(luò)等無監(jiān)督學(xué)習(xí)技術(shù)在大模型訓(xùn)練中更廣泛應(yīng)用,利用未標(biāo)注數(shù)據(jù)學(xué)習(xí)有用特征和表示,與監(jiān)督學(xué)習(xí)結(jié)合形成半監(jiān)督學(xué)習(xí)方法,提高有限標(biāo)注數(shù)據(jù)下性能。

8. 動(dòng)態(tài)掩碼:

o 語言模型訓(xùn)練中提高上下文信息學(xué)習(xí)能力,未來會(huì)有更智能高效的動(dòng)態(tài)掩碼策略,適應(yīng)不同任務(wù)和數(shù)據(jù)。

2.1.2 開發(fā)框架方面

1. 易用集成:

o 注重提供高度集成工具和接口,如預(yù)訓(xùn)練模型庫、自動(dòng)化微調(diào)工具、可視化調(diào)試界面等,簡(jiǎn)化配置和調(diào)參過程,通過自動(dòng)化工具和智能推薦系統(tǒng)提高開發(fā)效率。

2. 分布式支持:

o 支持分布式訓(xùn)練,提供高效并行計(jì)算能力和通信機(jī)制,包括分布式數(shù)據(jù)加載、模型并行和數(shù)據(jù)并行等技術(shù),滿足大模型訓(xùn)練需求。在部署方面支持不同平臺(tái)和環(huán)境,提供優(yōu)化方案和工具。

3. 多語言跨平臺(tái):

o 支持更多編程語言,在不同操作系統(tǒng)和硬件平臺(tái)上運(yùn)行,提供跨平臺(tái)兼容性和可移植性,方便開發(fā)者在不同環(huán)境中開發(fā)和部署,提高開發(fā)效率和模型可用性。

4. 可解釋性工具:

o 隨著大模型在關(guān)鍵領(lǐng)域應(yīng)用增加,提供更多工具和技術(shù)幫助理解模型決策過程和內(nèi)部工作機(jī)制,如可視化工具展示注意力分布和中間層特征表示,提高模型可信度和可靠性。

2.2 商業(yè)化趨勢(shì)

2.2.1 算法基礎(chǔ)商業(yè)化模式

趨勢(shì)說明:

  • 專業(yè)化和細(xì)分化:隨著各行業(yè)對(duì)人工智能應(yīng)用的需求不斷深入,創(chuàng)業(yè)者專注于特定領(lǐng)域開發(fā)應(yīng)用軟件,能更好地滿足行業(yè)特定需求,提高市場(chǎng)競(jìng)爭(zhēng)力。
  • 多技術(shù)融合:結(jié)合多種技術(shù)可以為用戶提供更全面、高效的解決方案,拓展應(yīng)用場(chǎng)景和提升用戶體驗(yàn)。
  • 持續(xù)創(chuàng)新:人工智能技術(shù)發(fā)展迅速,不斷推出新功能和服務(wù)能保持產(chǎn)品的競(jìng)爭(zhēng)力,吸引用戶并滿足不斷變化的市場(chǎng)需求。

案例:

  • 以醫(yī)療領(lǐng)域的人工智能創(chuàng)業(yè)公司為例,據(jù)統(tǒng)計(jì),專注于醫(yī)學(xué)影像診斷的人工智能軟件市場(chǎng)規(guī)模在過去幾年中以每年超過 30% 的速度增長(zhǎng)。這些軟件通過深度學(xué)習(xí)算法對(duì)醫(yī)學(xué)影像進(jìn)行分析,為醫(yī)生提供輔助診斷,提高診斷準(zhǔn)確性和效率。
  • 某智能家居應(yīng)用軟件結(jié)合了人工智能、物聯(lián)網(wǎng)和語音識(shí)別技術(shù),用戶可以通過語音指令控制家中的各種設(shè)備,如燈光、電器等。該軟件推出后,受到了消費(fèi)者的廣泛歡迎,市場(chǎng)占有率不斷提高。

2.2.2 相關(guān)算法 / 模型研究機(jī)構(gòu)商業(yè)化模式

趨勢(shì)說明:

  • 深度定制服務(wù):企業(yè)通常有獨(dú)特的業(yè)務(wù)需求和數(shù)據(jù)特點(diǎn),研究機(jī)構(gòu)提供定制化的算法和模型解決方案,能更好地滿足企業(yè)需求,提高應(yīng)用效果。
  • 技術(shù)引領(lǐng):持續(xù)進(jìn)行前沿技術(shù)研究可以為企業(yè)提供最新的技術(shù)支持,幫助企業(yè)在競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì)。
  • 跨領(lǐng)域合作:不同領(lǐng)域的知識(shí)和技術(shù)融合可以創(chuàng)造新的應(yīng)用場(chǎng)景和商業(yè)機(jī)會(huì)。

案例:

  • 一家知名的算法研究機(jī)構(gòu)為某大型金融企業(yè)定制了一套風(fēng)險(xiǎn)評(píng)估模型,根據(jù)企業(yè)的歷史數(shù)據(jù)和業(yè)務(wù)特點(diǎn)進(jìn)行優(yōu)化,幫助企業(yè)降低了風(fēng)險(xiǎn)評(píng)估的誤差率,提高了決策的準(zhǔn)確性。該項(xiàng)目為研究機(jī)構(gòu)帶來了可觀的收入。
  • 某人工智能研究機(jī)構(gòu)與汽車制造企業(yè)合作,將人工智能算法應(yīng)用于自動(dòng)駕駛技術(shù)的研發(fā)。通過跨領(lǐng)域合作,雙方共同攻克了多項(xiàng)技術(shù)難題,推動(dòng)了自動(dòng)駕駛技術(shù)的發(fā)展。

2.2.3 框架供應(yīng)商商業(yè)化模式

趨勢(shì)說明:

  • 生態(tài)協(xié)同發(fā)展:吸引更多的開發(fā)者、供應(yīng)商和合作伙伴加入生態(tài)系統(tǒng),可以豐富框架的功能和應(yīng)用場(chǎng)景,提高框架的競(jìng)爭(zhēng)力。
  • 智能化升級(jí):不斷提升框架的智能化水平,提供更高效、便捷的開發(fā)工具和服務(wù),可以吸引更多的開發(fā)者使用框架,促進(jìn)框架的發(fā)展。
  • 行業(yè)拓展:將框架應(yīng)用拓展到更多的行業(yè)領(lǐng)域,可以擴(kuò)大市場(chǎng)份額,提高框架的影響力。

案例:

  • 某人工智能框架供應(yīng)商建立了開放的生態(tài)系統(tǒng),吸引了數(shù)千名開發(fā)者和數(shù)十家合作伙伴參與。通過生態(tài)系統(tǒng)的協(xié)同發(fā)展,該框架的功能不斷豐富,應(yīng)用場(chǎng)景不斷拓展,市場(chǎng)占有率不斷提高。
  • 一家框架供應(yīng)商推出了智能化的開發(fā)工具,能夠自動(dòng)優(yōu)化算法模型的性能,提高開發(fā)效率。該工具受到了開發(fā)者的廣泛歡迎,推動(dòng)了框架的應(yīng)用和發(fā)展。

2.2.4 AI 開發(fā)平臺(tái)供應(yīng)商商業(yè)化模式

趨勢(shì)說明:

  • 增值服務(wù)多元化:提供豐富多樣的增值服務(wù)可以滿足不同用戶的需求,增加收入來源,提高用戶粘性。
  • 數(shù)據(jù)驅(qū)動(dòng)決策:利用平臺(tái)數(shù)據(jù)為用戶提供數(shù)據(jù)分析和洞察服務(wù),可以幫助用戶更好地了解市場(chǎng)和用戶需求,做出更明智的決策。
  • 合作共贏:與第三方開發(fā)者和供應(yīng)商深度合作,可以共同打造優(yōu)質(zhì)的人工智能生態(tài),提高平臺(tái)的競(jìng)爭(zhēng)力。

案例:

  • 某 AI 開發(fā)平臺(tái)供應(yīng)商提供了高級(jí)算法庫、定制化開發(fā)服務(wù)和數(shù)據(jù)分析服務(wù)等多種增值服務(wù)。這些服務(wù)為平臺(tái)帶來了額外的收入,同時(shí)提高了用戶的滿意度和粘性。
  • 一家 AI 開發(fā)平臺(tái)與數(shù)據(jù)標(biāo)注公司合作,為用戶提供高質(zhì)量的數(shù)據(jù)標(biāo)注服務(wù)。通過合作,雙方共同拓展了市場(chǎng),實(shí)現(xiàn)了共贏。

2.2.5 開源社區(qū)商業(yè)化模式

趨勢(shì)說明:

  • 社區(qū)驅(qū)動(dòng)創(chuàng)新:依靠社區(qū)力量推動(dòng)技術(shù)創(chuàng)新和軟件發(fā)展,可以提高軟件的質(zhì)量和競(jìng)爭(zhēng)力,吸引更多的用戶和開發(fā)者參與。
  • 企業(yè)服務(wù)優(yōu)化:不斷完善企業(yè)級(jí)服務(wù),滿足企業(yè)用戶的專業(yè)需求,可以提高用戶滿意度,增加商業(yè)收入。
  • 合作生態(tài)拓展:與各類合作伙伴共同推廣開源軟件,可以擴(kuò)大軟件的影響力和用戶群體,促進(jìn)軟件的發(fā)展。

案例:

  • 某開源人工智能軟件社區(qū)通過社區(qū)成員的貢獻(xiàn),不斷推出新的功能和改進(jìn)。該軟件在全球范圍內(nèi)擁有數(shù)百萬用戶和開發(fā)者,成為了人工智能領(lǐng)域的重要開源項(xiàng)目。
  • 一家開源社區(qū)為企業(yè)用戶提供專業(yè)的技術(shù)支持和培訓(xùn)服務(wù)。這些服務(wù)受到了企業(yè)用戶的歡迎,為社區(qū)帶來了穩(wěn)定的商業(yè)收入。同時(shí),社區(qū)與硬件廠商、軟件開發(fā)商等合作伙伴共同推廣開源軟件,擴(kuò)大了軟件的影響力和用戶群體。

作者:Elaine.H ,公眾號(hào):H小姐的數(shù)字化雜貨鋪

本文由@Elaine.H 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!