你是上AI大模型的船,還是讀蘇東坡的詩(shī)?

0 評(píng)論 1034 瀏覽 1 收藏 19 分鐘

AI領(lǐng)域的從業(yè)者在接觸大模型時(shí),應(yīng)該學(xué)習(xí)哪些技術(shù)?想打造AI產(chǎn)品的同學(xué)或者想做大模型相關(guān)應(yīng)用的同學(xué),又該如何學(xué)習(xí)相關(guān)技術(shù)?這篇文章里,作者做了梳理和總結(jié),一起來(lái)看一下。

不少歷經(jīng)移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)者都有過(guò)輝煌的融資歷史,但他們現(xiàn)在的生活呢?我聽了幾個(gè)故事版本,那共同的特性是,他們白天是焦慮不安甚至恐懼的,夜深時(shí)他們才稍微安穩(wěn)下來(lái),因?yàn)榫凭驮?shī)意,仿佛還能沉醉在曾經(jīng)大廠、名校、下樓喝杯咖啡就融到資的幻覺(jué)里。對(duì)于人生巔峰時(shí)期腳本、高速生長(zhǎng)互聯(lián)網(wǎng)的留戀,多一秒鐘都是浪費(fèi),蘇東坡是一次不得志,后面次次不得志。時(shí)光有限,抓住機(jī)會(huì)趕緊上。

這次AIGC大模型技術(shù)和產(chǎn)品轉(zhuǎn)的快因?yàn)橛腥缦翧I-Infrustructure基礎(chǔ)。工程師已經(jīng)如火如荼的趕在AIGC大模型的道上了,產(chǎn)品經(jīng)理也得加油。

主動(dòng)改變是紅利,被動(dòng)改變是后退!

沒(méi)有基礎(chǔ)的同學(xué)抓緊看,AI-Infrastructure很重要.

本文主要講解AI領(lǐng)域從業(yè)者,在接觸AIGC大模型的時(shí)候,應(yīng)該學(xué)習(xí)哪些大模型有關(guān)的技術(shù),做大模型相關(guān)的應(yīng)用應(yīng)該學(xué)哪些技術(shù),如何學(xué)懂這些技術(shù),會(huì)遇到哪些問(wèn)題,如何解決問(wèn)題?

一、客戶需要AI大模型博得未來(lái)

我們一個(gè)連續(xù)創(chuàng)業(yè)者客戶是這樣回應(yīng)一個(gè)時(shí)代結(jié)束了:

“拿不到AI大模型的票,接下來(lái)的人生只能讀蘇東坡的詩(shī)”!

客戶說(shuō):”要開發(fā)得先咨詢和學(xué)習(xí)下面這么多AIGC大模型技術(shù),先請(qǐng)你們來(lái)企業(yè)實(shí)戰(zhàn)咨詢也一并給你們來(lái)開發(fā)吧,我們邊學(xué)邊問(wèn)。”,那么客戶究竟學(xué)了哪些AIGC大模型技術(shù)呢?下面一一道來(lái)。

二、AIGC和大模型擁有廣闊的應(yīng)用場(chǎng)景

人工智能生成內(nèi)容技術(shù)(AIGC)大模型有不同應(yīng)用場(chǎng)景??梢钥吹揭韵聭?yīng)用:

1)山姆奧特曼封神OpenAI Dev Day演講后開啟Iphone時(shí)刻的GPTs

https://www.gptshunter.com/

2)新聞和文章:AIGC可以用于生成新聞文章、評(píng)論文章、博客文章等

www.cnbluesource.com

3)廣告和營(yíng)銷:AIGC可以用于生成廣告文案、營(yíng)銷創(chuàng)意、社交媒體帖子等

www.chinaciaf.org

4)娛樂(lè)和游戲:AIGC可以用于生成電影、電視劇、動(dòng)畫、游戲等

m.tech.china.com

5)教育和培訓(xùn):AIGC可以用于生成課件、練習(xí)題、模擬測(cè)試等

www.chinaedu.net

6)科學(xué)和研究:AIGC可以用于生成實(shí)驗(yàn)報(bào)告、論文、數(shù)據(jù)分析等

6352484650069.huodongxing.com

7)個(gè)人和商業(yè)使用:AIGC可以用于生成個(gè)人作品、商業(yè)文檔等

https://item.m.jd.com/product/10067217658262.html?gx=RnAoFNnisLpgEx-KdwPoEfgeSQ&gxd=RnAokWcKbGeIyZFG_oN0WuHzhV8fcEw&ad_od=share&utm_source=androidapp&utm_medium=appshare&utm_campaign=t_335139774&utm_term=CopyURL

AIGC大模型技術(shù)具有廣闊的應(yīng)用前景,可以為我們的生活和工作帶來(lái)許多便利。

三、做AIGC大模型產(chǎn)品需要懂哪些技術(shù)?

1. PC互聯(lián)網(wǎng)主要是懂PC基礎(chǔ)技術(shù)架構(gòu)

如圖所示:PC互聯(lián)網(wǎng)的基礎(chǔ)技術(shù)架構(gòu)可以總結(jié)為以下幾點(diǎn):

1)客戶端技術(shù)

包括瀏覽器、搜索引擎等前端技術(shù),以及操作系統(tǒng)、硬件等用戶設(shè)備方面技術(shù)。主要技術(shù)有HTML/CSS/JavaScript、瀏覽器內(nèi)核、搜索算法等。

2)服務(wù)器端技術(shù)

包括web服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)等后臺(tái)技術(shù)。主要技術(shù)有Linux、Apache、Nginx、Tomcat、MySQL、Java等服務(wù)端編程語(yǔ)言和框架。

3)網(wǎng)絡(luò)技術(shù)

包括網(wǎng)絡(luò)協(xié)議、網(wǎng)絡(luò)設(shè)備等互聯(lián)網(wǎng)基礎(chǔ)設(shè)施方面技術(shù)。主要技術(shù)有TCP/IP、DNS、CDN、骨干網(wǎng)等。

4)數(shù)據(jù)技術(shù)

包括數(shù)據(jù)采集、處理、分析、挖掘、可視化等方面技術(shù)。主要技術(shù)有大數(shù)據(jù)處理框架、數(shù)據(jù)倉(cāng)庫(kù)、機(jī)器學(xué)習(xí)算法等。

5)語(yǔ)音和圖像技術(shù)

支持語(yǔ)音交互、圖像處理等多媒體應(yīng)用的技術(shù)。主要技術(shù)有語(yǔ)音識(shí)別、自然語(yǔ)言處理、圖形圖像算法等。

6)安全技術(shù)

包括網(wǎng)絡(luò)安全、數(shù)據(jù)安全方面的技術(shù)。主要技術(shù)有加密算法、身份認(rèn)證、安全審計(jì)等。

以上構(gòu)成了PC互聯(lián)網(wǎng)的核心基礎(chǔ)技術(shù)架構(gòu)。

2. 移動(dòng)互聯(lián)網(wǎng)主要是懂Mobile基礎(chǔ)技術(shù)架構(gòu)

如上圖所示:移動(dòng)互聯(lián)網(wǎng)的基礎(chǔ)技術(shù)架構(gòu)可以概括為以下幾點(diǎn):

1)移動(dòng)設(shè)備硬件

包括智能手機(jī)、平板等移動(dòng)智能硬件的處理器、存儲(chǔ)、傳感器、無(wú)線模塊等核心部件技術(shù)。

2)移動(dòng)操作系統(tǒng)

智能手機(jī)和平板上的操作系統(tǒng),如Android和iOS。包含針對(duì)移動(dòng)設(shè)備優(yōu)化的內(nèi)核、驅(qū)動(dòng)、框架和應(yīng)用層。

3)移動(dòng)應(yīng)用開發(fā)

基于移動(dòng)操作系統(tǒng)的應(yīng)用開發(fā)技術(shù),如Android應(yīng)用開發(fā)、iOS應(yīng)用開發(fā)等。主要使用Java、Swift、React Native等語(yǔ)言和框架。

4)移動(dòng)網(wǎng)絡(luò)技術(shù)

包括移動(dòng)通信網(wǎng)絡(luò)技術(shù),如蜂窩移動(dòng)通信的演進(jìn)(2G/3G/4G/5G)等。充分利用無(wú)線網(wǎng)絡(luò)優(yōu)勢(shì)實(shí)現(xiàn)”任何時(shí)間任何地點(diǎn)”連接。

5)移動(dòng)數(shù)據(jù)技術(shù)

移動(dòng)大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)在移動(dòng)場(chǎng)景的應(yīng)用技術(shù)??梢詫?shí)現(xiàn)個(gè)性化推薦、智能助手等。

6)移動(dòng)支付

移動(dòng)支付技術(shù),如NFC技術(shù),可以使智能設(shè)備快速安全地進(jìn)行支付。

7)移動(dòng)安全

針對(duì)移動(dòng)場(chǎng)景的安全技術(shù),如移動(dòng)設(shè)備加密、安全數(shù)據(jù)存儲(chǔ)、網(wǎng)絡(luò)安全、應(yīng)用安全機(jī)制等。

總體來(lái)說(shuō),移動(dòng)互聯(lián)網(wǎng)集成了包括無(wú)線通信、移動(dòng)硬件、操作系統(tǒng)、開發(fā)框架、數(shù)據(jù)技術(shù)和安全技術(shù)等全套移動(dòng)化的技術(shù)體系。

3. 而AIGC大模型需要懂的是AIGC大模型基礎(chǔ)技術(shù)架構(gòu)

技術(shù)架構(gòu):從右到左,右側(cè)是大語(yǔ)言模型(開源、閉源),中間層是早期系列應(yīng)用,包含研究用、包含編程用等;最左側(cè)是具體產(chǎn)品應(yīng)用

4. AIGC大模型技術(shù)架構(gòu)與對(duì)應(yīng)產(chǎn)品架構(gòu)(AI財(cái)稅為例)

UI 層:用戶界面層,提供給用戶與語(yǔ)言模型交互的界面,可以是網(wǎng)頁(yè)、移動(dòng)應(yīng)用、命令行界面等。

會(huì)話處理層:處理用戶與語(yǔ)言模型之間的交互會(huì)話,包括對(duì)用戶輸入的解析、對(duì)話管理、上下文維護(hù)等功能。

數(shù)據(jù)審計(jì)層:負(fù)責(zé)對(duì)用戶數(shù)據(jù)進(jìn)行審計(jì)和保護(hù),防止數(shù)據(jù)泄露、濫用或被攻擊。這個(gè)層次也可以包括對(duì)模型的安全性和可信度進(jìn)行評(píng)估。

操作編排層:這個(gè)層級(jí)可以管理和協(xié)調(diào)多個(gè)語(yǔ)言模型、工具、智能體的運(yùn)行,比如多個(gè)模型之間的調(diào)用、結(jié)果的融合等。它可以作為一個(gè)簡(jiǎn)單的流程引擎,將多個(gè)模型組合成復(fù)雜的工作流程。

LLM 增強(qiáng)層:這個(gè)層級(jí)可以對(duì)語(yǔ)言模型進(jìn)行額外的優(yōu)化和增強(qiáng),比如加速推理速度、提供相關(guān)上下文、提高模型的準(zhǔn)確性、支持特定的任務(wù)等。這個(gè)層級(jí)也可以包括對(duì)模型解釋性和可解釋性的增強(qiáng)。

LLM 層:最底層是語(yǔ)言模型本身,它是整個(gè)架構(gòu)的核心。它可以是一個(gè)基于深度學(xué)習(xí)的模型,比如 LSTM、Transformer 等,也可以是一個(gè)基于傳統(tǒng) NLP 技術(shù)的模型。在這個(gè)層級(jí),模型會(huì)接收輸入并輸出相應(yīng)的文本結(jié)果。

大型語(yǔ)言模型(Large Language Model)的技術(shù)架構(gòu)通常是由多個(gè)組件組成的復(fù)雜系統(tǒng),用于訓(xùn)練和部署這些模型。以下是大型語(yǔ)言模型(例如GPT-3或GPT-4)的基礎(chǔ)技術(shù)架構(gòu)的一般概述:

模型架構(gòu):大型語(yǔ)言模型的核心是其模型架構(gòu),通常采用深度神經(jīng)網(wǎng)絡(luò),如變換器(Transformer)架構(gòu)。這個(gè)架構(gòu)包括多個(gè)層和注意力機(jī)制,用于處理自然語(yǔ)言文本。

數(shù)據(jù)集:模型的訓(xùn)練依賴于大規(guī)模的文本數(shù)據(jù)集,這些數(shù)據(jù)集用于學(xué)習(xí)語(yǔ)言的模式和結(jié)構(gòu)。數(shù)據(jù)集通常包括互聯(lián)網(wǎng)上的文本、書籍、文章等多種來(lái)源。

計(jì)算資源:大型語(yǔ)言模型的訓(xùn)練需要大量的計(jì)算資源,通常使用圖形處理單元(GPU)或更強(qiáng)大的張量處理單元(TPU)。這些資源用于執(zhí)行模型的前向和反向傳播過(guò)程。

分布式訓(xùn)練:由于大型語(yǔ)言模型的參數(shù)數(shù)量巨大,通常會(huì)使用分布式訓(xùn)練技術(shù),將訓(xùn)練過(guò)程分布到多個(gè)計(jì)算節(jié)點(diǎn)上,以加速訓(xùn)練。

模型優(yōu)化:在訓(xùn)練后,模型需要進(jìn)行優(yōu)化,以提高推理性能和減小模型的尺寸。這可能涉及到剪枝、蒸餾等技術(shù)。

部署:訓(xùn)練完成后,大型語(yǔ)言模型可以部署到云端服務(wù)器或邊緣設(shè)備上,以供用戶進(jìn)行自然語(yǔ)言處理任務(wù)的推理。

API和接口:通常,大型語(yǔ)言模型會(huì)提供API和接口,使開發(fā)人員能夠與模型進(jìn)行交互,輸入文本并獲取生成的文本結(jié)果。

數(shù)據(jù)隱私和安全:數(shù)據(jù)隱私和模型安全是部署大型語(yǔ)言模型時(shí)的重要考慮因素,需要采取相應(yīng)的措施來(lái)確保用戶數(shù)據(jù)的保護(hù)和模型的安全性。

模型評(píng)估和監(jiān)控:部署后,需要對(duì)模型進(jìn)行評(píng)估和監(jiān)控,以確保其性能和輸出的質(zhì)量。

請(qǐng)注意,具體的大型語(yǔ)言模型技術(shù)架構(gòu)可能因模型類型、用途和部署環(huán)境而有所不同。例如,GPT-3和GPT-4等不同的模型可能有不同的技術(shù)細(xì)節(jié)和架構(gòu)。

四、如何學(xué)習(xí)這些技術(shù)?

學(xué)習(xí)LLM(大語(yǔ)言模型)的訓(xùn)練和應(yīng)用技術(shù)以及AI基礎(chǔ)設(shè)施技術(shù)對(duì)于從事AI領(lǐng)域的從業(yè)者非常重要。以下是一些建議,幫助你學(xué)習(xí)這些技術(shù):

1. 學(xué)習(xí)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)基礎(chǔ)知識(shí)

開始之前,確保你已經(jīng)建立了扎實(shí)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)基礎(chǔ)。這包括對(duì)神經(jīng)網(wǎng)絡(luò)、損失函數(shù)、優(yōu)化算法、反向傳播等概念的理解。

2. 學(xué)習(xí)自然語(yǔ)言處理(NLP)基礎(chǔ)知識(shí)

了解自然語(yǔ)言處理的基本概念,例如分詞、詞嵌入、文本分類、文本生成等。這些知識(shí)對(duì)于LLM模型的訓(xùn)練和應(yīng)用至關(guān)重要。

1)學(xué)習(xí)大規(guī)模模型的訓(xùn)練

了解大規(guī)模模型(如GPT、BERT等)的訓(xùn)練流程,包括數(shù)據(jù)準(zhǔn)備、模型架構(gòu)、超參數(shù)調(diào)整和訓(xùn)練策略。可以通過(guò)官方文檔、教程和研究論文來(lái)深入了解。

2)掌握深度學(xué)習(xí)框架

學(xué)習(xí)使用流行的深度學(xué)習(xí)框架如PyTorch、TensorFlow等,這將幫助你實(shí)際操作大型模型的訓(xùn)練和應(yīng)用。

3)學(xué)習(xí)AI基礎(chǔ)設(shè)施技術(shù)

了解云計(jì)算平臺(tái),如AWS、Azure、Google Cloud等,以及它們?cè)贏I領(lǐng)域的服務(wù)。掌握虛擬機(jī)、容器、Kubernetes等技術(shù),以支持模型的部署和擴(kuò)展。

4)學(xué)習(xí)數(shù)據(jù)處理和管理

數(shù)據(jù)是AI的基礎(chǔ),學(xué)習(xí)數(shù)據(jù)收集、清洗、存儲(chǔ)和管理技術(shù)非常重要。了解數(shù)據(jù)庫(kù)、數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù)等概念。

5)學(xué)習(xí)模型部署和監(jiān)控

了解模型的部署技術(shù),包括將模型部署到云端或邊緣設(shè)備。學(xué)習(xí)如何監(jiān)控模型性能,診斷問(wèn)題并進(jìn)行模型更新。

6)參加在線課程和培訓(xùn)

參加在線課程、培訓(xùn)班或找領(lǐng)路人等,以獲取系統(tǒng)化的知識(shí)。

7)閱讀相關(guān)書籍和文檔

閱讀與大模型訓(xùn)練和AI基礎(chǔ)設(shè)施技術(shù)相關(guān)的書籍、教材和官方文檔,以深入了解細(xì)節(jié)。

8)實(shí)踐項(xiàng)目

最重要的是實(shí)際動(dòng)手。通過(guò)自己的項(xiàng)目來(lái)應(yīng)用所學(xué)知識(shí),這將幫助你更深入地理解和掌握這些技術(shù)。

9)參與社區(qū)和網(wǎng)絡(luò)

參與AI社區(qū),參與討論、問(wèn)答和開源項(xiàng)目。這將幫助你與其他從業(yè)者互動(dòng),并獲取有用的建議和見解。

10)持續(xù)學(xué)習(xí)

AI領(lǐng)域不斷發(fā)展,因此要不斷學(xué)習(xí)和跟進(jìn)最新的研究和技術(shù)進(jìn)展。

五、學(xué)習(xí)這些技術(shù)可能遇到的難題是?

以下是一些可能的難題以及應(yīng)對(duì)建議:

  • 數(shù)學(xué)和統(tǒng)計(jì)知識(shí):深度學(xué)習(xí)和大規(guī)模模型訓(xùn)練涉及復(fù)雜的數(shù)學(xué)和統(tǒng)計(jì)概念,如線性代數(shù)、微積分、概率論等。如果你之前沒(méi)有相關(guān)背景,建議先學(xué)習(xí)基礎(chǔ)數(shù)學(xué)和統(tǒng)計(jì)知識(shí),然后深入學(xué)習(xí)與深度學(xué)習(xí)相關(guān)的數(shù)學(xué)概念。
  • 編程技能:深度學(xué)習(xí)和AI基礎(chǔ)設(shè)施技術(shù)通常需要編程技能,尤其是Python。如果你不熟悉編程,建議先學(xué)習(xí)Python編程語(yǔ)言,然后深入學(xué)習(xí)深度學(xué)習(xí)框架的使用。
  • 復(fù)雜的模型架構(gòu)和算法:理解大型語(yǔ)言模型的架構(gòu)和訓(xùn)練算法可能需要時(shí)間和精力。建議從簡(jiǎn)單的模型和算法開始,逐漸深入研究更復(fù)雜的內(nèi)容。閱讀研究論文和教程可以幫助你理解這些概念。
  • 數(shù)據(jù)處理和清洗:數(shù)據(jù)質(zhì)量對(duì)于訓(xùn)練和應(yīng)用模型至關(guān)重要。學(xué)習(xí)如何準(zhǔn)備和清洗數(shù)據(jù)以滿足模型的需求是一個(gè)挑戰(zhàn),但它是必要的。學(xué)習(xí)數(shù)據(jù)工程技術(shù)和數(shù)據(jù)處理工具可以幫助你解決這個(gè)問(wèn)題。
  • 云計(jì)算和基礎(chǔ)設(shè)施:學(xué)習(xí)云計(jì)算和AI基礎(chǔ)設(shè)施技術(shù)可能會(huì)涉及到復(fù)雜的概念和工具,如容器編排、自動(dòng)化部署、網(wǎng)絡(luò)配置等。建議逐步學(xué)習(xí),可以先從基本的云計(jì)算概念開始,然后逐漸深入研究高級(jí)主題。
  • 持續(xù)學(xué)習(xí)和實(shí)踐:學(xué)習(xí)這些技術(shù)需要時(shí)間和不斷的實(shí)踐。持續(xù)學(xué)習(xí)和解決問(wèn)題是非常重要的,因?yàn)锳I領(lǐng)域不斷發(fā)展,技術(shù)不斷演進(jìn)。

六、如何克服困難學(xué)習(xí)提升?

尋求幫助和資源:不要害怕尋求幫助。參加在線課程、參與社區(qū)、參考教程和文檔,與其他從業(yè)者互動(dòng),都是獲取幫助和資源的途徑。

最重要的是,要有耐心和堅(jiān)持不懈的決心。學(xué)習(xí)這些技術(shù)需要時(shí)間和努力,但它們?yōu)槟阍贏I領(lǐng)域取得成功提供了重要的技能和機(jī)會(huì)。逐步學(xué)習(xí),一步一步地深入研究,你會(huì)逐漸克服這些難題。

專欄作家

LineLian連詩(shī),公眾號(hào):LineLian。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進(jìn)化論:AI+時(shí)代產(chǎn)品經(jīng)理的思維方法》一書作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!