久久精品无码一区二区三区不卡 ,国产午夜鲁丝片AV无码免费

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

（一文讀懂）大模型到底是怎么生成文字的？

柳星聊產(chǎn)品

2024-02-04

1 評(píng)論 2872 瀏覽 16 收藏

9 分鐘

大模型這個(gè)熱門話題在過(guò)去一年里引發(fā)了大量討論，那么，你是否知曉大模型究竟是怎么生成文字的？這篇文章里，作者嘗試講透其生成原理，并帶你了解四種構(gòu)建AI應(yīng)用的大模型技術(shù)架構(gòu)，一起來(lái)看看吧。

在人工智能的領(lǐng)域，大模型在去年已經(jīng)成為了一個(gè)熱門的話題。各大廠商如谷歌、微軟、OpenAI等，都在積極研發(fā)和應(yīng)用大模型技術(shù)。這些模型在語(yǔ)言理解、圖像識(shí)別、推薦系統(tǒng)等方面都表現(xiàn)出了驚人的能力，甚至在某些任務(wù)上，已經(jīng)超越了人類的表現(xiàn)。

或許你用過(guò)，驚嘆于它的神奇，或許你沒(méi)有用過(guò)，聽(tīng)著它的傳奇。無(wú)論如何，都懂那么一點(diǎn)點(diǎn)，但很難講的清，它到底是怎么生成的？

我們接下來(lái)就講透它生成的原理，并了解四種構(gòu)建AI應(yīng)用的大模型技術(shù)架構(gòu)。

一、大模型的生成原理

首先，我們要了解的是，GPT大模型是一種基于深度學(xué)習(xí)的自然語(yǔ)言處理模型，也就是LLM。

（敲黑板，LLM是一種生成文字的模型，文生圖比如DALL·E，它和LLM都是多模態(tài)語(yǔ)言模型的分支）它的工作原理可以簡(jiǎn)單地理解為“學(xué)習(xí)語(yǔ)言的規(guī)律”，它的生成方式只是根據(jù)上文，猜下一個(gè)詞的概率。

那它為什么會(huì)掌握這么多的知識(shí)？那是因?yàn)樵谀Ｐ陀?xùn)練過(guò)程中，GPT模型會(huì)閱讀大量的文本數(shù)據(jù)，然后學(xué)習(xí)這些文本中的語(yǔ)言規(guī)律。

這個(gè)過(guò)程可以類比為人類學(xué)習(xí)語(yǔ)言的方式。當(dāng)我們是嬰兒時(shí)，我們會(huì)通過(guò)聽(tīng)父母和周圍的人說(shuō)話，學(xué)習(xí)語(yǔ)言的規(guī)律。

比如，我們會(huì)學(xué)習(xí)到“我”通常后面會(huì)跟“是”，“你”通常后面會(huì)跟“好”等等。這就是一種語(yǔ)言規(guī)律。GPT模型就是通過(guò)類似的方式，學(xué)習(xí)語(yǔ)言的規(guī)律。

但是，GPT模型的學(xué)習(xí)能力遠(yuǎn)超人類。

它可以閱讀數(shù)以億計(jì)的文本，學(xué)習(xí)到非常復(fù)雜的語(yǔ)言規(guī)律。這就是為什么GPT模型可以生成非常自然、連貫的文本。

二、GPT模型如何學(xué)習(xí)語(yǔ)言的規(guī)律

說(shuō)到這里，需要我們了解一下GPT模型的內(nèi)部結(jié)構(gòu)。GPT模型是由多層神經(jīng)網(wǎng)絡(luò)組成的。每一層神經(jīng)網(wǎng)絡(luò)都可以抽取文本的某種特征。比如：

第一層神經(jīng)網(wǎng)絡(luò)可能會(huì)抽取出單詞的拼寫規(guī)律；
第二層神經(jīng)網(wǎng)絡(luò)可能會(huì)抽取出詞性的規(guī)律；
第三層神經(jīng)網(wǎng)絡(luò)可能會(huì)抽取出句子的語(yǔ)法規(guī)律等等。

通過(guò)這種層層抽取，GPT模型可以學(xué)習(xí)到非常深層次的語(yǔ)言規(guī)律。

當(dāng)GPT模型生成文本時(shí)，它會(huì)根據(jù)已有的文本，預(yù)測(cè)下一個(gè)單詞，整體就是通過(guò)這種方式，生成連貫的文本。

當(dāng)然，這只是一個(gè)非常簡(jiǎn)化的版本。實(shí)際上，GPT模型的工作原理還涉及到很多復(fù)雜的數(shù)學(xué)和計(jì)算機(jī)科學(xué)知識(shí)。

三、大模型的四種應(yīng)用技術(shù)架構(gòu)

大模型的厲害之處，其實(shí)不止在于它很像我們?nèi)藢W(xué)習(xí)語(yǔ)言，而更大的作用在于它未來(lái)會(huì)改變我們的生活和職場(chǎng)。從整體現(xiàn)有最新的架構(gòu)來(lái)看，其實(shí)有四種大模型的應(yīng)用架構(gòu)，從上往下，依次從簡(jiǎn)單到復(fù)雜。

第一種：Prompt（指令工程）

指令工程聽(tīng)著好像很遙遠(yuǎn)，其實(shí)就是通過(guò)下面這個(gè)輸入框觸發(fā)的：

看上去簡(jiǎn)單，但這個(gè)很考驗(yàn)一個(gè)人寫prompt的“功力”。

prompt的作用就是通過(guò)引導(dǎo)模型生成特定類型的文本。一個(gè)好的prompt可以引導(dǎo)模型以期望的方式生成文本。例如，如果我們想讓模型寫一篇關(guān)于全球變暖的文章，我們可以給模型一個(gè)prompt，如“全球變暖是一個(gè)嚴(yán)重的問(wèn)題，因?yàn)?#8230;”。模型會(huì)根據(jù)這個(gè)prompt生成一篇文章。

這種方法的優(yōu)點(diǎn)是簡(jiǎn)單直觀，但缺點(diǎn)是可能需要大量的嘗試才能找到一個(gè)好的prompt。

第二種：Function calling（函數(shù)調(diào)用）

Function calling是一種更深入的應(yīng)用架構(gòu)，它通過(guò)調(diào)用模型的內(nèi)部函數(shù)，直接獲取模型的某些特性。

例如，我們可以調(diào)用模型的詞向量函數(shù)，獲取單詞的詞向量。

這種方法的優(yōu)點(diǎn)是可以直接獲取模型的內(nèi)部信息，但缺點(diǎn)是需要深入理解模型的內(nèi)部結(jié)構(gòu)。

第三種：RAG（Retrieval-Augmented Generation）

RAG是一種結(jié)合檢索和生成的應(yīng)用架構(gòu)。

在這種方法中，模型首先會(huì)檢索相關(guān)的文本，然后用這些文本作為輸入，讓模型生成答案。

例如，如果我們想讓模型回答一個(gè)關(guān)于全球變暖的問(wèn)題，模型可以先檢索到一些關(guān)于全球變暖的文章，然后根據(jù)這些文章生成答案。

這種方法的優(yōu)點(diǎn)是可以利用大量的外部信息，提高模型的生成質(zhì)量。但缺點(diǎn)是需要大量的計(jì)算資源，因?yàn)樾枰獙?duì)大量的文本進(jìn)行檢索。

第四種：Fine-tuning（微調(diào)）

Fine-tuning是一種在特定任務(wù)上進(jìn)一步訓(xùn)練模型的應(yīng)用架構(gòu)（如計(jì)算鋼材的消耗量等等）。

在這種方法中，模型首先會(huì)在大量的文本上進(jìn)行預(yù)訓(xùn)練，學(xué)習(xí)語(yǔ)言的基本規(guī)律。然后，模型會(huì)在特定任務(wù)的數(shù)據(jù)上進(jìn)行fine-tuning，學(xué)習(xí)任務(wù)的特定規(guī)律。

例如，我們可以在情感分析任務(wù)上fine-tuning模型，讓模型更好地理解情感。

這種方法的優(yōu)點(diǎn)是可以提高模型在特定任務(wù)上的表現(xiàn)，但缺點(diǎn)是需要大量的標(biāo)注數(shù)據(jù)。

最后的話

總的來(lái)說(shuō)，GPT大模型生成結(jié)果的原理，就是通過(guò)學(xué)習(xí)語(yǔ)言的規(guī)律，然后根據(jù)已有的語(yǔ)境，預(yù)測(cè)下一個(gè)單詞，從而生成連貫的文本。這就像我們?nèi)祟愓f(shuō)話或?qū)懳恼乱粯?，根?jù)已有的語(yǔ)境，預(yù)測(cè)下一個(gè)單詞或短語(yǔ)。只不過(guò)，GPT模型的學(xué)習(xí)能力和生成能力，遠(yuǎn)超我們?nèi)祟悺?/p>

我們可以看到，AI在學(xué)習(xí)我們?nèi)祟?，它們不知疲倦，孜孜以求，我們?nèi)祟愐矐?yīng)該向它們學(xué)習(xí)，不帶批判和有色眼鏡的看待身邊人的觀點(diǎn)，用僅剩的群體智慧來(lái)繼續(xù)引領(lǐng)我們走向下一個(gè)新世界。

后續(xù)還會(huì)對(duì)四種技術(shù)架構(gòu)進(jìn)行深入探討，歡迎交流~

希望帶給你一點(diǎn)啟發(fā)，加油。

作者：柳星聊產(chǎn)品，公眾號(hào)：柳星聊產(chǎn)品

本文由 @柳星聊產(chǎn)品原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash，基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App