99久久精品无码一区二区,国产亚洲精品第一综合不卡

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

什么是大模型幻覺？應(yīng)該如何解決？

貝琳_belin

2024-06-27

0 評論 1638 瀏覽 6 收藏

6 分鐘

自從大模型發(fā)布后，幻覺問題就一直如影隨形沒能得到妥善的解決。這篇文章，作者就分析了大模型幻覺的原因和解決方法，供大家參考。

一、什么是大模型幻覺？

語言模型的幻覺（Hallucination）指的是模型生成了不符合事實(shí)或毫無根據(jù)的信息。這種現(xiàn)象在自然語言處理（NLP）任務(wù)中尤其常見，如機(jī)器翻譯、文本生成和問答系統(tǒng)。

比如：用戶問模型：“秦始皇為什么喜歡用蘋果手機(jī)，為什么不喜歡用安卓手機(jī)呢？”

在還沒有訓(xùn)練的很完善的大模型就可能會(huì)出現(xiàn)一本正經(jīng)的回答關(guān)于秦始皇喜歡用什么手機(jī)的問題，也就是我們常說的“一本正經(jīng)的胡說八道”。這就是大模型產(chǎn)生的幻覺。

那么大模型的幻覺是怎么來的？我們應(yīng)該如何解決呢？

二、大模型幻覺是怎么來的

大模型的幻覺主要來自三個(gè)方面：

1）訓(xùn)練數(shù)據(jù)的局限性

當(dāng)我們深入研究大模型的訓(xùn)練流程時(shí)，我們會(huì)發(fā)現(xiàn)，數(shù)據(jù)是最關(guān)鍵的。在預(yù)訓(xùn)練階段，我們無法控制數(shù)據(jù)的來源，因?yàn)榫W(wǎng)上充滿了隨機(jī)網(wǎng)頁內(nèi)容，很多內(nèi)容可能并不準(zhǔn)確，我們無法完全清洗這些數(shù)據(jù)，只能盡量讓語言更加通順。

而在sft階段時(shí)，當(dāng)訓(xùn)練數(shù)據(jù)中可能包含錯(cuò)誤信息或誘導(dǎo)信息時(shí)，這些信息在模型生成時(shí)可能被誤用。另外一個(gè)，從數(shù)據(jù)覆蓋范圍來說，訓(xùn)練數(shù)據(jù)可能不完全覆蓋所有的事實(shí)或領(lǐng)域，導(dǎo)致模型在生成特定信息時(shí)缺乏足夠的背景知識。

2）大模型對自己高估

這主要是因?yàn)槟Ｐ驮陬A(yù)測 next token 的概率時(shí)，本質(zhì)上是在處理數(shù)據(jù)分布的問題，對于非常大的 LLMs 來說，正確答案和錯(cuò)誤答案的分布熵可能是相似的，LLM 在生成錯(cuò)誤答案時(shí)和生成正確答案時(shí)同樣自信。

另外，模型具有短期記憶，在模型在生成長文本時(shí)，可能無法完全記住并正確應(yīng)用之前提到的所有信息，導(dǎo)致信息不一致或錯(cuò)誤。有時(shí)，模型也可能會(huì)被上下文誤導(dǎo)，生成與上下文相關(guān)但不真實(shí)的信息。

3）模型架構(gòu)和訓(xùn)練方法

大語言模型的訓(xùn)練的最初期的目的是生成流暢和連貫的文本，而不是確保事實(shí)的準(zhǔn)確性。所以模型可能就會(huì)生成符合語言習(xí)慣但不符合實(shí)際情況的內(nèi)容。同理，盡管大語言模型可以處理大量數(shù)據(jù)，這也使它們并不具備真正的常識推理能力，不能像人類一樣進(jìn)行邏輯驗(yàn)證。就需要大量的標(biāo)注人員去訓(xùn)練他們使他們能夠準(zhǔn)確的進(jìn)行推理和保證事實(shí)的準(zhǔn)確性。