大語(yǔ)言模型:LLM的高階應(yīng)用「指令工程」
在人工智能的疆域中,大語(yǔ)言模型(LLM)正以其強(qiáng)大的能力改變著我們與機(jī)器的互動(dòng)方式。文章詳細(xì)介紹了提示框架、提示工程和反向提示工程這三個(gè)關(guān)鍵知識(shí)板塊,以及它們?nèi)绾螏椭髽I(yè)級(jí)應(yīng)用中的LLM克服數(shù)據(jù)偏差,提升生成結(jié)果的一致性和可控性。
在企業(yè)級(jí)應(yīng)用中使用LLM(大語(yǔ)言模型),最重要的便是提示詞的設(shè)計(jì)。提示詞設(shè)計(jì)有3個(gè)重要的知識(shí)版塊,分別是:提示框架、提示工程、反向提示工程。
提示框架:是一種結(jié)構(gòu)化的提示詞描述方式,用于引導(dǎo)模型學(xué)習(xí)數(shù)據(jù)的特征和模式,比較常用的提示框架包括CREATE提示框架(即:角色、請(qǐng)求、示例、調(diào)整、輸出類型、附加功能)等等。
提示工程:具體來(lái)說(shuō),提示工程它是一組提示策略的組合,幫助LLM克服數(shù)據(jù)偏差,以及解決生成結(jié)果的一致性和可控性。具體的策略包括:給定樣本、思維鏈、生成知識(shí)提示、提示一致性、等其他策略。
反向提示工程:指通過(guò)LLM從輸出文本反向獲取提示信息,優(yōu)化了人工撰寫(xiě)提示詞的不完備性。
在應(yīng)用LLM的過(guò)程中,如果是簡(jiǎn)單的業(yè)務(wù),可能只需要一系列簡(jiǎn)單的提示詞組合即可實(shí)現(xiàn)業(yè)務(wù)訴求。但是大部分需要使用LLM的業(yè)務(wù),并非是簡(jiǎn)單的業(yè)務(wù),它需要綜合考慮多系統(tǒng)、多角色、多任務(wù)的協(xié)同,此時(shí)再通過(guò)簡(jiǎn)單的提示詞,將無(wú)法實(shí)現(xiàn)復(fù)雜的業(yè)務(wù)需求。而“提示工程”便是解決復(fù)雜業(yè)務(wù)過(guò)程中的利器。
今天我們主要來(lái)介紹一下LLM的高階應(yīng)用「提示工程」相關(guān)的關(guān)鍵策略。
一、給定樣本提示
給定樣本提示策略,即可向LLM提問(wèn)時(shí),為L(zhǎng)LM提供正負(fù)樣本。具體的策略包括:零樣本提示、單樣本提示、少樣本提示。
1、零樣本提示零樣本提示的關(guān)鍵步驟包括詳細(xì)描述任務(wù)需求和期望的模型響應(yīng)樣式,并將其構(gòu)造為提示信息,然后使用該提示信息來(lái)引導(dǎo)大語(yǔ)言模型生成相應(yīng)的結(jié)果。
零樣本提示一方面避免了人工數(shù)據(jù)標(biāo)記的高成本,另外能夠更好地保留預(yù)訓(xùn)練模型所獲得的知識(shí)。但是零樣本提示也存在一些問(wèn)題,它很大程度上依賴于LLM模型本身的能力,擁有更高的不可控性。
2、單樣本提示單樣本提示,即在輸入的提示詞中,提供一個(gè)示例,其目標(biāo)是在僅有的提示信息下,使模型產(chǎn)生與給定主題或場(chǎng)景相關(guān)的連貫、合理和準(zhǔn)確的輸出。
單樣本提示的優(yōu)點(diǎn)在于高效的計(jì)算效率和強(qiáng)泛化能力。單樣本提示也存在一定的挑戰(zhàn),如如何確保生成文本的質(zhì)量和準(zhǔn)確性、如何平衡多樣性和連貫性等。
3、少樣本提示少樣本提示在零樣本提示的基礎(chǔ)上提供了極少量的訓(xùn)練示例來(lái)輔助模型完成特定任務(wù)。少樣本提示的特點(diǎn)包括使用1~10個(gè)訓(xùn)練示例,結(jié)合自然語(yǔ)言描述的提示信息,直接引導(dǎo)模型生成新的響應(yīng),無(wú)須額外微調(diào)。
示例的主要作用是減少提示信息的歧義,提高模型對(duì)任務(wù)理解的準(zhǔn)確度。同時(shí),該方法仍保留了預(yù)訓(xùn)練模型的知識(shí),避免過(guò)擬合于少量示例。
二、鏈?zhǔn)剿季S提示
鏈?zhǔn)剿季S提示是一種先進(jìn)的提示工程技術(shù),它通過(guò)鼓勵(lì)大型語(yǔ)言模型(LLM)生成中間推理步驟來(lái)增強(qiáng)模型在復(fù)雜推理任務(wù)上的性能。這種方法特別適用于需要多步驟邏輯推理的問(wèn)題,如算術(shù)、常識(shí)和符號(hào)推理等。
相較于其他提示方法,鏈?zhǔn)剿季S提示具有以下幾個(gè)優(yōu)點(diǎn):
1、鏈?zhǔn)剿季S提示可以引導(dǎo)模型進(jìn)行復(fù)雜推理,使模型能夠在邏輯鏈的引導(dǎo)下進(jìn)行多步驟的推理過(guò)程,而不僅僅進(jìn)行簡(jiǎn)單的預(yù)測(cè)。
2、使用鏈?zhǔn)剿季S提示生成的輸出更符合邏輯,具有更好的連貫性和一致性,使得模型的響應(yīng)更加合理和可信。
3、鏈?zhǔn)剿季S提示的過(guò)程具有更高的可解釋性和可檢驗(yàn)性,因?yàn)槊總€(gè)步驟都可以被分析和評(píng)估,從而增加了模型的可靠性。
4、鏈?zhǔn)剿季S提示可以融合不同的思維技能,使得模型能夠在多個(gè)維度上進(jìn)行推理和思考,有效提高了模型的綜合能力。
鏈?zhǔn)剿季S提示,核心應(yīng)用了思維鏈的邏輯。在具體的指令工程設(shè)計(jì)過(guò)程中,提示詞主要以:思維鏈提示、自我一致性與思維鏈提示、思維樹(shù)3種方式來(lái)進(jìn)行設(shè)計(jì),具體采用哪一種,可根據(jù)業(yè)務(wù)的復(fù)雜程度來(lái)定,如下圖所示:
對(duì)比4種模式:
輸入/輸出(IO):直接提問(wèn),然后輸出結(jié)果;
思維鏈提示(CoT):將一個(gè)問(wèn)題拆解為一個(gè)個(gè)小問(wèn)題,然后串聯(lián)起來(lái);
自我一致性與思維鏈提示(Cot-SC):
對(duì)于一個(gè)復(fù)雜的推理問(wèn)題,可以有多種不同的推理路徑,但最終都能得出正確的答案,有點(diǎn)兒類似于條件判斷 + 多條鏈?zhǔn)剿季S提示;
思維樹(shù)(ToT):通過(guò)構(gòu)建一棵思維樹(shù)來(lái)分解復(fù)雜問(wèn)題,并逐步推進(jìn)思考過(guò)程,最終達(dá)到解決問(wèn)題的目的,擁有更強(qiáng)的問(wèn)題處理能力。
三、生成知識(shí)提示
“生成知識(shí)提示”(Generated Knowledge Prompting)是一種技術(shù),它要求大型語(yǔ)言模型(LLM)在生成響應(yīng)之前,先生成與問(wèn)題相關(guān)的可能有用的信息。這種方法由兩個(gè)中間步驟組成:知識(shí)生成和知識(shí)集成。
1、知識(shí)生成:在這一步驟中,要求LLM生成有關(guān)問(wèn)題的一些事實(shí)。這些事實(shí)以few-shot的方式進(jìn)行提示,即模型會(huì)生成多個(gè)不同的完成,以提供多個(gè)可能的知識(shí)片段。
2、知識(shí)集成:接下來(lái),使用生成的知識(shí)來(lái)增強(qiáng)問(wèn)題,并用這些增強(qiáng)的問(wèn)題來(lái)提示LLM,以獲得最終答案。例如,如果問(wèn)題是關(guān)于袋鼠有多少肢體的,那么在知識(shí)生成步驟中,模型可能會(huì)生成關(guān)于袋鼠是有袋動(dòng)物和它們有5條肢體的知識(shí)。然后,這些知識(shí)被用來(lái)增強(qiáng)問(wèn)題,模型會(huì)根據(jù)這些增強(qiáng)的問(wèn)題給出最終答案
這種方法顯示了對(duì)各種常識(shí)數(shù)據(jù)集的改進(jìn),并且不需要對(duì)知識(shí)進(jìn)行微調(diào)(有監(jiān)督訓(xùn)練)或訪問(wèn)結(jié)構(gòu)化的知識(shí)庫(kù),實(shí)驗(yàn)結(jié)果證明,這種提示方法優(yōu)于少樣本提示、向量庫(kù)檢索方式、微調(diào)方式
在實(shí)際應(yīng)用中,生成知識(shí)提示技術(shù)可以提高模型在常識(shí)推理任務(wù)上的性能,尤其是在模型需要更多關(guān)于世界知識(shí)的任務(wù)時(shí)。
通過(guò)先從語(yǔ)言模型中生成知識(shí),然后在回答問(wèn)題時(shí)提供這些知識(shí)作為額外的輸入,可以獲取更優(yōu)的結(jié)果。這種技術(shù)不僅可以提高模型的推理能力,還可以增加預(yù)測(cè)結(jié)果的穩(wěn)定性和準(zhǔn)確性
四、其他策略技巧
提示工程除了之前介紹的一些策略外,還有一些其他的一些策略,例如:結(jié)合其他能力、主動(dòng)學(xué)習(xí)、強(qiáng)化反饋提示等。
1、結(jié)合其他能力
提示工程,可以結(jié)合“自動(dòng)推理和工具使用提示”、“多模態(tài)連續(xù)學(xué)習(xí)提示”等提示策略來(lái)增強(qiáng)模型對(duì)提示信息的理解,綜合利用更多信息可以生成更豐富的響應(yīng)。
另外多模態(tài)連續(xù)學(xué)習(xí)提示是一種將多模態(tài)信息與鏈?zhǔn)剿季S提示相結(jié)合的技術(shù)。其主要思路包括提供包含圖像、音頻、視頻等非文本模態(tài)的信息,構(gòu)建鏈?zhǔn)蕉嗖襟E的語(yǔ)言提示來(lái)引導(dǎo)思考,并將每步的提示信息與不同模態(tài)的內(nèi)容相結(jié)合,形成多模態(tài)輸入。模型通過(guò)學(xué)習(xí)多模態(tài)信息,完成鏈?zhǔn)酵评?,并生成最終的言語(yǔ)響應(yīng)。
2、主動(dòng)學(xué)習(xí)
通過(guò)讓模型主動(dòng)請(qǐng)求信息的方式來(lái)改進(jìn)其對(duì)提示信息的理解,如主動(dòng)提示、ReAct提示等,可以使對(duì)話更符合真實(shí)情況,減少誤解。
3、強(qiáng)化反饋提示
強(qiáng)化反饋提示是一種利用人類用戶的反饋來(lái)持續(xù)改進(jìn)模型對(duì)提示信息的理解能力的方法。其核心思想是通過(guò)用戶對(duì)模型生成響應(yīng)的正反饋和負(fù)反饋,不斷優(yōu)化模型的表現(xiàn)。
用戶的反饋意見(jiàn)被收集,并與相應(yīng)的提示示例進(jìn)行標(biāo)記,形成帶有反饋的提示—響應(yīng)對(duì)作為訓(xùn)練數(shù)據(jù),用于微調(diào)模型。通過(guò)強(qiáng)化用戶反饋的學(xué)習(xí)過(guò)程,模型對(duì)提示信息的理解能力得到持續(xù)增強(qiáng)。
本文由人人都是產(chǎn)品經(jīng)理作者【長(zhǎng)弓PM】,微信公眾號(hào):【AI產(chǎn)品經(jīng)理社】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!