想要徹底理解思維鏈(CoT),請看此篇!

0 評論 1000 瀏覽 0 收藏 12 分鐘

隨著人工智能語言模型的不斷進步,如何引導(dǎo)它們提供更透明、邏輯性強、可驗證的輸出成為了一個重要課題。思維鏈(Chain of Thought,簡稱CoT)作為一種Prompt提示技術(shù),通過模擬人類解決問題的逐步思考過程,顯著提升了模型在復(fù)雜任務(wù)中的表現(xiàn)。本文將深入探討CoT的概念、應(yīng)用場景以及實際案例,幫助讀者徹底理解CoT的底層邏輯和實踐價值。

隨著人工智能語言模型變得越來越高級,引導(dǎo)它們產(chǎn)生更透明、邏輯性強、可驗證的輸出的需求日益增加。CoT提示通過鼓勵模型展示其工作過程,類似于人類處理復(fù)雜問題解決任務(wù)的方式,來滿足這一需求。這種技術(shù)不僅提高了AI響應(yīng)的準確性,還使它們更具可解釋性和可信度?!∷季S鏈(CoT)

記得第一次看到CoT的時候,還以為是一種大模型底層的訓(xùn)練方案,實際了解過之后,才發(fā)現(xiàn)這個更像是一種思路,一種寫好Prompt的思路?!?/p>

CoT(Chain of Thought)從定義上來說是一種Prompt提示技術(shù),用于指導(dǎo)大型語言模型(LLMs)在復(fù)雜推理任務(wù)中表現(xiàn)出更好的性能。它通過在問題和答案之間插入中間推理步驟,模擬人類解決問題時的逐步思考過程,以提高模型在算術(shù)推理、常識推理和符號推理等任務(wù)中的表現(xiàn)?!?/p>

CoT的作用一般有三點: 

提升復(fù)雜問題解決能力:CoT通過將復(fù)雜問題分解為多個子問題,提高模型解決復(fù)雜問題的能力。

增強模型可解釋性:CoT提供了模型推理過程的可見性,使得模型的決策過程更加透明。

促進學(xué)習(xí)和進化:CoT幫助模型更好地理解問題本質(zhì),促進模型的學(xué)習(xí)和進化。

通過CoT的三種能力,我們會發(fā)現(xiàn),CoT一般被應(yīng)用于需要復(fù)雜推理的場景,比如: 

數(shù)學(xué)問題解決

常識推理

符號推理

邏輯謎題

語言理解

在實際寫法上,一般是將“讓我們一步一步思考”、“讓我們逐步思考”等方式融入到提示詞中,下面我根據(jù)上面的5種應(yīng)用場景,分別舉例分析一下。 案例1: 數(shù)學(xué)應(yīng)用題

Prompt:  Plain Text 請舉例說明Kappa系數(shù)是怎么計算的,請一步一步思考,嚴謹認真地對待每一個過程

分析: 經(jīng)過上面的思考過程的引導(dǎo),模型能夠正確理解并解決數(shù)學(xué)問題,后面再提問這類問題,模型就會按照這個思考過程給出期望的數(shù)學(xué)結(jié)果了?!?/p>

比如在單獨問這道題,大模型會有數(shù)據(jù)計算的不準,比如下面,在計算醫(yī)生A診斷糖尿病和醫(yī)生B診斷糖尿病的交叉數(shù)據(jù)時,正確的應(yīng)該是4,但是大模型給出的是5: 

加上思考引導(dǎo)之后,大模型計算的精度就提升了,不會出現(xiàn)上面明顯的計算錯誤: 

案例2: 常識推理

Prompt:  Plain Text問:一個農(nóng)夫帶著一只羊站在河邊。河上有一條船,可以容納一個人和一只羊。那么農(nóng)夫帶著一只羊渡河所需的最少渡河次數(shù)是多少?答:1次。問:一個農(nóng)民帶2只雞過河,一只船只能容納一個人和2個動物,那么農(nóng)夫帶著兩只雞渡河所需的最少渡河次數(shù)是多少?

分析: 經(jīng)過上面的思考過程,模型能夠正確理解并解決數(shù)學(xué)問題,后面再提問這類問題,模型就會按照這個思考過程給出期望的數(shù)學(xué)結(jié)果了。 

比如在單獨問這道題,大模型就開始自以為是的用錯誤邏輯分析了: 

當提供思考案例后,大模型有一個思維路徑后,就會按照正確的思路去分析數(shù)學(xué)問題: 

案例3: 符號推理

Prompt: Plain Text 將單詞‘Apple’和‘Banana’的最后一個字母連接在一起。讓我們一步一步思考:‘Apple’的最后一個字母是‘e’,‘Banana’的最后一個字母是‘a(chǎn)’,所以連接起來是‘ea’。

分析: 通過告訴大模型如何連接符號,可以正確完成字符串連接任務(wù)?!?/p>

比如:在沒有使用CoT之前 

使用了CoT之后 

案例4: 邏輯謎題

Prompt: 

Plain Text

問題:

學(xué)生小趙、小錢、小孫、小李和小周,他們都想選某老師作為自己的指導(dǎo)老師,現(xiàn)已知:

①5名學(xué)生中有3名屬于20歲以下年齡段,2名屬于20歲及以上年齡段

②有2名學(xué)生的專業(yè)是哲學(xué),其他3名學(xué)生的專業(yè)是文學(xué)

③小趙和小孫的年齡段相同,小李和小周的年齡段不同

④小錢和小周的專業(yè)相同,小孫和小李的專業(yè)不同

最終結(jié)果為,該老師選擇了一名年齡大于20歲的哲學(xué)專業(yè)學(xué)生。

由此可以推出,這名學(xué)生是:

A.小趙

B.小錢

C.小孫

D.小李

試題解析:

第一步,確定題型。

題干有需要匹配的對象和信息,確定為分析推理。

第二步,進行推理。

根據(jù)“小趙和小孫的年齡段相同,小李和小周的年齡段不同”和“有3名屬于20歲以下年齡段,2名屬于20歲及以上年齡段”,可知小李和小周必有一個大于20歲、有一個小于20歲,可以推出錢大于20歲,趙孫一定小于20歲,排除A、C項;根據(jù)“小錢和小周的專業(yè)相同,小孫和小李的專業(yè)不同”和“有2名學(xué)生的專業(yè)是哲學(xué),其他3名學(xué)生的專業(yè)是文學(xué)”,可以推出錢、周是文學(xué)專業(yè),排除B項。

因此,選擇D選項。

問題:一個班共有18人,他們分別來自S省、J省、Z省、A省和F省五省。在18

人中,每個省至少有1人,且來自各省的人數(shù)均不相同。已知:

(1)S省和J省共有5人;

(2)J省和Z省共有6人;

(3)Z省和F省共有7人。

根據(jù)以上信息,可以推出以下哪項?

A.18人中來自S省的有1人

B.18人中來自Z省的有2人

C.18人中來自F省的有5人

D.18人中來自A省的有6人

分析: 通過引導(dǎo)模型按步驟思考邏輯題,從而根據(jù)引導(dǎo)解決邏輯題?!?/p>

如果直接給出問題,AI思考鏈路會非常單一,得出錯誤的答案,比如: 

當我們給出思考鏈路后,AI會根據(jù)正確的思考鏈路給出答案: 

案例5: 語言理解

Prompt: Plain Text請首先把每個選項中成語的含義與適用場景分析出來,最后再聯(lián)系問題的場景一步一步的分析哪個成語最符合場景。

分析: 模型通過逐步解釋,正確理解并解釋了成語。 

比如在下面我們常見的成語填空問題中,如果沒有思維鏈的搭建,模型對于成語在哪種語境使用是會有誤差的,會得出錯誤的結(jié)論: 

當我們加上了思維鏈的提示,大模型就能一步一步的理解成語與語境,得出正確的答案?!?/p>

自動思維鏈(Auto-CoT)

當我們體驗到思維鏈的好處之后也發(fā)現(xiàn)一個問題,生活中的場景這么多,如果每個場景我們都寫個思維鏈,豈不要累死,于是Amazon Science團隊提出了自動思維鏈(Auto-CoT)的概念,它通過自動化流程構(gòu)建“讓我們一步步思考”的思維過程,以提高模型在復(fù)雜推理任務(wù)中的表現(xiàn)?!?/p>

自動思維鏈的實現(xiàn)方法主要有2個階段: 

問題聚類:將給定數(shù)據(jù)集的問題劃分為幾個簇。

示例抽樣:從每個簇中選擇一個代表性問題,并使用簡單的啟發(fā)式方法使用零樣本CoT生成其推理鏈。

簡單理解就是提前把問題分類,然后自動生成每個問題分類下的思維鏈。 

如果有技術(shù)團隊當前遇到了無法一個一個寫思維鏈的困擾,可以嘗試用這個方法,

項目地址:https://github.com/amazon-science/auto-cothttps://github.com/amazon-science/auto-cot

拿走不謝~ 

總結(jié) 

思維鏈在寫Prompt初期的確會獲得比較好的表現(xiàn),不過有些項目只靠讓AI進行啟發(fā)式推理并不能得到我們想要的結(jié)果,所以思維鏈只是寫好Prompt的一個小環(huán)節(jié),所以千萬不要一招鮮,吃遍天,后面我還會分享更多Prompt相關(guān)的知識,敬請期待! 

本文由人人都是產(chǎn)品經(jīng)理作者【宋恒達】,微信公眾號:【產(chǎn)品自由之路】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!