日本黄色小视频,一本大道无码人妻精品专区

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

想要徹底理解思維鏈（CoT），請看此篇！

愛吃糖炒栗子

2024-11-12

0 評論 1000 瀏覽 0 收藏

12 分鐘

隨著人工智能語言模型的不斷進步，如何引導(dǎo)它們提供更透明、邏輯性強、可驗證的輸出成為了一個重要課題。思維鏈（Chain of Thought，簡稱CoT）作為一種Prompt提示技術(shù)，通過模擬人類解決問題的逐步思考過程，顯著提升了模型在復(fù)雜任務(wù)中的表現(xiàn)。本文將深入探討CoT的概念、應(yīng)用場景以及實際案例，幫助讀者徹底理解CoT的底層邏輯和實踐價值。

隨著人工智能語言模型變得越來越高級,引導(dǎo)它們產(chǎn)生更透明、邏輯性強、可驗證的輸出的需求日益增加。CoT提示通過鼓勵模型展示其工作過程，類似于人類處理復(fù)雜問題解決任務(wù)的方式，來滿足這一需求。這種技術(shù)不僅提高了AI響應(yīng)的準確性,還使它們更具可解釋性和可信度?！∷季S鏈（CoT）

記得第一次看到CoT的時候，還以為是一種大模型底層的訓(xùn)練方案，實際了解過之后，才發(fā)現(xiàn)這個更像是一種思路，一種寫好Prompt的思路?！?/p>

CoT（Chain of Thought)從定義上來說是一種Prompt提示技術(shù)，用于指導(dǎo)大型語言模型（LLMs）在復(fù)雜推理任務(wù)中表現(xiàn)出更好的性能。它通過在問題和答案之間插入中間推理步驟，模擬人類解決問題時的逐步思考過程，以提高模型在算術(shù)推理、常識推理和符號推理等任務(wù)中的表現(xiàn)?！?/p>

CoT的作用一般有三點：　

提升復(fù)雜問題解決能力：CoT通過將復(fù)雜問題分解為多個子問題，提高模型解決復(fù)雜問題的能力。

增強模型可解釋性：CoT提供了模型推理過程的可見性，使得模型的決策過程更加透明。

促進學(xué)習(xí)和進化：CoT幫助模型更好地理解問題本質(zhì)，促進模型的學(xué)習(xí)和進化。

通過CoT的三種能力，我們會發(fā)現(xiàn)，CoT一般被應(yīng)用于需要復(fù)雜推理的場景，比如：　

數(shù)學(xué)問題解決

常識推理

符號推理

邏輯謎題

語言理解

在實際寫法上，一般是將“讓我們一步一步思考”、“讓我們逐步思考”等方式融入到提示詞中，下面我根據(jù)上面的5種應(yīng)用場景，分別舉例分析一下。　案例1: 數(shù)學(xué)應(yīng)用題

Prompt: 　Plain Text 請舉例說明Kappa系數(shù)是怎么計算的，請一步一步思考，嚴謹認真地對待每一個過程

分析: 經(jīng)過上面的思考過程的引導(dǎo)，模型能夠正確理解并解決數(shù)學(xué)問題，后面再提問這類問題，模型就會按照這個思考過程給出期望的數(shù)學(xué)結(jié)果了?！?/p>

比如在單獨問這道題，大模型會有數(shù)據(jù)計算的不準，比如下面，在計算醫(yī)生A診斷糖尿病和醫(yī)生B診斷糖尿病的交叉數(shù)據(jù)時，正確的應(yīng)該是4，但是大模型給出的是5：　

加上思考引導(dǎo)之后，大模型計算的精度就提升了，不會出現(xiàn)上面明顯的計算錯誤：　

案例2: 常識推理

Prompt: 　Plain Text問：一個農(nóng)夫帶著一只羊站在河邊。河上有一條船，可以容納一個人和一只羊。那么農(nóng)夫帶著一只羊渡河所需的最少渡河次數(shù)是多少？答：1次。問：一個農(nóng)民帶2只雞過河，一只船只能容納一個人和2個動物，那么農(nóng)夫帶著兩只雞渡河所需的最少渡河次數(shù)是多少？

分析: 經(jīng)過上面的思考過程，模型能夠正確理解并解決數(shù)學(xué)問題，后面再提問這類問題，模型就會按照這個思考過程給出期望的數(shù)學(xué)結(jié)果了。　

比如在單獨問這道題，大模型就開始自以為是的用錯誤邏輯分析了：　

當提供思考案例后，大模型有一個思維路徑后，就會按照正確的思路去分析數(shù)學(xué)問題：　

案例3: 符號推理

Prompt:　Plain Text 將單詞‘Apple’和‘Banana’的最后一個字母連接在一起。讓我們一步一步思考：‘Apple’的最后一個字母是‘e’，‘Banana’的最后一個字母是‘a(chǎn)’，所以連接起來是‘ea’。

分析: 通過告訴大模型如何連接符號，可以正確完成字符串連接任務(wù)?！?/p>

比如：在沒有使用CoT之前　

使用了CoT之后　

案例4: 邏輯謎題

Prompt:　

Plain Text

問題：

學(xué)生小趙、小錢、小孫、小李和小周，他們都想選某老師作為自己的指導(dǎo)老師,現(xiàn)已知：

①5名學(xué)生中有3名屬于20歲以下年齡段，2名屬于20歲及以上年齡段

②有2名學(xué)生的專業(yè)是哲學(xué)，其他3名學(xué)生的專業(yè)是文學(xué)

③小趙和小孫的年齡段相同，小李和小周的年齡段不同

④小錢和小周的專業(yè)相同，小孫和小李的專業(yè)不同

最終結(jié)果為，該老師選擇了一名年齡大于20歲的哲學(xué)專業(yè)學(xué)生。

由此可以推出，這名學(xué)生是：

A.小趙

B.小錢

C.小孫

D.小李

試題解析：

第一步，確定題型。

題干有需要匹配的對象和信息，確定為分析推理。

第二步，進行推理。

根據(jù)“小趙和小孫的年齡段相同，小李和小周的年齡段不同”和“有3名屬于20歲以下年齡段，2名屬于20歲及以上年齡段”，可知小李和小周必有一個大于20歲、有一個小于20歲，可以推出錢大于20歲，趙孫一定小于20歲，排除A、C項；根據(jù)“小錢和小周的專業(yè)相同，小孫和小李的專業(yè)不同”和“有2名學(xué)生的專業(yè)是哲學(xué)，其他3名學(xué)生的專業(yè)是文學(xué)”，可以推出錢、周是文學(xué)專業(yè)，排除B項。

因此，選擇D選項。

問題：一個班共有18人，他們分別來自S省、J省、Z省、A省和F省五省。在18

人中，每個省至少有1人，且來自各省的人數(shù)均不相同。已知：

(1)S省和J省共有5人；

(2)J省和Z省共有6人；

(3)Z省和F省共有7人。

根據(jù)以上信息，可以推出以下哪項？

A.18人中來自S省的有1人

B.18人中來自Z省的有2人

C.18人中來自F省的有5人

D.18人中來自A省的有6人

分析: 通過引導(dǎo)模型按步驟思考邏輯題，從而根據(jù)引導(dǎo)解決邏輯題?！?/p>

如果直接給出問題，AI思考鏈路會非常單一，得出錯誤的答案，比如：　

當我們給出思考鏈路后，AI會根據(jù)正確的思考鏈路給出答案：　

案例5: 語言理解

Prompt:　Plain Text請首先把每個選項中成語的含義與適用場景分析出來，最后再聯(lián)系問題的場景一步一步的分析哪個成語最符合場景。

分析: 模型通過逐步解釋，正確理解并解釋了成語。　

比如在下面我們常見的成語填空問題中，如果沒有思維鏈的搭建，模型對于成語在哪種語境使用是會有誤差的，會得出錯誤的結(jié)論：　

當我們加上了思維鏈的提示，大模型就能一步一步的理解成語與語境，得出正確的答案?！?/p>

自動思維鏈（Auto-CoT）

當我們體驗到思維鏈的好處之后也發(fā)現(xiàn)一個問題，生活中的場景這么多，如果每個場景我們都寫個思維鏈，豈不要累死，于是Amazon Science團隊提出了自動思維鏈（Auto-CoT）的概念，它通過自動化流程構(gòu)建“讓我們一步步思考”的思維過程，以提高模型在復(fù)雜推理任務(wù)中的表現(xiàn)?！?/p>

自動思維鏈的實現(xiàn)方法主要有2個階段：　

問題聚類：將給定數(shù)據(jù)集的問題劃分為幾個簇。

示例抽樣：從每個簇中選擇一個代表性問題，并使用簡單的啟發(fā)式方法使用零樣本CoT生成其推理鏈。

簡單理解就是提前把問題分類，然后自動生成每個問題分類下的思維鏈。　

如果有技術(shù)團隊當前遇到了無法一個一個寫思維鏈的困擾，可以嘗試用這個方法，

項目地址：https://github.com/amazon-science/auto-cothttps://github.com/amazon-science/auto-cot

拿走不謝~　

總結(jié)　

思維鏈在寫Prompt初期的確會獲得比較好的表現(xiàn)，不過有些項目只靠讓AI進行啟發(fā)式推理并不能得到我們想要的結(jié)果，所以思維鏈只是寫好Prompt的一個小環(huán)節(jié)，所以千萬不要一招鮮，吃遍天，后面我還會分享更多Prompt相關(guān)的知識，敬請期待！　

本文由人人都是產(chǎn)品經(jīng)理作者【宋恒達】，微信公眾號：【產(chǎn)品自由之路】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App