如何讓ChatGPT更“懂你”
大語言模型并不是萬能的,由于缺乏行業領域的專業知識,大模型在解決實際問題上其實存在一定的局限性。那么,如何讓大模型更懂你?作者作為AI開發平臺的設計師,總結了兩個簡單高效的方法,一起來看。
我們都知道,生成式AI的出現掀起一波人工智能的浪潮,在這種時代背景下,了解AI產品背后的開發方法,能幫助我們更好的使用AI產品。
一、什么是生成式AI?
生成式AI可以幫助我們做很多事情,在日常生活中,它可以用于生成報告,提高匯報的效率;在電商領域,智能客服可以自動回答和解決用戶的問題;在醫療領域,智能醫生可以幫助患者進行疾病診斷,提高了行業人員的工作效率。
二、ChatGPT的本質是大規模語言技術的應用
在生成式AI應用中,我們所熟悉的Open AI 的ChatGPT、百度的文心一言、字節的豆包等,他們的本質是應用了一種大模型的技術。
這種技術是由云廠商中專業的技術人員,通過海量的文本數據處理,消耗昂貴的算力成本所得到的。這樣的技術讓大模型學習人類的語言模式和知識結構,并生成自然流暢的回答。
大模型類比為大腦
通俗比喻:我們可以將大模型類比為“大腦”,大量的文本數據相當于“外界提供的信息”,昂貴的算法比喻為“聘請的高級教授”,將外界信息轉化為知識點,儲存在大腦中,最后呈現出來的就是我們使用的智能產品。
三、大語言模型并不是萬能的,解決實際問題上存在局限性
然而大語言模型并不是萬能的,由于缺乏行業領域的專業知識,導致他們在解決實際問題上存在一定的局限性。
比如以下場景:我想通過 文心一言 了解CXD智能云產品,相關的設計規則,而它的回答,并不能解決我的實際問題。
文心一言只提供適用于通用平臺的設計規則,這些規則并不能完全適用于我們的產品。企業應用過程中遇到這種問題,應該怎么辦?
四、解決辦法:讓人工智能應用更懂你,得到你想要的內容
作為AI開發平臺的設計師,我總結了兩個簡單高效的方法分享給大家。
方法1 “教它找”
“教它找”的原理是:通過加入提示詞,利用其中關鍵詞語,提示大模型理解我們的意圖,在已經有的數據信息中找到我們想要信息再進行回答。
這種方式可以幫助我們低成本、快速的提升大模型的效果。
以開發一個“汽車銷售客服”作為場景,Diffy產品作為工具演示。
產品的左側面板是相關參數的配置,右側則是用戶真實使用場景的測試工具。
沒有提示語配置下,我選擇ChatGPT 3.5 來回答我的問題,發現它的回答沒有實質有效的信息,對購買汽車的用戶幫助不大。
如何通過加入提示語提升質量?
步驟1:加入提示詞:在左側面白的輸入框加入文本,限制大模型回答,讓大模型作為一名專業銷售人員,針對汽車性能、外觀等維度提供比對信息。
步驟2:測試效果:ChatGPT的回答效果明顯提升。
通過這樣的方式,打包成新的應用,給到用戶使用,讓用戶在已限定好范圍的大模型內進行問答,可以極大提高產品滿意度。
基于這個方法,我為大家推薦兩類好用的工具:一類是提示語模版平臺,在這些平臺中可以獲得各行各業的高質量提示語,教育類、金融類等等,復制直接使用。
Dify:http://cloud.dify.ai/explore/apps
GPT short:http://prompt-shortcut.writeathon.cn
千帆大模型平臺:http://prompt-shortcut.writeathon.cn
方法2 “教他學”
“教他學”的原理是:通過增加自己/企業自身的數據,與它自身通用的數據結合,教它學習新知識,從而定制一個懂你的新的大模型。
如何加入自己的數據?有兩種方式。
方式1:可以在AI定制的平臺,通過非結構化的文檔(比如pdf word文檔、網頁鏈接等)資料,來生新的大模型。
方式2:選定某一AI開發平臺,準備結構化的數據集(文本對信息)excel json文件,通過重新訓練的方式,來讓大模型學習新知識。
同樣,我以兩個案例來介紹說明具體操作流程。
案例1:以開發“設計規范助手”為場景,Chatbase平臺作演示
第一步:選擇“創建機器人”。
第二步:選擇數據,這里提供5種數據類型,分別是文檔、文本、連接、問答對、第三方筆記網址。
我提前準備好了三種關于日常會用到的文件,分別是:設計規范文檔、方案庫文檔、各產品的用研報告,同時加入專業的提示文本和云設中臺官網的鏈接,幫助大模型更好的學習我們的知識。
第三步:生成機器人開始測試。
通過三輪對話可以看到,它輕松的回答了我想要的問題,提供了正確的規范信息和健康度指標,以及如何設計數據標注場景的總結信息。
最后,只需要將它發布為網站,把鏈接提供給組內設計師使用即可。
案例2:以開發“醫療客服助手”場景,千帆平臺作演示。
第一步:準備數據,可以選擇自己準備數據集,按照平臺的示例引導進行操作;也可以直接使用平臺提供的現成的行業數據集。比如我們選擇這個醫療中文數據集。
第二步:訓練模型,這個頁面中,首先選擇訓練的大模型,可以根據大模型使用介紹進行選擇。我們選擇Ernie bot 因為它中文效果更好。
其次是選擇訓練方法,不同的訓練方法影響資源成本金額、消耗時間和模型穩定性;最后是選擇訓練參數,平臺會根據已由信息提供推薦值,如果是開發人員對訓練參數有了解,可以根據經驗調整。點擊確定開始訓練,
第三步:訓練完成后則將任務發布為模型,并把模型部署為服務。(這里不詳細拓展)
第四步:在體驗中心中,選擇剛剛部署的服務,即可進行測試,了解這個醫療客服的實際效果。
以上就是在大模型中加入結構化數據的操作流程,這種方式需要耗費更多的金額和時間,但更適合于需要高精度回答效果的企業。
1)數據服務工具
這些平臺提供現成可用的數據集,就不用耗費精力去準備數據,比如紅酒知識、動物知識等,根據你的業務需求下載使用。
阿里modelscope:http://www.modelscope.cn/datasets?Tags=text-classification&dataType=text&page=1
百度AI Studio:http://aistudio.baidu.com/datasetoverview
DataCastle:http://www.datacastle.cn/dataset_l
2)大模型調優工具
國外的大模型調優工具:谷歌、微軟。
最后總結
在過去,開發大模型的事情更多是專業的技術人員來做,而隨著時代的發展,未來AI可能將普惠到每個人。以后我們可能人人都會開發一個自己的大模型,用具有我們數據的機器人去工作、聊天。
而目前產品的使用流程仍存在門檻,對小白用戶的包容性不高,作為AI開發產品設計師,我們任重而道遠,一直在大模型開發流程做得簡單易用的路上持續努力~~
本文由 @MINGZI 原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
寫得很好!