AI時代打工人“升職漲薪”必修課,學會寫Prompt
在AI時代,掌握如何與人工智能有效溝通變得至關重要。本文將深入探討如何編寫高質量的Prompt(提示詞),這是與生成式AI交互的關鍵。通過具體案例,文章展示了Prompt在文生圖和文生視頻中的重要性,并提供了實用的寫作技巧。
想象一下,對英語沒有那么熟練的你正在和一位外國朋友用ChatBot進行翻譯交談。如果你給出的指令是“幫我翻譯”,翻譯可能會很生硬。但如果你說“請用地道的英語幫我翻譯,語氣要自然友好”,翻譯的質量就會好很多。這里,你對翻譯軟件的具體要求,就是一個簡單的Prompt(提示詞)。
Prompt就像是我們與AI溝通的說明書。就如同我們和人類溝通時,說話的方式會影響對方的回應 —— “幫我倒杯水”和”請問能幫我倒杯溫水嗎?我有點不舒服”就會得到不同的反應。同樣,給大模型輸入不同的Prompt,也會得到天差地別的結果。
作為人類與生成式人工智能的橋梁,也是使用者唯一可以影響到輸出結果的方式,Prompt的重要性一直遠遠超過大多數人對其的重視程度。怎么寫好一個Prompt,也一直都是衡量一個人能否用好AI工具的重要評定標準,而在文生視頻成為AI創作者的工具之后更是如此。
譬如你想復刻詩仙李白的經典詩句“舉頭望明月,疑是地上霜”場景,如果只是把詩句輸入其中,那么你只能得到這樣的視頻:
emmmm,這樣的“舉頭望明月,低頭思故鄉”確實沒有錯,但卻絲毫沒有原先詩句中的情感因素。
而不止是文生視頻,在日常使用更多的大語言模型中,Prompt的優秀與否、合理與否,生成的結果可以說是天壤云泥之別。
那么,在大模型已經邁向應用的現在,該怎么寫一個符合自己需求的Prompt?又有哪些好玩的Prompt呢?
第一部分:文生圖生視頻,寫好Prompt事半功百倍
最需要寫Prompt有能力的,一定是文生圖與文生視頻了。
因為在日常同各類ChatBot聊天的過程中,哪怕你對Prompt并無任何了解,只是以最直覺的自然語言進行溝通,在多輪對話之后,你總能根據反饋來調節自己的要求。但文生圖/視頻卻不同,受制于生成算力成本與生成時間,一個簡單的鏡頭很難進行十幾次甚至幾十次的反復微調。
對于更多的普通使用者來說,他們往往會遇到一種情況,那就是明明自己腦中已經有了完美的構想,但只要一面對輸入框大腦就一陣空白,想了半天最后只能打出幾個字,“一只可愛的小狗”。
生成的結果雖然不錯,但我相信,如果你腦海中本來就有了假想圖,這些很難讓你滿意,
此時,學會怎么寫一個Prompt,就很重要了。
其中,對于文生圖而言,你在Prompt中給出的信息越詳細,生成的效果也就會越好。
不過,不同人描述同一張圖片有不同的方式,可能有些人會用簡單的十幾個字描述,也會有人拿出“長篇大論”,用幾百甚至幾千字“事無巨細”地將所有細節全都納入其中。
如果你想要把文生圖變成生產力工具的話,這都是不可取的。太過簡單的Prompt會給大模型過多的想象空間,距離你所希望的模樣自然就會有所偏差;而太過細節不僅會浪費大量時間,還會讓大模型不明白哪個才是你的主要訴求。
一般情況下,想要生成一張不錯的圖片,至少需要對“風格、主體、場景、畫面、細節”進行限制,只要抓住這些重點,就能保證不會出現嚴重的漂移,也能大大省下工作量。
就以上面“一只可愛的小狗”為例,若是我想生成一只小金毛在草地上的圖片,就可將Prompt進一步豐富,而生成的圖片也就完全不同了。
注:上圖為生成圖片,下圖為更新豐富后的Prompt
而文生視頻也同樣如此,其實可以看做是在文生圖的基礎上讓Prompt也“動起來”。
文生圖的Prompt可以用“風格、主體、場景、畫面、細節”來概括,而文生視頻的Prompt核心則是“光影、主體、主體運動、場景、場景變化、氛圍”,其實也就是把一幅畫的“風格”變成了一段視頻的風格——“光影”,“細節”變為了“氛圍”,核心思想沒有任何更改。
回到開頭的“舉頭望明月,低頭思故鄉”上來,如果Prompt像下面這么寫,就會有不錯的效果。
如果不會寫Prompt,那就交給大模型吧,幾乎所有大模型產品都有幫助用戶寫Prompt的智能體,只要你給出要求就能得到很好的Prompt了,如果還有什么不滿意的地方,也可以多輪對話進行修改。
第二部分:好Prompt,讓大模型突破天際,能直接打造出產品
相比于文生圖、文生視頻所需相對固定的Prompt,其實我們使用最頻繁的大語言模型在Prompt上的可塑性更強,只要能配上好的Prompt,大模型給出的上限會被無限拔高。
而其中發生在不久之前且十分有代表性的事件,就是用Prompt將Claude3.5“進化”成為了堪比滿血版本的o1。
具體來說,就是在去年11月的時候,一位17歲的少年用一條Prompt,就把o1的思維模式“復刻”進了Claude3.5中,讓其本來的思考變得更詳細、更擬人。截至目前,已經在Github上拿下了13.9k的星標。
而這個名為“Thinking Claude”的Prompt,把人類“接收到問題之后先詳細地分析信息,再思考所有可能解決方式,然后嘗試每一種解決方式并進行驗證,最后給出詳細解答”的過程,邏輯清晰、詳盡全面并采用深度思考的方式寫成了一條Prompt,只要輸入Claude 3.5中,其就能秒變性能強大無數倍的“新模型”。
以“幫我規劃一下先去廣東后去廣西,為期10天的旅行吧”為例,在沒有加入Prompt的時候,其并未考慮分配時長和旅行的具體情況,只是粗暴地55分配給兩省,接著把10天的旅行時間平均分到了10個市區的不同旅游景點,而且在景點的設計上也更像是把著名景點做出了羅列。
但在加入Thinking Claude后,回答會分為思考部分與正式回答部分,思考部分展現了它有對時間分配、地理位置、季節/天氣因素、特色景點和體驗進行綜合考慮,最后給出了包括行程安排、交通建議和特別提醒的以下回答。
圖1為思考鏈,圖2為生成回答
而除了可以全方位增強大模型的能力與回答質量外,還可以用一個Prompt把大模型“捏”成你想要的模樣。
其中很有代表且比較好玩的案例,就是Prompt領域頂尖創作者李繼剛老師的漢語新解了。
顧名思義,漢語新解就是利用大模型的能力,在Prompt的規范與幫助之下,將一個漢語詞組給出更加適合當下環境的解答。
譬如“七上八下”,使用該Prompt后輸出的內容就對打工人和股民進行了“陰陽怪氣”:
“現代人的日常狀態:
早上七點上班,像上緊的發條。
晚上八點下班,像放完的氣球。
一天下來,心在天上飄,人在地下跑。
既不是七也不是八,
更像是個無限循環的∞符號。”
“像是股市里的散戶:
上漲時心跳七下,
下跌時肝顫八回。
最后發現,
慌得七葷八素的只有自己,
而莊家們正悠閑地喝著下午茶?!?/p>
而對于“百度”一詞,它也給出了更辛辣的諷刺:
“說是‘有問題就會百度’,
但總是在問題最關鍵處顯示:
‘啊哦,您要找的內容不存在哦~’
倒是廣告特別誠實,
永遠都在第一條等著你。”
這樣品質的漢語新解,已經完全可以當作是一個類似于已經“去世”的小雞詞典的產品了。而這,也是Prompt的強大之處。
而你想要將這樣的Prompt也裝入你的生活與工作中的話其實也并不難,同上面給文生圖與文生視頻一樣,只要你有想法,大段生成Prompt的工作都可以交給大模型去做,然后再根據輸出結果進行微調即可。
不過,雖然有大模型可以作為幫手,但人還是其中的靈魂,想要寫一個優秀Prompt既要有足夠過硬的工程素質能力,又得有對文本的敏銳表達。而這,也意味著未來優秀的大語言模型使用者一定是“文理兼修”的那個,那么,你有什么想要通過寫一個Prompt然后批量處理的工作嗎,快來試一下吧!
作者:楊啟隆 編輯:丁力
本文由人人都是產品經理作者【新識研究所】,微信公眾號:【新識研究所】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!