對話ChatGPT:Prompt是普通人“魔法”嗎?
隨著ChatGPT等AI應用模型、AI技術產品的出現,Prompt這個概念,也出現在了眾人眼前,因為某種程度上,Prompt可以理解為控制AI的指令,可以在生成式AI的語境里發揮引導價值。具體如何解讀Prompt的存在與應用?不如來看看本文的解讀。
在ChatGPT、Midjourney、Stable Diffusion等新事物的作用下,不少人或多或少聽說過Prompt的概念。
雖然OpenAI掀起的大模型浪潮再度刷新了人們對AI的認知,但現階段的AI終歸還不是強人工智能,大模型里的“知識”存儲在一個隱性空間里,需要輸給AI正確的指令,也就是過去幾個月中頻頻被討論的Prompt。
有人將Prompt翻譯成“提示詞”,也有人翻譯為“激發詞”。再感性一些,就像童話故事里的魔法一樣,Prompt是AI時代的魔法,擁有它就擁有“巫師”一樣的能力。
一、Prompt是什么?
并不難理解Prompt的字面含義,可為何會出現Prompt這個概念?既然是ChatGPT炒熱的新名詞,不妨讓ChatGPT自己來回答。
這個回答中規中矩,但還是可以提取到一些有價值的信息:一,Prompt繼承了計算機編程里的命令行提示符,可以理解為控制AI的指令;二,在生成式AI的語境里,Prompt的價值在于引導,而非計算機里的命令。
打個比方的話:大模型就像是人類的大腦,知識被存儲在神經元聯接中,只有當你遇到具體的問題時,就像“你最喜歡的食物是什么?”大腦才會給出確切的答案,Prompt等于是一個個具象的問題。由此產生了一種流行的說法,即提問比回答更重要。你使用ChatGPT所遇到的“邊界”,實際上是你自己的“邊界”。
但Prompt的價值體現,并不在于ChatGPT代表的對話機器人,而是Midjourney為首的圖像生成類應用。
簡單來說,你要告訴AI想要什么樣的圖,想要把自己腦海里的東西變成肉眼可見的圖案,需要幾十個單詞作為Prompt。哪怕只有一個提示詞的差異,AI所生成的圖像都可能有著質的差別,怎么正確地給AI投喂Prompt,逐漸成了一門深奧的學問,并衍生出了提示語工程學(Prompt Engineering)的說法。
以至于在衡量大模型的能力時,出現了三個標準:一是大模型的預訓練水平;二是用來進行預訓練語料數量和質量;三是提示語的水平。直接的例子就是外界對文心一言文生圖的質疑,即使不考慮前兩個因素,單單在提示詞方面,就足以讓文心一言和Midjourney拉開幾條街的距離。
因為在文心一言上想要生成圖片,普遍給的指令是:幫我生成一張XXX(這也是百度官方的示例),解析為Prompt時注定只有幾個提示詞,遠不足以表達腦海里想要的畫面;同樣的需求給Midjourney,可能是十幾個乃至幾十個提示詞,大模型可以更準確地理解并輸出用戶想要圖案。
理解了這些差異,便不難讀懂Prompt走紅的原因。
目前大模型對算力的要求很高,以OpenAI的DALL?E為例,生成一張圖片的收費約0.02美元,如果讓不懂Prompt的人去調用模型,大概率會浪費掉一次次算力。何況當前想要生成滿意的圖片,需要不斷重復調整,能否熟練運用Prompt,直接左右了大模型所能釋放的生產力。
二、Prompt 還能賺錢?
利用信息差賺錢向來是最容易做的生意,生成式AI也不例外,Prompt作為AI時代的魔法,已然成了不少人用來“賺錢”的生產資料。
第一種:直接售賣Prompt。
國外已經出現了PromptBase等明碼標價的平臺,涉及Midjourney、Stable Diffusion、DALL?E、GPT等多個模型,而且適用的場景越來越細分,包括音樂創作、兒童插畫、油畫藝術、人物肖像等等,即便是不擅長整理提示詞的普通用戶,也可以直接復制Prompt生成相對不錯的作品。
其實國內也有類似的現象,一些商家早已在電商平臺上兜售Prompt,也有一些人將Prompt做成面向垂直任務場景的應用,比如AI 寫評語、AI寫郵件、AI翻譯等等,吸引剛需用戶按月付費使用。
第二種:用Prompt換流量。
國內最早一批售賣AI課程的自媒體,多半將Prompt作為吸引用戶付費的籌碼;小紅書等年輕人扎堆的平臺上,早早出現了分享Prompt的筆記;B站、抖音等視頻平臺上,教用戶使用Prompt的教程已不可計數。
個中邏輯并不復雜。Prompt是駕馭AI的“咒語”,但提示詞本身并沒有版權效應,或許直接兜售Prompt可以快速變現,終歸是不長久的買賣。將Prompt作為漲粉工具,趁機吸引到可觀的粉絲群體,在流量變相高度繁榮的互聯網江湖,無疑更符合市場規律,也是Prompt被廣泛討論的另一重誘因。
第三種:靠Prompt“找工作”。
正如前面所提到的,正確使用Prompt已經是提升生產力的前提,不單單產生了提示語工程,還醞釀出了一批“提示詞工程師”(Prompt Engineer)。
國外一位名叫Riley Goodside的小哥,靠ChatGPT的Prompt快速漲粉,然后被硅谷獨角獸Scale AI聘請為“提示詞工程師”,據說年薪高達百萬人民幣;另一位名為Jason M. Allen的藝術家,則使用Midjourney贏得了Colorado State Fair周年藝術比賽……如果說計算機時代的能力密碼是編程,在生成式AI席卷全球的當下,Prompt正悄悄成為數以萬計打工人“傍身”的工具。
至少就目前來看,程序員群體里已經漸漸興起兩股風潮:一類人瞄準了OpenAI等大模型企業的API,想要坐在人工智能的副駕駛上創業;另一類人打起了創造Prompt的主意,想要利用信息差賺到第一桶金。
倘若ChatGPT的出現當真是所謂的iPhone時刻,圍繞Prompt的生意其實才剛剛開場。
三、Prompt 只是過渡?
相對應的一個問題是,Prompt是否是人工智能大眾化不可或缺的一環?這個問題的答案直接影響著Prompt和Prompt Engineer的紅利周期。
Open AI 的 CEO Sam Altman曾公開表示:五年后,就不再需要 Prompt Engineering。也許在接下來的一段時間里,我們仍需要提示語,需要去創造 Prompt,但生成式AI的發展速度可能超乎想象,AI對人類的理解力遠未觸達天花板。
可以佐證的是,第一代iPhone上市時還沒有App Store,僅預裝了瀏覽器、iPod、郵件等少量應用,想要安裝其他應用,需要在電腦上安裝iTunes,用USB線將iPhone連接到電腦……為了解決用戶體驗上的局限性,越獄工具和第三方應用商店應運而生,但在蘋果引入App Store后,越獄工具漸漸被丟進了歷史的故紙堆。
同樣的問題詢問ChatGPT,答案似乎客觀了許多。
想要不用特定Prompt就能和AI流暢對話,ChatGPT認為需要解決四個挑戰:
- AI需要更好地理解語境和連貫性,哪怕用戶像《大話西游》里的唐僧一樣喋喋不休,或者語無倫次,AI也可以準確理解用戶的意圖,這樣就不需要精確的提示詞,用自然語言進行提問。
- AI需要有豐富的常識和推理能力,即根據特定的信息和場景做出合理的回應,而非像現在的模型那樣“對牛彈琴”,比如中文里的多義詞、不同場景下不同含義的語氣詞,非??简炌评砟芰?。
- AI需要理解和處理情感信息,這也是當前AI研究的重心所在。人的情感可以有很多種表達方式,文字只是其中重要的一種。在大模型不斷向多模態演進時,視覺和聲音是否也可以傳遞信息?
- AI需要有主動學習和適應能力。主動學習是指AI系統在學習過程中,能夠主動選擇最具信息量的樣本進行學習,在數據稀缺的情況下做出更好的決策;適應能力是指AI在面臨新的任務、場景或環境變化時,能夠自我調整并優化其行為。
按照ChatGPT的標準,在Prompt消失的時候,勢必已經進入到了強人工智能時代,目前還有很長一段距離。
Prompt及其衍生機會的消亡是一種歷史必然,在時間上仍有很大的不確定性,也許會很快出現另一場技術爆炸;也許AI會進入新一輪的瓶頸期, Sam Altman的五年預期不過是“盲目樂觀”。
四、寫在最后
或許可以借用科技媒體《VentureBeat》的說法:現在已經到了AI藝術的轉折點,未來的藝術家無論是自學成才還是科班出身,都需要有創造Prompt的能力,需要理解和學習數據科學,以及大模型的工作原理。
進一步延伸的話,需要有這些能力的絕不只是藝術家,任何職業、任何行業的工作都不可避免和AI協作,將人類的思考和需求注入給AI,不斷更新、創造Prompt,將是大多數人必須要掌握的一種技能,就像現在必須要用輸入法打字一樣。
作者:顧青云、ChatGPT;編輯:沈菲菲
來源公眾號:Alter聊科技(ID:spnews),主理人:Alter。
本文由@Alter 授權發布于人人都是產品經理,未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!