萬字長文:ChatGPT商業化落地方向拆解

1 評論 10561 瀏覽 24 收藏 47 分鐘

ChatGPT 的出現將 AIGC 這個概念捧上了熱度高點,但是在討論熱度過后,ChatGPT 的發展還需面臨一個關鍵問題,即其如何才能實現商業化落地,找到后續的發展路徑?那么對?ChatGPT 而言,有哪些可以參考的商業化落地方向?

前言:我希望謹慎地做出判斷

雖然媒體狂歡、大廠跟進,所有跡象都表明一個新時代正在到來。

但是在前文發布后,我和很多人進行了交流。給我印象最深刻的就是,有些朋友在表達感謝后,總會忐忑地追問一句——“你覺得ChatGPT方向能落地嗎?”

他們中有面臨職業抉擇的打工人,有躍躍欲試的創業者,有二級市場的沖浪者,有一級市場態度謹慎的投資人。所有人都在岸邊謹慎、克制地觀望。所以,究竟能落地嗎?如果能,是100%完全能嗎?哪些方向可以哪些方向不可以?如果不可以,那么為什么不可以?

因為少年時的AI幻想成真感動感動是一回事,客觀的現實又是另一回事。而且當我的建議會對其他人產生影響,這就愈加讓我謹慎。

OK,前言就到這里,我將開始我的推理過程,向你展示我整個過程中的所思所想。

如果你對推理過程不感興趣,可以直接看結論——“我相信他能夠成功落地,并且將是一個時代的開始。”

但是我更希望你跟隨我的思考過程,就像GPT模型中用到的思維鏈CoT技術一樣,我們“think step by step”,當每個環節都清晰無誤時,最終的答案也將更值得信任。

第一步:開始思考前,想清楚如何思考

我們需要更清晰地定義我們的問題,從我們自身的角度出發(打工人、創業者、投資者等)。并在隨后圍繞定義來確定我們要去加載哪些方面的知識,并基于這些知識做出符合利益和邏輯的推理。

我所尋求的答案是“AIGC這波狂潮能否落地”,那么:

01

首先,這是一門生意。而生意的本質就是價值交換,并在過程中積累剩余價值。所以他的首要原則一定是能跑通商業模式,賺到利潤。

當然,生意要賺到錢是誰都知道的道理。AI繪畫也能賺到錢啊,有人靠激勵廣告打平收益,有人拿到了融資,有人延伸出了提示語買賣。

02

是的,所以我還期望他具備足夠寬度的賽道,能夠支撐百花齊放。因為這樣對于打工人來說,他進入這個方向才足夠寬闊,擁有突破天花板的可能,對創業者來說市場的機會足夠多,避免扎堆死在沙灘上,對于一級市場投資者來說有足夠的種子進行選擇試錯,對于二級投資者來說,百花齊放的涌現才是這個賽道長久生長的推力。

在這里我們觀察一下AI繪畫,他的賽道是不是一眼就望到了盡頭?你敢投入其中嗎(此處假裝忽略Diffusion技術后續的潛力)?

03

然后,找到新技術帶來的增量市場

我們要避免被媒體詞語迷惑。什么是媒體詞語?就是標題中的“AIGC”。

事實上這波狂潮中只有AI繪畫背后的Diffusion和ChatGPT背后的GPT這兩項技術產生了應用端的突破。但是AIGC詞語一造出來,干涸的互聯網終于迎來了久違的新概念,媒體迫不及待將他扶上王座,繪制出一張張行業全景圖。

但事實上真正因為這兩項技術發生影響的行業是哪些?受到影響的行業就一定存在增量機會嗎?我搜集材料時一般剛開始的時候是不看投研式的報告的,很寬很全,但是好像知識從腦子流淌過去,看完什么也沒留下。

特別做過匯報PPT的人應該知道,很多時候為了結構式美觀,你會硬湊信息,比如這個產業鏈只有2條不好看呀,我湊夠3個來個金字塔布局。這種信息會誤導思維框架的的建立,我一般是建立了體系化認知再去看報告來補充參考的。

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

OpenAI CEO對資本造詞“生成式AI”的嘲諷

05

緊接著,讓我們首先瞄準核心的應用場景,暫時忽略上下游布局。

當一個地方發現金子,馬上就會有為淘金者服務的餐館、旅館、勞保店出現,但這這一切的前提在于必須能發現金子。核心應用場景就是這波浪潮中的金子,只有找到在消費端能夠跑通模式的場景,才會關聯延伸出相應的上下游產業。因此在這個問題的思考過程中,上下游產業是不重要的,我們不需要投注任何精力去關注。

06

最后,讓我們基于如上推理,重新構筑對這個問題的定義:“當前是否有足夠多的受到兩個新技術影響產生增量機會核心場景能夠跑通生意模式,獲取盈利”。當我們收集的知識滿足這些條件,我們就認為答案是“是”。推導順序如下圖:

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

第二步:開始組裝知識框架

在有了思考的方向后,我們需要構造知識框架,哪些重要、哪些不重要、哪些要素之間互相關聯、影響、先后順序是什么等等。

首先,搞錢是最重要的,即核心場景,第一個要做的就是盤點應用場景,客觀評估其商業模式及可行性。

其次,場景不是獨立存在的,有大量因素影響制約。其中影響最大的是技術,其次可能是政策、道德等。

最后,我們在知識收集過程中,必定面臨一些困難。例如自身的知識洼地無法跨越,或是元素過多無法窮盡,我們需要應用一些抽象、指代的方法來跨過這些障礙。

基于上述原則,形成我們的收集框架:

優先梳理商業部分,并在遇到知識洼地時采用抽象要素、同理推斷、指代推斷等方法。

技術現狀決定當前生意是否成立,技術潛力決定生意的上限天花板。作為重要支撐因素進行分析。

限制因素如道德、政策、版權等,對主干不構成影響,放到最次優先級大概看看就行,對行業未來可能的限制稍作了解。導圖見下方:

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

對了,補充一下接下來這篇文章將只分析GPT是否能夠落地,不涉及AI繪畫,這是因為:

1)我做不到

AI繪畫的材料我收集了,但是還未整理,后續會有一篇《AI產品經理視角下的AI繪畫全解析》。我要等那篇文章寫完了,思路才會清晰,沒想清楚之前我就不亂說了。

2)其實也沒必要

兩項技術雖然都具備突破性,但目前ChatGPT的延伸方向、變革程度,都是遠遠高于Diffusion的,所以如果ChatGPT能論證成功,不用等AI繪畫,我們也可以推出標題中的答案。

第三步(1):基于框架進行知識填充——商業篇

我們先說盈利模式和成本控制兩部分,然后帶著相關認知去盤點場景。

1. 盈利模式

互聯網主流盈利模式無非三種:

1)廣告/流量模式

通過免費產品吸引用戶使用,促使用戶投注大量時長/頻率,再從中切割廣告流量從而盈利。在目前短視頻、中長視頻、游戲、小說的圍剿下,我不看好ChatGPT所創新的應用能夠搶奪足夠份額的時長。邊角料的時長空間或許可以,但上限不夠大。

而且一旦涉及時長爭奪,我們所描述的肯定是C端娛樂應用。對于有野心的玩家來說,是很難接受讓廣告突破用戶體驗的。

不過小規模應用其實可以考慮,特別對于獨立開發者來說,激勵廣告變現是一個很好的方式,雖然我手里沒有數據,但AI繪畫在過去的半年內已經證明了可以實現收益打正。

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

AI繪畫暫時形成一條應用-消費的小市場,但上限很低

不過我感覺廣告模式應該是最不適配的,除非技術再進行突破,或出現意料外的殺手應用。例如一個讓你愿意每天投入半小時進行聊天,并且他放廣告你還不反感的虛擬人……這有可能嗎?

2)商品模式

商品模式是最傳統的,一手交錢一手交貨。只是這種模式下,交易是一次性的。2B端的定制開發服務,游戲充值都可以用這種模式概括——當然也包括賣實體商品。

但是商品模式最需要的是“復購動力/頻率”,游戲充值有沉浸心流、社交貨幣、排行攀比等心理方法來推動,實體商品則來自現實生活的復雜需求。

Chat的應用延伸,如果采用商品模式變現,需要考慮幾點:

  1. 是否可以延伸出豐富的商品——例如虛擬人物的劇本,不同的TTS音色,或者虛擬人物本身的購買。
  2. 這些商品的邊際成本如何,是否能控制到極低的程度?
  3. 這些商品用什么動力來推動復購?

B端會更明確一些,商品付費基于明確價值。例如49.9元1000次SEO文案生成/社媒生成/廣告語生成。而C端提供的價值不那么商業實際,需要考慮其他動力來刺激復購能想到的替代。例如宅男手辦、以及明星周邊/打榜。

3)訂閱模式

用戶周期性支付費用,以獲取某種服務、特權、功能。這種模式最重要的在于,花錢訂閱的那個東西對用戶是否具備“持續價值”。

2B方向的產品,可以不用討論,訂閱模式已經逐步替代商品模式成為最優解。我們慢慢看到不管是軟件服務的定制開發,還是本地應用軟件的license機制越來越少,取而代之的是訂閱模式。畢竟訂閱模式能帶來更健康穩定的現金流,這已經是非常大的優勢了。

而2C方向的產品,還充滿不確定性。比較經典的如視頻會員VIP所代表的娛樂價值,交友APP代表的社會尊重價值,GTD代表的生產力價值,2C向的GPT產品能否像他們一樣創造足夠的“持續價值”,還需要先行者為我們踩坑。

上述三種盈利模式簡單了解即可,他們之間不是非此即彼的。例如百度云盤限速下載,你可以用訂閱來做,也可以用商品來做,嚴格來說沒有那么明確的界限,純粹看那種盈利方式在商業測算上能帶來更大的利潤。

但綜合來看,商品模式和訂閱模式和ChatGPT的延伸應用會更為匹配。

2. 成本控制

成本可以分為三塊:

1)技術成本

GPT3.0的付費接口是3700個字/元(經過換算),這是最明確的成本線。除非等幾個月成本下降或國內大廠跟進做出服務開放,否則這個成本線會持續一段時間。

此外搭建相關服務、開發產品并維護也會產生費用,根據落地的形式不同。

2)運營成本

人力費用一般而言是大頭。即使排除算法角色(是的,只做應用層甚至可以不需要算法,所以這波技術浪潮對算法同學而言是非利好),那么也至少需要工程方向、前后端、產品設計等角色。

如果你是2B市場,還至少需要配備銷售團隊。整體的上限浮動空間非常大,從0人(獨立開發者)到幾十人都有可能。

另外還需要考慮辦公場地、器材購買、HR/行政等費用,當然你可以選擇全體遠程協作+服務外包等多種方式去降低。上下浮動空間也比較大。

3)增長成本

2B的增長成本來自PR費用,參會費用,以及銷售費用。部分to 小B的例如給電商從業者的還會涉及廣告費用。2C就更不用說了,除非運氣好裂變了,不然買量是離不開的話題。

目前比較好的是這個方向比較新,競價價格會相對低。不過也存在蹭流量現象,例如完全沒有相關要素的社交APP,也會投放含有“虛擬聊天”相關的素材。

2C還有一個利好就是一般做娛樂類應用,社交的買量價格起碼不像電商和金融那么恐怖。

帶著上述這些前置信息,我們會發現,考慮場景的生意模式的時候,我們不可能只按3700字/元來作為底線測算。整體的成本線可能要壓到2000字甚至1000字/元,才能抹平其他成本。

即我們需要做到,GPT每生成1000個字,產品能從用戶身上賺到1元。這樣營收與成本線3700字/元之間的差額就是我們可累積的利潤。

3. 場景盤點

帶著對盈利模式和成本線的簡單了解,我們進入場景盤點。

在這一部分我們要注意,我們沒有精力、也不可能將市面上全部的應用羅列。因此只能基于技術線應用可能進行分類聚合,然后基于各類別的關鍵要素進行分析。

4. 文本創作類

這是目前最火爆的一個分類。從文本長度來說,可以分為短文本、長文本、超長文本。從專業角度,可以分為法律、心理咨詢、教育、建筑、小說、公文等。再細致一點可以列出SEO文案、社媒內容、廣告創意、郵件寫作、公文信函、簡歷修改等等等等。

我們不可能把全部的可能組合起來,其結果將超出我們的分析能力范圍。

我們只抓兩個關鍵要素:怎么賺錢,技術能否支撐。

在這里,舉兩個例子:

SEO文章生成:在AIGC之前,人工手寫的SEO稿是有明確標價的,大約在千字10元~50元不等,個別優質的可以到100元。我們取一個最低值,就是千字/10元,離我們前文硬推的千字/1元之間足足有10倍的價值差額。

電商運營提效:我是一名在西班牙的電商從業者,原本我雇傭了一名本地運營,幫助我維護西語系國家的站點?,F在通過AI的能力,仍然是這名運營,可以在多個不同語系,數十個細分市場中維護站點。那么這中間的差額就來自1名運營人員和N名運營人員之間。

我們會發現,他的模式本質上是AI在內容創作這項勞動上,制造了剪刀差。只要這場浪潮沒有完全結束,內容創作的社會必要勞動時間沒有完全進入另一個層面,剩余價值就會自動從動蕩的剪刀差中掉落。

而在技術層面而言,目前的技術支撐程度,簡單來說就是:文本越長死的越快,結構越復雜死的越快,但短文本和通用內容方面已經是如魚得水,非常成熟。

不過目前已經有人在中長文本方向進行努力,他的推理能力也在加強,所以技術的突破和垂直領域適應是一個非常值得期待的方向。

綜上,我認為,文本生成領域是一個完全的增量市場。并且隨著技術的進一步提升,他的規模更逐步擴大。補充:其實還有一些小分支領域,例如文本糾錯、實時翻譯等,但是都不如文本生成夸張,所以就略過了。

5. 代碼生成/糾錯/Sql/語言轉換等等等等

這是目前海外第二火爆的分類,獨立開發者很多。不過分析到這里我遇到一個尷尬的地方。我并不是程序員,無法設身處地去設想是否愿意為相關的服務付費。

哈哈,所以我把問題轉手給我的程序媛夫人,讓她在旁邊靜靜思考一下。我們先從這個領域的技術情況開始分析。

首先,不要被媒體稿迷惑。就目前而言,GPT無法替代程序員。他的代碼生成能力,在常規問題上能夠正確,但是一旦你換一些變種,他就會給出看似正確其實離了大譜的答案。

這項技術的應用前景,更多在于代碼輔助寫作,例如快速生成一個簡單模塊,對代碼進行自動Bug檢查,生成Sql語句、代碼解釋等等。但是都需要人工二次review,他能夠幫助你的主要在于快速的檢索、簡單代碼的快速寫作、自動糾錯等輔助功能。

并且這方面和文本生成領域不太像,技術角度產出的結果質量還不夠高,不太能形成巨大的剪刀差。但目前的技術已經實現了一定的效率提升,以及門檻降低。效率提升:有助于程序員們coding環節加快速度。門檻降低:門外漢已經可以通過開發工具+GPT實現部分專業領域的簡單設計(例如Unity+GPT做游戲)。

好了,回到商業價值上,一段時間的思考后,程序媛老婆給出了堅定的答復——“我們花這個錢干什么,當然自己做一個啊。”我:“0.0???”

我有點不太相信,但是找了一圈這個領域的投融資情況,找不到太多的例子,只看到OpenAI有投資消息:一家代碼編輯,一家開發工具。但再往下細探就找不到任何相關消息了。

好吧,我只能認為暫時而言,這方面的商業前景可能不太樂觀。2C側暫時相信老婆大人的判斷,應該比較難創收;而2B側需要企業判定對自身內部效率有幫助。而眾所周知,提效類的2B服務,往往比不過營銷類這種能直接創收的服務……

綜上,這是一個完全的增量市場,但是商業化機會似乎不太美妙。比起有一個成熟公司在這里殺出來,我更期待獨立開發者或者是大廠做出的自用工具然后開源。畢竟——“當然是自己做一個啊”真的是程序員獨有的浪漫了吧。

6. Chatbot方向

在說Chatbot方向前,我們先提煉新技術對這個領域的影響,然后帶著這些認知去做場景盤點。

簡單而言,ChatGPT的技術讓對話更自然了。這里的自然包括純閑聊部分,也包括QA甚至Task任務。一個能夠聯系上下文,并對知識進行整合推理的Chatbot,對以往的機器人會是一種顛覆式的升級,能夠跨越以往用戶體驗的上限。

整體上,我將Chatbot分為以下方向:

1)客服類

這部分包括目前各個主流平臺自研的機器人或者提供相關服務的客服機器人企業。

從技術上來看,有非常大的變化,甚至推動技術棧重構。但是從商業上來看,有可能影響寥寥。

客服bot的市場中,仍然有一些競爭者,他不止ChatGPT,甚至連BERT也沒有應用,仍然是相當老舊的一套系統。而他們既然仍然在這個市場保有份額,自然有其原因——某些時候,2B的市場中,技術不是第一競爭力,服務、渠道、價格都會比技術重要。

而新一代語言模型技術的出現,不過是給這個市場增加了一點擾動。已經買了產品的,因為遷移成本,渠道關系不一定馬上會切換。技術服務商可能會緊急跟進嘗試,但也不妨礙部分競爭者慢悠悠甚至毫不在意。

并且一個關鍵點在于,GPT技術除非自行部署,否則意味著自身的核心能力轉為依托于大廠。這是不是客服機器人公司所能接受的,還存在疑問。最后ChatGPT模式下,算力成本以及時延會變得難以忽視,會給這個方向帶來一些陰影。

綜上,我覺得客服方向,屬于舊技術盤踞的存量市場。技術蝶變在部分公司會狂風暴雨(但落地會很謹慎),在部分公司可能進展較慢或無動于衷。

2)娛樂類

娛樂類即只提供情感/娛樂價值的方向,上篇文章提及的APP Glow 是一個典型例子。對于這個方向來說,技術上讓情感價值的提供成為現實(AI更自然了,沒那么智障了),但是非常需要結合情感場景的設計。

而脫離場景設計的結果,最典型的就是ChatGPT本身。ChatGPT當時在11月30日發布后,用戶們是情不知所起,一往而深,再而衰,三而竭,僅僅一周左右的時間就銷聲匿跡。因為沒有任何一個人的需求是“聊天”,以及看一個AI“賣弄聰明”。

在上篇文章中,我大概說了一些關于娛樂類Chatbot的一些想法,這里不再重復闡述這種方案的細節描述,沒看過的朋友可以移步此鏈接:輕松小補充:GTP APP全景地圖+虛擬人構造想法+prompt模式詳解,看第二部分就行。

我們重點說說商業上的問題,先來回顧下上面提及的關鍵點:

  1. 1000字/元的成本線;
  2. 基于訂閱收費模式所需要的持續價值;
  3. 基于商品收費模式所需要的復購動力。

其中成本線問題需要通過產品設計繞開,不能讓用戶的行為時間大量投注在閑聊中,否則隨著文字互動量的上升,成本將急劇飆升。

一種可能的解決的方式是以閑聊交互為核心行動線,穿插劇本設計、劇情推動、用戶自主人設構建等玩法,來減少算力損耗——總之就是不要只能聊天,撐不住。

還有一種比較騷的玩法,可能是在Prompt層面對模型進行約束,例如下面這張圖,ChatGPT會強制在問題中引入一段前綴,以此限制答案長度節約算力。

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

而持續價值和復購動力可以合并來說,因為這兩種收費模式其實很容易互相搖擺。一個比較好玩的做法可能是構造“角色”的獲取-使用-厭倦-再獲取這種閉環。這套模式已經被諸多集卡類游戲深度驗證過,也成功從我手中掏走了不少錢(該死的原神!?。?。

綜上,我認為娛樂類BOT是一個完全的增量市場,技術的突破成為這個方向的關鍵要素。但是市場強依賴對用戶需求的打磨和設計,到底應該怎么做,還需要摸索,目前大家都在嘗試。

3)工具類(助手類)

工具類包括語音音箱、手機語音助手、車載語音助手等。從技術上來看,我覺得非常大的問題在于“實時性”,我從圈內朋友獲取的信息是,目前接口調用的時延在1S以上(不知道是不是因為服務器距離導致)。這種延遲很難說可以應用在上述場景,他的用戶體驗將十分糟糕。

除了這個缺陷以外,技術上對工具類BOT的體驗提升將是非常大的幫助(上面說過了不再重復一遍了)。但從商業上來看,我認為這也是一個舊市場。

或許你會認為,可能有一家創業公司,依賴全新、更好體驗的語音助手殺出重圍,擠占原有語音助手的空間。但需要我們注意的是,這些助手雖然是軟件,實際上卻非常依賴自身的硬件渠道——小愛依托小米,Siri依托蘋果,車載助手則在各個汽車品牌之間互相割裂。我感覺這個領域應該是產生不了新蛋糕的。

不過比較有意思的是,雖然看起來和客服類一樣是個存量市場,但工具類Chatbot會熱衷于擁抱這些新技術,因為這將有助于提升他們的用戶體驗,從而推動他們硬件渠道的增長。綜上,我認為工具類方向半舊不舊,沒有增量,但更樂于擁抱新技術。

4)專業類

專業類指需要獨特領域知識的Chatbot,例如法律咨詢機器人、投顧機器人、心理咨詢機器人等。

這類機器人有幾個特點:第一,專業要求高,需要專業人員調教驗證;第二,結果輸出要求穩定/高質量,需要為結果負責;第三,部分場景使用頻率偏低(例如法律Chatbot,普通人一輩子用不到幾次);第四,極度需求高質量專業數據。

從技術角度來說,GPT給他們帶來的升級效應較小。因為這個領域最困難的并不是交互過程、理解過程的升級,他面臨的困難始終來自專業數據,低頻場景。不知道GPT是否可能掛載額外的知識庫,而不需要專業數據在預訓練環節重新接入。如果可以的話,應該有助于提升用戶體驗的上限。目前看到一個法律領域的BOT,如下圖:

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

在我一位律師朋友看來雖然還會有些錯誤,但已經相當自然通順,相較過去基于舊技術的專業機器人已經有一些提升。綜合來看,對當前體驗沒有顛覆性升級,場景低頻難以變現。

一條可靠的路徑可能是先做給專業人員的輔助工具,然后在使用中積累數據優化再開放。我認為他暫時是一個有一點潛力的增量市場,需要結合技術演進和專業落地嘗試再細看。補充:專業領域太多了,非常需要行業經驗逐一盤點,所以這段判斷僅供參考,存在較高錯誤可能。

7. 游戲方向

頭部的應用方向基本就是Chatbot、文本生成、代碼這三個領域,而游戲其實暫時我看不到太多優秀的例子。這是我目前唯一找到的case:AI地下城,文字交互類游戲。但是我畢竟是20年+的游戲玩家,為愛發電也要強行聊一波:

1)NPC流水線

NPC制作的幾個制約因素都被本輪技術升級覆蓋。包括NPC背景故事的生成(短文本),NPC自由對話(基于人設的對話),NPC頭像、3D建模生成(頭像比較容易,3D建模有點困難,但NPC外貌重要性弱一些),NPC好感度機制等。其中自由對話模塊已有現成的case,一名玩家為《騎馬與砍殺2》制作了一段實驗性demo,見下圖:

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

詢問NPC村民能否鑄劍,得到肯定回復并詢問預算及材料

2)任務流水線

任務制作的影響范圍相對較小,因為他會涉及到數值設計、關卡設計、上下游依賴任務等問題。但在單環任務,一次性任務上,新技術將在任務文本生成,任務選項等方面起到幫助。這方面我勉強看到一個例子,不過他是劇情式游戲,僅供參考。

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

中間那個>You gogogo 就是我的命令,可惜寫這篇文章太累了,投不進心思玩

3)交互模式

傳統的游戲交互方式是界面(傳統鍵鼠或觸控)、體感(Switch或VR),奇葩一點的可能會加入聲音觸控(音調、音量、或者少數ASR識別關鍵詞)。

而GPT可以讓自然語言交互成為可能,即延伸出來的文本交互&語音交互會相當成熟。

但是并不是說更新的交互方式就一定更好,大家可以借鑒上一輪Chatbot的發展歷史來看。在Chatbot剛出的時候,極度追求極端的VUI交互(語音交互),但發展到后面都妥協了,采用VUI+GUI(圖形界面交互)的方式。這是因為語音或文本,天然是有其缺陷的,需要根據實際需求選擇組裝。

具體內容可以參見我2017年的一篇產出,現在回過頭看有一些更新的理解,不過我只剩個PDF了修改不了,就將就著看一看吧哈哈。

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

From《VUI設計方法分享》

不過游戲方向是非常特殊的,技術能夠為他帶來改變,但他的成功絕不會只靠技術。事實上,全智能NPC、全智能任務只是一種新穎的設計。真正一款游戲好不好玩,能不能打動人心,還有非常多題外的因素。

另外技術是否還能應用到其他領域呢?例如NPC決策邏輯,世界背景構建,新語言創造等——我不知道,但對技術永遠抱有期待。希望綠洲早日來臨!為了部落,waaaaagh!

最后收尾總結一下:游戲領域是一個100%的舊市場,但又和客服機器人、工具機器人不一樣,新技術可能讓這個領域出現顛覆性的新玩家。補充:或許MUD類型游戲會重新閃亮出場?這種類型可以甩開音樂、UI、建模等諸多成本,最先吃到這波技術升級的紅利。利用好玩家們對新技術的新鮮感應該會有一波流量,但后續留存就難說了。

8. 是否還有其他方向?

在上文列舉的文本生成、Chatbot、代碼生成,其實是ChatGPT演示中直觀帶給我們的靈感,只是在落地過程中,隨著參賽者的選擇,逐步延伸向了各自的細分方向。而游戲方向則是典型的,GPT技術+其他行業邏輯構造出的延伸方向。因此我們可以想象類似游戲這樣的擴展行業還有很多,只要他的行業中有大量關于文本的應用——哪個行業不是呢?

例如教育行業,能不能用GPT梳理、查找關聯知識點?金融行業,能不能用GPT閱讀會計報告、合同文件進行分析?我不知道哈哈,暫時沒有case,等待新玩家們涌現。

第三步(2)基于框架進行知識填充——技術篇

技術篇非常簡單,我們不再科普技術原理,技術原理已經在前文萬字長文:AI產品經理視角的ChatGPT全解析中大篇幅講過了。我們重新基于應用角度,梳理當前技術的現狀及潛力?,F狀決定短期內哪些能做哪些不能做,潛力決定未來橫向、縱向的擴展可能。大家可以用這些認知來掃描任何新出現的應用場景。

1. 技術現狀

1)結果不穩定,需要review需要Review,就意味著大部分場景不能脫離人,只能輔助人。除非你在做一些完全不在乎質只在乎量的市場,例如營銷號、SEO、刷評論。

2)推理能力弱,容易推出看似正確的錯誤答案結構復雜、邏輯復雜的場景無法適配,例如長篇小說容易顛三倒四,教育應用也要謹慎用在理工科方向的問題上。

3)知識更新困難,成本巨大知識無法通過Prompt獲取,源頭只來自LLM中的1750億參數,更新一次知識成本高,速度慢。所以無法適配需要緊跟時事的場景——但這不意味著不能用來摘要新聞,畢竟天底下無新鮮事。

4)延遲較高,實時場景不適配截止昨天2月3日我已知的信息是接口延遲在1~2S(可能有誤),所以暫時語音助手這種實時響應要求高的會不適配。但我覺得這個問題應該很快會被解決,工程問題無法求解是沒看到蛋糕,只要看到蛋糕性能迭代是非??斓?,AI的演進歷史本身就是一部效率迭代的歷史。

5)垂直領域表現未達最佳這里的垂直領域包含兩種解釋,一種是技術側的垂直領域,例如自然語言理解類的任務,暫時仍是BERT更優。另一種是行業側的垂直領域,例如法律、心理、金融等。我猜想一個原因可能來自原始訓練數據中缺乏高質量的文本數據。

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

From《Language Models are Few-Shot Learners》模型預訓練訓練中所用到的數據集

6)可掛載其他模塊,但目前沒有標準方法目前看到的一些方式是,用GPT作為輸入端,再用其他工具作為邏輯端,例如GPT+unity,GPT+Wolfram | Alpha。

一方面是這些掛載目前都是自發行動的,后續有可能會出現標準規范的GPT引用方式,甚至可能大部分應用會以“本店支持GPT-3”做為榮譽標識。另一方面我還沒看到更深層次、更觸碰GPT底層邏輯的實踐。

現在的實踐本質上和ifttt有點像,是兩個應用的解耦式聯合。是否能實現更深層次的呢?例如我們前面說的知識更新困難,有辦法通過掛載一個小規模的實時知識庫來實現嗎?不知道,等待玩家們的表現。

2. 技術潛力

1)更通用說白了就是從Text-Text到Text-everything。GPT已經證明了在NLP領域的統治力,而圖像、語音、視頻等多模態,其實只需要Text-多模塊的若干轉譯通路。我沒有針對性地搜集信息,但至少Text-image的通路是現成、成熟的。Stable Diffusion中一個關鍵技術就是OpenAI所提供的CLIP(Contrastive Language-Image Pre-Training)。

2)更便宜經過商業模式部分的分析,我們可以相信這個方向的應用潛力是巨大的。當應用可行時,配套的上下游產業鏈會快速出現,包括芯片、算法平臺、專屬云服務等等。不過前面就說了,上下游產業鏈不做分析,整個結果是不證自明的。我們只需要知道,按照邏輯推理,更便宜是100%會出現的就可以。

3)更強大一方面的提升來自于多種GPT方向大模型的嘗試落地。目前大廠們哪怕在短時間內會與OpenAI展開合作,但除了微軟以外,應該都無法忍受上游關鍵技術握在其他人手里。因此可預見的GPT的最上游會出現復數玩家來一起嘗試。

另一方面的提升來自模型結構的改進,2023年學術界的關于這方面的paper肯定會爆炸的。唯一限制他們的就是學術界如何繞開大模型訓練成本這一難關。應該會形成企業-學術這樣的合作通道。最后一方面來自各種垂直方向的適配調優,前面在分析商業模式盤點場景的時候已經舉了很多例子了。

第三步(3)基于框架進行知識填充——限制篇

在國內其實限制部分不用太快關注。畢竟我們現在是全面落后的狀態,整體的趨勢肯定是先追趕,再監管。反而海外因為OpenAI一枝獨秀,對相關方面的限制其實已經初現波瀾。下面大概展開說說:

1. 道德方面

1)有害言論。訓練數據質量+模型不可控性導致AI的回答像一個定時炸彈。目前的優化方式一方面是基于RLFH技術進行針對模型的道德訓練,另一方面是在答案輸入輸出時加裝敏感過濾器。

2)教育危機有一些美國大學封禁ChatGPT之類的新聞,事實上這不是一個噱頭。盡管模型的有很多缺點,但至少在社科人文類上表現還不錯。這個情況有點像當初的“以圖搜題”,后續可能會有政策要求對這方面進行限制。

3)內容泛濫這個問題是在AI繪畫領域、虛擬人領域都出現過的。抖音、小紅書等平臺,已經在限制基于AI繪畫的賬號。視頻號之前也禁止完全虛擬人直播,只允許中之人類虛擬人直播(現在還限不限不清楚)。本質上這是每個內容社區都會做的事情,內容質量和內容數量之間,永遠會傾向質量。

但是對AI生成內容的檢測,現在還沒有太好的方法。anti-spam這個領域如果不成功,以后的信息搜集將讓人絕望。感覺都可以看到營銷號改名機器號的那一天。

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

某平臺賬號限制說明

2. 技術代差/封鎖

1)技術代差在這方面我不是專家。但看大廠PR稿,全是樂觀,看技術大神的言論,全是焦慮,我也看不懂了。我還是相信大神們多一些,但也對國內跟進速度抱有期待。畢竟上一輪AlphaGo浪潮所代表的落后,最后也迎頭趕上了。

2)技術封鎖DDDD。

3. 政策、版權

有一個法規:《互聯網信息服務算法推薦管理規定》,我從里面找到了一些兩句相關的話,貼給大家參考一下:“發現未作顯著標識的算法生成合成信息的,應當作出顯著標識后,方可繼續傳輸”“不得生成合成虛假新聞信息”而版權方面目前沒有相關消息出來,炒得最多的還是AI繪畫領域,大家搜一搜就有新聞了,我就不多說。

重點說說GPT的版權問題。先跟我看下面這張圖:

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

模型訓練的語言分布,中文5%左右

在ChatGPT的體驗中,我們并沒有太發現他有摘抄、洗稿的痕跡。是否有一種可能是,他的原始素材中,中文占比僅為5%?

如果國內基于中文語料重新訓練屬于我們的GPT后,是否有導致AI直接抄襲語料中的答案,或者稍微洗稿后吐出?

這個答案只能等待國內的GPT模型落地我們才能看到結論了。但如果基于這種猜測,中文高質量語料會變得炙手可熱,比如知乎社區以及百度百科,另外人工標注訓練也可能會迎來一波春天。

第四步:推理出最終答案

經過上面的知識填充,我們最終得到這樣一張圖:

深度思考:AIGC這波技術狂潮能否商業化落地?(內含思維導圖)

我們接下來就要基于我們上述所有收集到的知識進行判斷。而我的判斷結果也很簡單,就是開篇那個——“我相信他能夠成功落地,并且將是一個時代的開始”。當然,會附帶一些小補充、小限制:小心舊技術市場,小心媒體詞語的迷惑,關注技術的更新等等。

是的,這一步就這么簡單哈哈。事實上做決策最難的永遠是信息收集,當擁有足夠信息時,答案近在眼前——是的我說的就是拉普拉斯妖。我相信能看到這里的朋友,應該心中也有自己的那份判斷了。

本文由@馬丁的面包屑 原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 厲害了

    來自海南 回復