范式的轉(zhuǎn)變:一個AI產(chǎn)品經(jīng)理對類ChatGPT產(chǎn)品形態(tài)的思考

3 評論 7340 瀏覽 29 收藏 34 分鐘

如今,AI已經(jīng)深入尋常百姓家,這個轉(zhuǎn)變,對于產(chǎn)品經(jīng)理來說更是一個設(shè)計產(chǎn)品范式得到根本性轉(zhuǎn)變。新一代的AI會帶來哪些新屬性呢?本文作者從產(chǎn)品/軟件設(shè)計的范式轉(zhuǎn)變、交互范式的轉(zhuǎn)變和PMF范式的轉(zhuǎn)變這3個維度,對LLM給我們帶來的影響進(jìn)行了分析,一起來看一下吧。

最近大家都很興奮,ChatGPT的出現(xiàn)帶火了知識博主,增加了變現(xiàn)機(jī)會。很多人都在討論LLM和AI infra,如何寫詩如何畫畫,真正討論應(yīng)用的很少,討論行業(yè)應(yīng)用的就更少了。但是看了YC去年的List后覺得AI-Native應(yīng)用的前景已經(jīng)非常明朗了,AI已經(jīng)深入尋常百姓家。這個普世的轉(zhuǎn)變,對產(chǎn)品經(jīng)理來說更是一個設(shè)計產(chǎn)品范式的根本性轉(zhuǎn)變,而這個轉(zhuǎn)變帶來的軟件設(shè)計模式(Design pattern)都會發(fā)生根本性的變化(后面我們會單獨討論)。

結(jié)論:

經(jīng)過在自己研發(fā)的產(chǎn)品上幾個月的試錯和調(diào)整,我們也形成了行業(yè)軟件/SaaS對LLM能力的應(yīng)用的“Best” practice。我們將從以下幾個角度來探討。

  1. 產(chǎn)品/軟件設(shè)計的轉(zhuǎn)變,在這一部分我們要探討如何利用LLM的特性來改造我們原有的古典軟件行業(yè),我們哪些要LLM化,哪些要堅守古典的結(jié)構(gòu)化思維。
  2. 交互范式的轉(zhuǎn)變,在這個部分我們要一起探討交互和用戶體驗的大幅變化,如何利用LLM來大幅度降低使用成本,并大幅度提高使用體驗,古典和LLM怎樣融合,CUI是最終的交互形態(tài)么?或者說CUI的最終交互形態(tài)是什么?
  3. 產(chǎn)品的PMF范式的轉(zhuǎn)變,這個部分我們會把我們對LLM會從產(chǎn)品落地到用戶需求匹配,門檻降低帶來的競爭格局的變化,以及LLM會促進(jìn)什么樣的PMF,會打破什么樣的PMF。

讓我們首先來看一下LLM的能力和特性。

從 PC 到移動設(shè)備,智能手機(jī)的新特性帶來了重大機(jī)遇,LBS 帶來了美團(tuán)和滴滴,通訊錄帶來了微信,Camera 帶來抖音和快手,語音帶來全民K歌,刷屏動作帶來今日頭條。

與手機(jī)相比,微信的新特性是擴(kuò)大了通訊錄,使通訊錄中的聯(lián)系人數(shù)量增加了百倍,更能夠進(jìn)行面對面的溝通。正是這種能力的增強(qiáng)才使得拼團(tuán)、分銷、砍價成為可能,其中最大的應(yīng)用是拼多多。

那么,現(xiàn)在新一代的AI又帶來了哪些新屬性呢?我想到了一些,也歡迎大家補(bǔ)充。

首先是語言 language,自然語言的交互方式,很底層的人類交互手段。

其次是生成式的交互方式 generative,它能夠以人類易于理解的方式進(jìn)行實時生成。從生成文本和代碼,到圖像、聲音和視頻,甚至未來會生成機(jī)器人的動作。

第三是多模態(tài),輸入input/輸出output 變得極為豐富,但豐富也意味著極為不可控。

從工程角度來看,實際上是對一些專業(yè)概念進(jìn)行了對應(yīng),以便于產(chǎn)品經(jīng)理和研發(fā)人員的理解。

  1. 輸入request,現(xiàn)在系統(tǒng)可以理解直接的對話了,你說什么它都能理解,或者裝作理解。這樣系統(tǒng)的輸入方式和形式以及效率都會得到大幅度的提升。但是系統(tǒng)邏輯不一定是最優(yōu)的,或者效率最高的。
  2. 輸出response,輸出的內(nèi)容產(chǎn)生了極大的不確定性,雖然可能是更好的輸出,但是不可控性增強(qiáng),原來返回的數(shù)據(jù)都是預(yù)設(shè)的,根據(jù)返回值要調(diào)用函數(shù)的,現(xiàn)在要用新的辦法來解決,我預(yù)判未來在這部分會產(chǎn)生很多的中間件產(chǎn)品,可能以開源的為主。
  3. 數(shù)據(jù)格式data format,數(shù)據(jù)格式可以是各種媒體格式,就算是文本也可能是組織好的表格,同樣增加了顯示層的設(shè)計和實現(xiàn)的難度,這塊我就不展開了,但是后續(xù)還會基于這部分內(nèi)容延展出更加有意思的思考和話題。

基于以上內(nèi)容,我來拋個磚,4個月前開始考慮LLM對于我們的影響以及如何擁抱并形成或擴(kuò)大自身產(chǎn)品的差異和壁壘。經(jīng)過這4個多月的時間,很多原來的工作習(xí)慣被迭代,很多原來的認(rèn)知被重置,很多原來的范式被改變。不夸張的說,這可能是,或者至少是科技行業(yè)的“人類的群星閃耀時”,而且后續(xù)也將影響更多行業(yè)和從業(yè)者。下面我們從三個維度來具體分析一下。

一、產(chǎn)品/軟件設(shè)計的范式轉(zhuǎn)變

基于以上的特性,SaaS/軟件行業(yè)對AI的垂直integration,我預(yù)想大概是可以分成三步,每一步都比上一步更深入,對AI模型能力的使用也更充分。

1. 知識類

第一步是知識庫類功能的整合,訓(xùn)練或者fine-tune自己的模型,用一些內(nèi)部或者行業(yè)的knowhow,可以用開源模型,也可以用商業(yè)化模型,這個其實不重要,重要的是內(nèi)部結(jié)構(gòu)化數(shù)據(jù)和行業(yè)knowhow以及best practice的提煉和抽象。

比如Gonex的AI全球HR合規(guī)引擎IRIS,HR可以每天基于對全球HR法律法規(guī)以及全球各行各業(yè)HR最佳實踐進(jìn)行檢索,并對自己的任務(wù)進(jìn)行分解和實現(xiàn)。

就目前而言,AI 更適用于一些需要或者近似于閱讀理解類的預(yù)期結(jié)果,而已經(jīng)被結(jié)構(gòu)化的事實類內(nèi)容在現(xiàn)在已經(jīng)被索引過,使用傳統(tǒng)的方法可以實現(xiàn)高效率,并且對算力的要求也低得多。但并不是所有的任務(wù)都適合使用 AI,因為有些任務(wù)用 AI 完成的效率并不一定高,比如查詢中國的最低年假。在這種情況下,直接從本地數(shù)據(jù)庫檢索可能更加高效,對算力的要求也更低。因此,在選擇使用 AI 還是傳統(tǒng)方法完成任務(wù)時,我們需要具體考慮任務(wù)類型和預(yù)期結(jié)果,避免浪費。

2. 工作/業(yè)務(wù)流

第二步是利用AI的識別和推斷進(jìn)行任務(wù)和功能的調(diào)度。

利用AI都予以理解和上下文能力,實現(xiàn)更流暢的用戶體驗,逐步替換掉傳統(tǒng)的線性多級的工作流,實現(xiàn)一步到位的功能或者任務(wù)的調(diào)度。

比如我要查一下自己的工資,我到登陸系統(tǒng),點開我的(my account), 查看工資單,選擇某一個月或者當(dāng)月,然后顯示自己的工資單,這些步驟是傳統(tǒng)的線性工作流。AI可以替代這些工作流,直接問一下我的工資,返回具體的工資數(shù)據(jù)。如果需要更多交互,可以打開完整功能。

很多流程會從線性的變成星形的。

線行流程配圖

星型流程配圖

大多數(shù)功能都可以用類似的方式完成調(diào)度,只有極少數(shù)需求需要權(quán)限和分組等功能在授權(quán)的時候需要一些傳統(tǒng)的驗證和流程,其他的應(yīng)該都可以滿足需求。這個就需要要對功能做基于語意和上下文分析的mapping,相當(dāng)于做配置文件以及對prompts的管理,需要把語意的分析抽象到具體的功能。而業(yè)務(wù)邏輯依然依靠現(xiàn)有的系統(tǒng)來完成。

個人覺得替代工作流更像一個trade off是兼容之前的古典軟件設(shè)計范式,而不是新的范式,新的范式是下面的第三步,完全的業(yè)務(wù)邏輯AI化。

3. 復(fù)雜業(yè)務(wù)邏輯

第三步是利用AI來整合業(yè)務(wù)邏輯(甚至整個SaaS的業(yè)務(wù)邏輯就是依靠AI,而不需要重新定義和開發(fā)),而不僅是進(jìn)行功能和數(shù)據(jù)的調(diào)度。

LLM會逐步的部分或者全部替代掉SaaS的業(yè)務(wù)邏輯,但是傳統(tǒng)的業(yè)務(wù)邏輯是不是更高效這點需要針對不同的業(yè)務(wù)邏輯單獨的比較和驗證。

而且很多業(yè)務(wù)邏輯用自然語言描述和用數(shù)學(xué)函數(shù)描述效率并不一樣,因為自然語言對復(fù)雜功能的描述其實不如直接抽象出來的邏輯和算法更高效,而且自然語言本身也需要被轉(zhuǎn)換成機(jī)器能理解的邏輯和算法才可以被機(jī)器識別和運行。

不過有一些傳統(tǒng)業(yè)務(wù)功能的局限卻可以用自然語言的形式來實現(xiàn),比如輸入基礎(chǔ)考勤和稅務(wù)信息根據(jù)每個國家工資的算法進(jìn)行月度工資的計算是非常復(fù)雜的邏輯和算法,用自然語言是不容易實現(xiàn)的,但是基于這個算薪結(jié)果進(jìn)行比較又是用傳統(tǒng)的邏輯和算法無法完成的,而一般都需要人為的查詢和比較,并解釋。

例如:請問為什么上個月工資和這個月差這么多?

產(chǎn)品原型圖截圖

這個功能如果用傳統(tǒng)的方式是無法實現(xiàn)的,但是用LLM似乎是可以實現(xiàn)的,但是需要把現(xiàn)有系統(tǒng)的數(shù)據(jù)和算法給到模型并訓(xùn)練才有可能。

基本上做到了第三步才是真正的用AI/LLM來定義和實現(xiàn)完整的軟件功能和邏輯,而不僅是交互方面的調(diào)度,我覺得可能在相當(dāng)長的一段時間內(nèi)都是用第二步和第三步之間的方式來實現(xiàn)軟件/SaaS的AI/LLM化,而不是Native AI/LLM軟件/SaaS。

關(guān)于LLM:

除了大家現(xiàn)在比較關(guān)心的基礎(chǔ)LLM外,未來可能會有很多的LLM:

  • 從業(yè)務(wù)場景的角度會有,比如完成電商業(yè)務(wù)的模型,完成ERP業(yè)務(wù)的模型,完成CRM業(yè)務(wù)的模型等。
  • 從知識的專業(yè)性角度可能會有,比如HR行業(yè)模型,財務(wù)行業(yè)模型,法務(wù)行業(yè)模型等。
  • 從數(shù)據(jù)私有性的角度,可能還有各個公司/組織自己的LLM,當(dāng)然也可以基于開源LLM來搭建。甚至也會由于數(shù)據(jù)合規(guī)性的考慮會出現(xiàn)個人LLM。

每個模型都抽象了很多的業(yè)務(wù)邏輯,而這些業(yè)務(wù)邏輯是依靠LLM來完成功能的實現(xiàn)的,針對這些業(yè)務(wù)邏輯都需要對模型進(jìn)行單獨的訓(xùn)練,而不是簡單的用一個超大泛化模型可以實現(xiàn)的(除非超大模型用各行各業(yè)的數(shù)據(jù)進(jìn)行訓(xùn)練和修改,這樣其實對于基礎(chǔ)模型可能是非常不經(jīng)濟(jì)的,不過也可能跟軟件行業(yè)一樣,很多軟件公司的增長也是通過收購和整合來實現(xiàn)的)。

未來的LLM可能的分層形態(tài):

二、交互范式的轉(zhuǎn)變

交互方式的改變,從抽象流程到自然語言,conversational user interface(CUI)。

實際上人類日常的最自然的交互方式就是肢體語言,表情和對話,而古典軟件都是靠業(yè)務(wù)流程抽象化來完成目標(biāo)任務(wù)的,而LLM的方式可以從更貼近于人類習(xí)慣的方式使用軟件功能,因此極大的降低了學(xué)習(xí)成本,未來的AI Native行業(yè)軟件大概率是類似的這樣的三段式 three stages CUI.

  • 左側(cè)是傳統(tǒng)的抽象流程的快捷方式。
  • 中間是對話功能框,未來很多的工作流都是基于對話和上下文在對話框里直接完成的。
  • 右側(cè)是功能調(diào)用,限制于對話框的大小不容易完成的操作可能還是要有一個地方呼出并實現(xiàn)操作。
  • 左側(cè)和右側(cè)會隨著LLM的進(jìn)化逐步弱化或者消失。
  • 中間的對話框的下一代 conversational user interface會隨著多模態(tài)的發(fā)展,或許更多的輸入格式,比如攝像頭來收集body language,表情等更底層的交流,麥克風(fēng)來收集不僅是對話,還有環(huán)境音。

因此我認(rèn)為未來可能會爆發(fā)的移動設(shè)備并且可以一定程度替代掉手機(jī)的,就是具有邊緣計算能力的LLM,耳機(jī),現(xiàn)在的耳機(jī)已經(jīng)可以透明收聲,如果耳機(jī)具有一定的LLM能力,《Her》的電影場景就可以實現(xiàn)了,基于語音的交互是最自然的對話。關(guān)于耳機(jī)的暢想我們可以后面進(jìn)一步討論。

我們現(xiàn)在用簡單的示例來解釋一下以上ChatGPT在軟件工程以及CUI設(shè)計上的一些基礎(chǔ)邏輯:

首先為什么是three stages,三段式設(shè)計,不光是PC,其實在移動設(shè)備上也是一樣,因為如果只不過根據(jù)屏幕大小很多內(nèi)容是折疊起來的,但是大概率都要有這三段:

  1. 快捷方式,用古典的方式可以找到古典的邏輯,主要為了幫助用戶適配古典邏輯,但是古典邏輯會存在多久,這個不好說,也可能要很久。畢竟也有很多時候自然語言不一定是效率最高的方式。
  2. 中間是CUI,主要的交互和任務(wù)都在這里完成。
  3. 右側(cè)的部分是一些無法在對話框里完成的任務(wù)或者目標(biāo),比如顯示的不全,比如需要單獨的視圖等。

比如在GONEX-IRIS這個工資查詢的場景下,用戶需要調(diào)用一些本地數(shù)據(jù),而對話框只能顯示一部分,如果回答太長,用戶容易miss掉上下文,因此需要有個地方單獨呼出,右側(cè)就是一個比較理想的方式。當(dāng)然也不一定是左右的形態(tài),也可以是下上,或者上下的形態(tài)。

中間的對話框不止是一個傳統(tǒng)軟件的rich text area,這里包含的很多的元素,類似微信對話框里不同的format,比如一個網(wǎng)頁、一個文件、一個小程序,其實企業(yè)微信和叮叮也都有類似的設(shè)計,只不過通訊/協(xié)同軟件更多的還是人和人對話。

而現(xiàn)在的對話框不再是或者不僅限于人和人了,更多的是人和LLM,對話框里要可以顯示和處理更多的格式,比如微信不支持markdown(因為正常人不會用這種格式跟別人交互),現(xiàn)在需要支持更多的文本格式,因為用戶不僅是要在對話框里完成對話,更重要的是要在對話框里完成任務(wù),完成指令,而不只是把對話框當(dāng)作信息的傳遞,具體的任務(wù)要跳出對話。

比如,我要查steve的工資,LLM會返回給我工資的具體內(nèi)容,比如我問LLM有什么的需要審批的工作,LLM直接給我返回5個審批列表,我可以直接在對話框里審批。比如我要LLM幫我請假,但是一些具體請假原因和流程都要在對話框里完成。

對于CUI,我認(rèn)為未來的交互可能不僅僅是typing,還有聲音,圖像/視頻等輸入形式。人類科技最大目標(biāo)就是模仿人類自己,機(jī)器總要加個“人”在后面,是為機(jī)器人。而AI的目標(biāo)是最大限度的讓用戶感覺坐在對面跟你對話的是人,而不是機(jī)器。因此我們應(yīng)該不僅限于打字,因為打字本身是有PC了以后才有的形式,幾千年的人類溝通方式是語音。

因此我自己做的是行業(yè)軟件,但我依然認(rèn)為未來最大機(jī)會是更自然的溝通方式是voice,因此在UI和工程領(lǐng)域如何更快的把rich text area這個component變成 rich voice area component是更底層的更有意思的機(jī)會,甚至可以支持手勢,表情等,更多的輸入形式從而變成rich communication area component,這也是我思考了很久的領(lǐng)域,現(xiàn)在已經(jīng)有了結(jié)論,不過我們就不在這里展開了。

這里我依然要老生常談的一個點是,古典軟件工程更重要的是基于任務(wù)和流程的抽象,而LLM的產(chǎn)品要基于對話,對話不僅是文字也可以是很多其他的模態(tài)或者格式。因此這個是產(chǎn)品設(shè)計范式的轉(zhuǎn)變。iPhone的早期,很多人吐槽當(dāng)點iPhone上的app都很PC,直到有的app用手勢gesture來做交互才逐漸有了現(xiàn)在的樣子。AI-Native的軟件也是一樣,都要有這個過程,這個過程不會很久,正在發(fā)生。

三、PMF范式的轉(zhuǎn)變

從蒸汽機(jī)開始替代一些體力勞動者開始,社會的演進(jìn)就變成了人要操作機(jī)器,因此人要受教育,學(xué)更多的知識,然后用這些知識去操作效率更高的機(jī)器。機(jī)器取代了一些初級的勞動者,而大家踴躍通過教育變成高級的勞動者去操作和管理機(jī)器,這樣就形成了一個正向的循環(huán)。

突然之間,ChatGPT的出現(xiàn),讓大家對這個社會秩序迭代的公式產(chǎn)生了動搖。但是如果大家看過那段資本主義萌芽的歷史就知道,當(dāng)時的人們其實也找不到這個現(xiàn)在大家公認(rèn)的路徑,大量的工人失業(yè),社會甚至還造成了某種程度的動蕩。但是后續(xù)的故事我們都已經(jīng)知道。所以大家一定要動態(tài)的看問題,焦慮往往是人類對未知的恐懼形成的潛意識,靜態(tài)的思維方式和常規(guī)的套用往往會加速這種潛意識的形成。

因此用所謂動態(tài)的站在歷史的角度出發(fā)的思考,AGI確實會取代一些初級的腦力勞動(機(jī)械的腦力勞動,甚至知識/事實的學(xué)習(xí)),但是用新的教育方式來產(chǎn)生創(chuàng)造性的思維,就可以指揮或者操作AI來提升效率,我們的教育體系也會從知識灌輸變成思考方式和創(chuàng)造潛力的涌現(xiàn),教育出來的這些四有新人再去創(chuàng)造更高維的AGI。

就好像沒有蒸汽機(jī)就沒有機(jī)械工,沒有電腦就沒有程序員,那么出現(xiàn)了AGI會不會就出現(xiàn)了新的職業(yè)呢?(也許就是prompt engineer,誰知道呢)

討論完以上的論述,再看看那些特性適合你現(xiàn)有的用戶場景。

如前所述,操作系統(tǒng)的機(jī)會只有少數(shù)人,但是應(yīng)用的機(jī)會是給大多數(shù)人的,而對于LLM而言,上層的應(yīng)用形態(tài)是多樣的,但是不是所有形態(tài)都是適合應(yīng)用層的。

現(xiàn)在看來,不論2B和2C:

  1. 只要你的數(shù)據(jù)是公開的,泛行業(yè)的,你的替代性就越高。
  2. 只要你的value只是線上薄薄的一層,哪怕再高的知識密度,你的可替代性也不會很低。

這里說的可替代性就是被LLM的進(jìn)化替代。當(dāng)然LLM自身的競爭不在考慮范圍內(nèi)。

因此2C/2B級別的應(yīng)用,如果你的交付是純信息的形式,開放形式的,范知識類的,那么長期看大概率都是有風(fēng)險的。如果你的交付不是純信息類的,是封閉的,是專有知識類的,那么長期看是非常有價值的,不僅沒有風(fēng)險,而且LLM會大幅度的提高你的生產(chǎn)效率。

基于以上的場景和分析。

1. 從模型的角度

除了大家現(xiàn)在比較關(guān)心的基礎(chǔ)通用型LLM外,未來可能會有很多的行業(yè)/場景型LLM。

從業(yè)務(wù)場景的角度會有,比如完成電商業(yè)務(wù)的模型,完成ERP業(yè)務(wù)的模型,完成CRM業(yè)務(wù)的模型等。

從知識的專業(yè)性角度可能會有,比如HR行業(yè)模型,財務(wù)行業(yè)模型,法務(wù)行業(yè)模型等。

從數(shù)據(jù)私有性的角度,可能還有各個公司/組織自己的LLM,當(dāng)然也可以基于開源LLM來搭建。甚至也會由于數(shù)據(jù)合規(guī)性的考慮會出現(xiàn)個人LLM和邊緣LLM。

每個模型都抽象了很多的業(yè)務(wù)邏輯,而這些業(yè)務(wù)邏輯是依靠LLM來完成功能的實現(xiàn)的,針對這些業(yè)務(wù)邏輯都需要對模型進(jìn)行單獨的訓(xùn)練,而不是簡單的用一個超大泛化模型可以實現(xiàn)的(除非超大模型用各行各業(yè)的數(shù)據(jù)進(jìn)行訓(xùn)練和修改,這樣其實對于基礎(chǔ)模型可能是非常不經(jīng)濟(jì)的,不過也可能跟軟件行業(yè)一樣,很多軟件公司的增長也是通過收購和整合來實現(xiàn)的)。

跟AI 1.0的狀態(tài)差不多,可能有很多垂類模型,也有很多行業(yè)模型,當(dāng)然也有可能出現(xiàn)AI四小龍或者N小龍的情況,因為很多數(shù)據(jù),比如比銀行數(shù)據(jù),火車數(shù)據(jù),民航數(shù)據(jù),都不可能被放到公有LLM上,還是要在自己的私有LLM才可行。

2. 從平臺的角度

LLM還解決不了線下交付的問題,理論上只要不是專有數(shù)據(jù),LLM的用戶體驗可能會產(chǎn)生一些虹吸效應(yīng),讓用戶更多的訪問LLM而不是傳統(tǒng)的平臺,平臺當(dāng)然可以自己做LLM,但是投入和效果上不一定比類似的百度的或者泛化LLM更有優(yōu)勢。

個人感覺如果百度未來的搜索結(jié)果可以放更多的軟廣,在上下文中,讓用戶更加接受,而不是現(xiàn)在的搜索廣告形式。但是傳統(tǒng)的對話方式的微信可能可以更軟,畢竟它可以直接做個人助理,助理就是個人的推薦引擎。

當(dāng)然比如對于專業(yè)的訂票,旅游,吃飯類的平臺可能就是比較負(fù)面的例子了,因為平臺只需要或者只能做交付,平臺的議價空間就更少了,但是不擁抱共有LLM也不行?,F(xiàn)在在百度上只是做廣告買流量,后面百度通過文心一言的小程序或者Plugin直接就把前置的所有事情都干了,只需要下單API。不過這個完全是個人腦爆,畢竟旅游行業(yè)的供應(yīng)鏈管理是相當(dāng)復(fù)雜和高壁壘的,我們有相當(dāng)長的時間可以觀察,思考和應(yīng)對。

總體上講,LLM對未來的或現(xiàn)存的平臺類應(yīng)用是比較負(fù)面的。原因是如果出現(xiàn)超級LLM,那LLM本身就有是平臺,對現(xiàn)有平臺產(chǎn)品來說可能會損失品牌,躲到LLM后面,淪為工具,但不管怎么樣,平臺還是應(yīng)該擁抱LLM,利用好LLM的能力,也可能走出一條不一樣的路。

對初創(chuàng)公司反而是有利的,降低的競爭的門檻,增加了市場的活力,流量的獲取更加的容易,而初創(chuàng)公司可以專注在專業(yè)范疇內(nèi)。

所以符合私有數(shù)據(jù)和線下交付中的一項的LLM應(yīng)用已經(jīng)很有生命力了,符合兩項的又有專有數(shù)據(jù)又有線下交付的應(yīng)用肯定是極大的利好,線下交付的能力不是短時間可以培養(yǎng)出來的。其實很多應(yīng)用會產(chǎn)生大量的專有數(shù)據(jù),比如購物網(wǎng)站產(chǎn)生的用戶購買行為和偏好,比如社交應(yīng)用產(chǎn)生的用戶行為和交互的偏好,這些其實都有很大的價值,LLM其實是反向逼迫大家來審視自己的數(shù)據(jù)資產(chǎn),以及如何更好的利用它。

3. 從交互的角度

盡管我之前提到了交互式用戶界面(Conversational UI),這種界面最自然的表現(xiàn)形式仍然是對話(conversation)。如果這樣想的話,微信可能會成為下一個時代的王者,甚至可以取代百度,因為人們可以在微信上解決所有問題,包括像對話一樣自然的搜索,而不需要切換功能和場景。

然而,如果只考慮到這一點,那么你對于使用場景的了解可能還不夠深入。因為最大的差異是,微信是與人進(jìn)行交流,而新的交互方式是與語言模型進(jìn)行對話。在這種對話場景中,聊天和表達(dá)情感只是場景的一部分,更多的場景涉及任務(wù)下達(dá)、目標(biāo)達(dá)成、情況分析和模式識別等工作,這些任務(wù)的業(yè)務(wù)邏輯比傳統(tǒng)的聊天要復(fù)雜和抽象得多。因此,解決這些問題需要依靠對話式用戶界面(CUI)的發(fā)展,我相信很快就會出現(xiàn)AI的類似于iPhone誕生后的Gesture時刻。

從個人的角度,我覺得CUI的可見模式還是會長期存在的,畢竟很多的場景都是需要操作的,但是我更進(jìn)一步的認(rèn)為LLM的Gesture時刻可能不是在可見的部分,而是源于人類更底層更自然的溝通方式,conversation最初的方式并不是typing,而是聲音,用嘴發(fā)聲,用耳朵收聲。我覺得未來的會有一波重大的突破在耳機(jī)上,耳機(jī)可能會取代或者部分替代現(xiàn)有的手機(jī),而且手機(jī)也是可移動的設(shè)備,比手機(jī)還自然的攜帶體驗,具備各種傳感器的能力,手機(jī)能有的傳感器,耳機(jī)都可以有。耳機(jī)不再只有降噪這個賣點,而是交互的終端,是conversation的承載,是任務(wù)指令的下達(dá)?,F(xiàn)在的耳機(jī)已經(jīng)可以透明收聲,如果耳機(jī)具有一定的邊緣LLM能力,《Her》的電影場景就可以實現(xiàn)了,基于語音的交互是最自然的對話。

4. 主動與被動

其實大家日常使用的AGI應(yīng)用無論2B還是2C,幾乎所有的場景下的應(yīng)用都是被動呼出的,也就是說都用戶提出問題,LLM被動回答。用戶是initiator,這就造成了使用場景相對單一。但是反過來想一下日常的對話都是自己發(fā)起的么?顯然不是,實際生活中不同的場景,很多都是用戶是被動應(yīng)答的。微信之所以使用時間長,并不是因為比抖音有更牛的沉浸式推薦算法,而是因為你的主動是對方的被動,對方的主動是你的被動,通訊錄聯(lián)系人互相成為對方的initiator。

因此AGI的出現(xiàn),就可以根據(jù)設(shè)備的感知能力主動發(fā)起對話,比如中午,可以問用戶吃了么,沒吃趕緊吃,想吃啥附近直接找到,并導(dǎo)航到餐館。主動發(fā)起對用戶體驗來說是一個很大的飛躍,(這里主動發(fā)起不是類似手機(jī)的push msg)尤其是情感領(lǐng)域,被動和主動區(qū)別很大,大多數(shù)國人在現(xiàn)代社會中都是社交被動型的,社牛太少了。很多傳統(tǒng)的社交軟件也都在利用數(shù)據(jù)來降低社交成本,比如點個贊,比如用手滑照片。如果能通過耳機(jī)+各種sensors,還有環(huán)境音的透明收聲,則可以有更多的應(yīng)用場景被挖掘出來。而不僅是任務(wù)型或者事務(wù)性的應(yīng)用場景。

寫在最后

以上都是我?guī)讉€月以來的思考在當(dāng)下這個時間點的總結(jié),未來會發(fā)生什么,也很可能會推翻現(xiàn)有的結(jié)論甚至思考框架,未來一定是薛定諤的貓,LLM這個變量將讓很多人的思考框架發(fā)生了巨大的變化。在這個Sternstunden der Menschheit,我們可能有的只是時間。

浪潮中,有些人追求宏大的敘事,有些人忙于性感的故事,有些人揮起鋒利的鐮刀。面對誘惑大多數(shù)人都會放棄堅守,但我還是希望大家在設(shè)計產(chǎn)品時問自己一個問題,我的產(chǎn)品能不能帶來10倍體驗提升,能不能帶來10倍成本的降低,普通人只能點滴的改變。Make a better life for all people and their families.

關(guān)于GONEX- IRIS:

GONEX-IRIS是全球首創(chuàng)的AI Native的人工智能HR合規(guī)服務(wù)引擎,可以幫助HR團(tuán)隊輕松應(yīng)對日益增長的挑戰(zhàn),提高工作效率和便利性。我們的LLM大模型可以利用自然語言處理技術(shù)快速處理各種HR數(shù)據(jù),并自動化處理各種復(fù)雜的海外HR流程,如入職、離職,算薪,發(fā)薪,社保繳納等。同時,我們還可以利用機(jī)器學(xué)習(xí)進(jìn)行員工滿意度和工作績效分析,提供數(shù)據(jù)驅(qū)動的洞察和建議。

使用GONEX-IRIS,您可以在幾秒鐘內(nèi)獲得關(guān)于海外員工雇傭、福利等方面的專業(yè)建議,而無需倒時差或花費大量資金雇傭當(dāng)?shù)貙<?咨詢公司。我們的服務(wù)涵蓋從高端咨詢到日常服務(wù),幫助您快速解決業(yè)務(wù)問題,從而實現(xiàn)更高的工作效率和便利性。GONEX-IRIS還可以讓您成為一個全球HR問題專家,幫助您從事事求人的HR文盲秒變專業(yè)的HR領(lǐng)域?qū)<摇?/p>

作者:溫夢飛,郵箱:mengfei@letsgonex.com

本文由 @溫夢飛 投稿發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 很牛,讀完收獲很多

    來自四川 回復(fù)
  2. 你的這篇文章寫的挺好,就是中英夾雜有翻譯成本,閱讀體驗有點差

    來自廣東 回復(fù)
  3. 寫的很專業(yè)的

    來自上海 回復(fù)