LLM-Native產品的變與不變(下)

1 評論 1384 瀏覽 7 收藏 27 分鐘

LLM-Native產品的變與不變是一個持續的過程,始終以用戶需求和品質要求為出發點,根據技術的發展進行相應的更新和適配。本文講述相關內容,希望對你有幫助。

一、創建LLM-Native產品的幾個原則

以下是一些進行LLM-Native產品設計時可能有用的建議:

1. LLM-Native與模型自由

《Does One Large Model Rule Them All? Predictions on the Future AI Ecosystem》(作者:谷歌前CEO Eric Schmidt、Databricks首席科學家、斯坦福教授Matei Zaharia和Samaya AI創始人Maithra Raghu)這篇文章寫于今年4月初,在當時GPT-4封神、GPT-5呼之欲出的輿論環境下,幾位大佬提出了一個非常不合時宜的行業非共識:未來的AI生態中,通用大模型負責解決長尾問題,高價值的業務場景將由專業AI系統來解決,具體表示為下圖:

模型類型-問題價值曲線以這篇文章的內容為出發點,我們認為:從產品工作的視角來看,LLM-Native產品必須擁有自己的模型。而這并不意味著通用模型和垂直模型是非此即彼的競爭關系,事實上我們相信在較長的一段時間內,我們都會看到智慧程度更高的通用底層模型與業務能力更強的垂直模型展現出某種合作關系,具體來說:

  • 垂直模型面向應用,用更低的成本以及更好的業務效果為特定場景服務。
  • 通用模型面向模型生產,用更強的智慧水平提高垂直模型生產的效率。

所以對于LLM-Native產品的工作來說,首先應該將專業模型加入工作計劃表,其次要善于借助通用模型,最后要記住不要過分依賴通用模型。

2. 找到自己的LLMs的能力光譜

我們在前文提到過“需求即能力”這一LLMs技術的特點,這個特點決定了不同的LLM-Native產品因其面向場景、解決的問題、面向的用戶群體不同,而對模型能力的要求有所差異。一個形象的比喻是:原子的特征光譜。即當我們將某種LLM-Native的產品對應到LLMs時,就像不同原子會顯示出不同的特征光譜一樣,此時應該能夠列出一個明確的模型能力規格說明書,通過這份說明我們可以:

  • 知道自己需要什么樣的模型。
  • 能夠評價不同模型對業務的價值。
  • 可以指導模型效果的優化方向。

不同的場景對模型的能力要求會有很大的差別所以,未來LLM-Native產品經理可能會有一項工作就是定義出自己場景的模型能力光譜,而這將是整個產品設計工作的起點。

3. 利用LLMs的優勢而非劣勢

任何一項技術都有其技術優劣勢,所以產品設計者一定要懂得揚長避短、順勢而為。比如相對于PC互聯網,移動互聯網有隨時可使用、位置信息、設備綁定、相機陀螺儀等硬件優勢,同樣也有展示空間有限、文字輸入不便等弱點,所以在揚長避短的原則下,出現了面向碎片化時間的產品(feed流類產品)、出現了基于位置信息的產品(打車)等,在設計上也會用更輕的交互來避免文字輸入。對于LLM-Native產品也是一樣,我們需要找到LLMs的優點,基于這些優點來設計,并同時識別出技術的弱項,從而在產品設計時盡量規避,比如我們很容易可以整理出一些可以供參考的優劣勢:

優勢:

  • 能力是一個開放域
  • 通過自然語言完成交互
  • 內容是動態可操作的
  • ……

劣勢:

  • 內容不可控
  • 實時生成速度慢
  • 模型更新、使用成本高
  • ……

比如A16Z最近提出的AIGC應該面向概率型產品(probabilistic products)進行設計的觀點,就是試圖利用模型優勢進行設計的一種嘗試。

如何利用模型的概率性進行產品設計也許,未來每個LLM-Native的產品經理都應維護一份LLMs的優劣勢清單,在確定產品的功能設計后,都應該從LLMs技術的優劣勢進行一次審核,看看是否做到了“趨利避害”。

4. 生成器和系統2

使用LLMs進行生成是以指令為起點的,即:指令->LLMs->內容&行動最直觀的指令是用戶的prompt,也就是使用自然語言將需求表述出來,此時,需求=指令,但隨著LLMs技術的發展,我們會發現:

  • 由于模型能力的開放性,相同需求的不同指令差距會很大。
  • 除了prompt外的其他要素也會加入指令被輸入模型,比如外部知識庫、工具接口等。
  • 模型能力越來越強,對應的指令也會越來越復雜,這也是上文提到的“語言即代碼”特性的必然結果。

一個愈發明顯的趨勢是用戶需求和指令的分離,即會有一個專門的指令生成環節來連接用戶需求和LLMs(Agent便是這種趨勢下的必然產物)。

這里我們將接收用戶需求并翻譯為大模型指令的工作環節稱為生成器:一個面向特定任務設計的,能夠將用戶的需求最大限度轉化為模型生成時應當執行的行動集合的指令的工作模塊。

生成器將用戶的需求經過處理變成大模型的可執行的生成指令,生成器可以很簡單,比如一個prompt模板,也可以很復雜,比如一個Agent再加上數據庫,甚至也可以是一個模型,比如生成prompt。

「生成器與底層模型共同完成生成過程」這一范式具有更深的底層邏輯,即《思考,快與慢》一書中提出的系統1和系統2,底層模型將作為系統1,而生成器將作為系統2,二者形成一個整體系統,并分別適合用來解決不同類型的問題,系統1和系統2的概念也被OpenAI聯合創始人Andrej Karpthy用來解釋GPT的原理,與人類的系統1與系統2更加獨立的關系不同,LLMs的兩個系統存在顯著的轉化關系:系統2的能力會不斷被系統1內化,所以系統2需要不斷被設計,而系統1則會不斷增強。作為用戶需求的翻譯者,生成器將會在很長一段時間內成為LLM-Native產品的關鍵設計環節,結合上文的信息,產品設計工作將從功能性設計轉向模型能力+生成器的建設:

  • 設計產品就是設計模型
  • 設計產品就是設計生成器

二、LLM-Native產品的特點

下面我們將試圖抽象出LLM-Native產品可能具有的特點,理解這些特點可以讓產品方向的選擇以及設計工作更容易和科學。

1. 新問題

首先是新問題,LLM-Native產品需要面向新問題所對應的需求進行設計。什么是新問題呢?我們知道所有產品的價值基礎都來自于對某種用戶問題的解決,而新的技術范式通常會帶來兩類問題,即:

  • 什么會更好:如何通過新技術更好的解決已有問題。
  • 什么會出現:擁有新技術后有哪些之前無法解決的問題變得可解了。

結合在前文市場熵的部分我們已經做過的說明,我們可以分析出這兩類問題有如下特點:

  1. 第一類問題:需求容易被發現,很快就能有收益,但解決的是存量需求,通常會表現為某種形式的降本,需求的價值上限低。
  2. 第二類問題:需求通常是被隱藏或者壓抑的,需要被挖掘,通常需要更長的產品周期才能兌現收益,解決的是增量需求,帶來的也是社會整體價值的增加,比如創造新職業,甚至新行業,需求的價值上限更高。

很明顯,第二類問題才是LLM-Native產品要面向的新問題。那么如何找到這類新問題?這里提供一些可供參考的定位方法:

  • 擁有新技術才能解決,比如短視頻產品需要同時具備智能手機+4G網絡才會出現。
  • 將已有產品的底層需求代入新技術,比如個人知識庫在表面解決的是信息存儲和處理的問題,而其底層則包含著如何有效的使用這些信息的需求,從這個底層需求出發,就能發現LLMs的生成能力與這個需求天然契合。
  • 從新技術的特點出發,我們上文提到了一些LLMs技術的特點,那么用這些特點來對應用戶問題也是一個可行的思路,比如LLMs可以生成如何行動的信息,那么對應的問題便是計劃類、行動類問題,相比上一代AI解決感知型、決策型問題而言,就是新問題。

通過技術、底層需求兩個思考維度,我們還可以發現更多定義新問題的方法,這里由于篇幅原因不做贅述。

2. 新形態

如同PC時代的網站、移動時代的APP一樣,我們相信LLM-Native產品也會誕生自己的產品形態,雖然現在無法判斷這個形態到底會是什么,但是已經有一些正在形成的演變趨勢。

極簡設計這里的極簡指的是產品表現層體現出的極簡,更準確的描述應該是:極簡設計+豐富能力用看似簡單的產品形態來實現復雜多樣的功能,這已經成為以LLMs為核心產品的特點,如果對這類產品進行功能清單梳理,大家會發現其核心使用流程所對應的功能都非常簡潔,而其能夠完成的任務或者具有的能力又極其豐富

這種趨勢是由前文提到的「需求即功能」特性決定的,由于LLMs理論上可以將任何信息通過壓縮+預測next token的范式進行生成,所以大量的產品功能無需暴露給用戶。但是值得注意的是,極簡設計并不意味著能夠幫助用戶更快完成需求傳遞的功能和產品界面不再被需要,他們會以另一種形態存在于LLM-Native產品中。

動態功能動態功能是指LLMs產品在使用時,其展現給用戶的功能、界面并非是提前設計的,而是可以根據用戶當時的需求進行動態生成,這個特點同樣具有必然性:

  • LLMs的開放域使用方式,要求其必須擁有無限的功能與界面,而這些功能與界面顯然是無法通過人工設計來滿足的,所以從技術的特性上其具有必然性。
  • LLMs的「語言即代碼」特性則提供了動態功能的可行性,在這個特性下,用戶的需求以自然語言的形式進行轉化和加工后,可以直接生成對應的功能或者界面。動態功能和界面將是LLMs相關產品的重要發展方向,也許未來我們可以用動態功能在產品中的占比來衡量

一個產品的LLM-Native程度,推薦系統作為對檢索系統的個性化,在移動互聯網開創了一個全新的產品時代,我們有理由相信LLMs的動態功能特性也將開啟一個新的產品時代——個人定制化產品時代。

Perplexity的Copilot功能:根據用戶輸入生成動態表單來明確需求定制化產品如同推薦帶來了信息內容的個性化,我們相信LLMs技術將帶來產品的個性化。

產品的標準化和需求的個性化是一組產品設計中的基本矛盾,用戶天然希望產品為自己量身定做,而產品提供者則需要通過標準化來確保產品的生產和運營成本,我們在前文「用戶需求的無損傳遞」中已經涉及到這個問題的討論。

相比于軟件范式下產品必須標準化不同,LLMs帶來了「產品說不定也可以個性化」的全新機會,那么這將帶來內容個性化后的新一輪產品革命,圍繞「個人定制化產品」的理念,所有的已知產品都存在升級迭代的可能。

3. 新交互

關于LLM-Native產品的交互工作變化是近期被討論比較多的一個話題,有不少文章進行進行了很好的說明,在此我們提供幾個交互設計工作中原則性的特點:從告訴機器怎么做到告訴機器要什么全球頂級的用戶體驗研究機構Nielsen Norman Group在6月的一篇文章中提出,LLMs為核心的AI技術將帶來計算機出現后的新一次交互范式革命,之所以稱之為革命的關鍵原因在于交互設計工作的目標發生了變化:上一個交互范式的工作目標為「如何更好的告訴機器該如何遵循用戶指令」(Command-Based Interaction Design),而新的AI交互范式下,工作目標將更新為「如何更好讓機器知道用戶想要什么」(Intent-Based Outcome Specification)。

人機交互的三種范式自然語言成為一個新的交互維度,但不是交互本身我們上文提到過LLMs具有通過自然語言來驅動產品使用流程的特點,這意味著自然語言從交互的內容成為了一種交互設計的維度。而隨著ChatGPT的出現,產品的設計出現了一種“萬物皆為Chatbot”的設計趨勢,但是實際上Chatbot只是LLMs在交互中的一種展現形式,更為本質的問題在于自然語言從交互的內容變成了交互的方式。對此問題,Notion的UX研究員Linus Lee在其《Generative Interfaces Beyond Chat》的talk中有過論述,其核心觀點為:

  • 自然語言作為交互方式有優點(更高的靈活性)也有弱點(可理解性)。
  • LLMs對交互設計來說,其價值在于增加了一種新的維度,應當與其他的交互維度(如GUI)配合使用。

自然語言交互提供了更好的靈活性,但也損失了產品的可理解性

所以對于LLM-Native產品來說,一方面我們將顯著的觀察到,自然語言將在交互中出現并承擔重要的角色,但同時我們也應盡量避免陷入「LLM-Native=Chatbot」的設計誤區。面向不確定性進行設計在前文中,我們提到過LLMs具有能力黑盒和生成內容不可控等特點,這些特點將帶來產品使用過程中的巨大不確定性。對于傳統的軟件產品思路,交互一定要是清晰、準確、具體的,而這與LLMs的生成技術顯然存在沖突,所以LLM-Native產品勢必會展現出一種新的交互思想,即:面向不確定性設計,這將展現出的工作特點為:

  • 盡可能減少對用戶行為的約束。
  • 會有更多設計被用于幫助和引導用戶理解和調起模型能力。
  • 對模型輸出會有更多的引導和約束從而確保結果的可控。

三 、早期LLM-Native產品的觀察

已經有越來越多令人興奮的的新產品開始出現,下面將從一些可觀察的市場信息中嘗試抽象出某些共性和趨勢,以期為正在面向LLM-Native理念進行設計的產品工作提供一些有價值參考。

1. 社交

馬克思曾說「人的本質是一切社會關系的總和」,從這個角度而言,LLMs的出現對社交產生的一個重大影響在于:在社會關系中,增加了AI這一全新的社交維度。這使得社交產品有了全新的想象空間,具體表現為除了人-人社交的角度外,我們還可以從如下角度進行設計:

  • 人-機社交:人類與AI進行社交,比如Character.ai,Replika。
  • 機-機社交:AI與AI進行社交,人類進行觀察或者參與,比如chirper。

注:機-機社交是一個尚未得到足夠重視的方向,該方向下人類可以為AI智能體們設計各種活動和任務,并以上帝視角進行觀察和干預實驗,比如用LLMs模擬人類成長過程中不同類型事件對其后續行為可能產生的影響。

Inworld:提供游戲中的智能NPC服務,已經具備了機-機交互的觀測價值從產品價值維度來看,目前的社交服務主要提供兩種價值:

  • 交換信息:即提供效率價值
  • 找到同類(from 張小龍):即提供情緒價值

那么AI維度的加入后,我們可以得到這樣一張有趣的產品定位表,并能夠對已有的產品進行定位:

社交產品設計的維度變得更加豐富所以對于LLM-Native的社交產品來說,我們顯然將面向一個更加廣闊的設計空間,比如設計一個能在圖中覆蓋多個社交維度以及價值維度的新型產品。

2. 內容

前文中已經提到過,LLMs技術將為信息內容產品在生產端、消費端帶來一系列變化。目前我們已經能夠看到基于這些變化進行的早期嘗試,比如一些Demo中,KOL將自己的文章、對話、資料等數據作為知識庫并連接ChatGPT接口,從而讓讀者能夠實時、無限制地獲取帶有自己知識和語言風格的新內容。這當然只是一個很初級的產品化嘗試,LLM-Native的內容產品更大的想象力在于,當更多垂直的LLMs在各自領域開始落地、不同模態的生成能力正在產品端進行融合、LLMs的生產和推理成本大幅降低時,我們應當能夠看到與現在完全不同的內容產品形態,也許是:

  • 可以自定義劇情的多模態內容”小說“。
  • 可以按需生產的新型”短視頻“內容。
  • 可以結合用戶畫像以及其需求描述的實時生成的資訊內容。

Talkie:提供了一種基于角色扮演的多模態游戲化內容形式

3. 工具

對于效率工具來說,一個顯著的產品趨勢是:以Copilot產品形態為過渡,實現AI-worker。這里的底層邏輯在于上文中提到的一個概念:模型需要對某種程度的人類智慧數據進行壓縮,才有可能涌現出同水平或者更高水平的智能。顯然對于效率工具類產品來說,如何對AI生成的內容進行處理、優化從而成為人類標準可用的工作成果,就是一種智慧程度更高,并且尚未被信息化的數據。所以Copilot產品形態將會以已有的LLMs模型能力為基礎,通過人機協作工作方式提升效率的同時,搜集更高智慧程度數據搜集的產品,而這也將成為「從LLM-Native走向AGI」的必由之路。Copilot產品形態的要點在于:

  • 確實能夠在LLMs的能力下提供更高的工作效率。
  • 被集成在現有的工作流中并能夠獲取工作流中的用戶操作信息。
  • 用戶操作信息是已有LLMs能力的衍生。

對于LLM-Native的效率工具產品來說,可能的產品設計思路會分為三個模塊:

  • 對某個場景有效的LLMs能力建設。
  • 以盡可能高效獲取工作流中的更高智慧信息為目標進行Copilot產品形態設計。
  • 優化LLMs能力直至成為AI-worker。

相信一段較長的時間內,我們應該會看到效率工具中Copilot形態的大爆發,實際上目前各類工具中集成Chatbot只是這個趨勢的開始,因為chat的交互方式并不本質,Copilot形態的本質應當是如何獲取工作流中對LLMs內容的處理和優化數據。

Github Copilot:最早也是最為典型的Copilot產品

總結

本文嘗試對基于LLMs技術的LLM-Native產品進行分析,試圖探討如下幾個問題:

  • LLM-Native產品有何不同
  • LLM-Native產品的獨特性從何而來
  • 在進行LLM-Native產品時應當注意哪些問題

具體而言:我們從使用產品視角出發,嘗試對LLMs技術在產品維度的特點進行抽象,并基于這些特點對LLMs技術對產品工作可能帶來的變化進行了推演,結合在新技術沖擊下依然有效的產品邏輯,我們給出了一些創建LLM-Native應用的可能原則以及目前可見的LLM-Native產品特點,最終通過對幾個經典產品方向上LLM-Native產品的觀察嘗試給出未來的產品工作建議。

需要強調的是,LLM-Native產品將是一個至少與互聯網產品、移動互聯網產品同等級別的宏大主題并正處于高速發展中,我們既難以觀察其全貌,也無法對其發展進行有效判斷,所以本文的目標是提供一些對LLM-Native產品工作有價值的問題并提供對這些問題可能有幫助的觀察和思考,而非輸出觀點和提供預測。

希望以此文為基礎,能夠與更多關注、從事LLM-Native產品工作的朋友們進行交流探討。感謝Kiwi參與創作,文中的很多觀點來自與行業內投資人、產品經理以及算法工程師朋友們的討論,在此不再一一致謝。

作者:冠叔;公眾號:OneMoreAI(ID:OneMoreAI1956),硅基生命觀察團,發現、探索、分享AI的one more thing。

本文由 @OneMoreAI 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. q
    w

    來自北京 回復