大語言模型下的趨勢預測:大模型的形態預測、交互變化、應用趨勢

Bay
0 評論 6660 瀏覽 23 收藏 16 分鐘

自從ChatGPT發布之后,大語言模型一時成為新的風口,不論國內國外,大家都在部署自己的LLM模型。本質上LLM是一個可以在眾多領域使用的模型,但大家都這么玩,容易成為垂直領域的產品。還是說有更好的發展方向呢?這篇文章,作者為我們解讀,希望對你有所幫助。

本篇圍繞大模型在生態中的形態預測、大模型帶來的交互變化、應用層產品可能性、投身 AI 產品的建議聊了聊~歡迎閱讀交流~

一、大模型未來會成為?

關于 LLM 的猜想眾多,有說大模型可能成為下一代操作系統的,有說可以成為新一代底層技術設施、有說可以成為萬物終端的。這里的出發點主要在于對大模型未來形態的思考。

我的判斷是首先 LLM 帶來的能力會作為底層通用技術對上層軟硬件產生影響,同時會出現一群圍繞大模型基礎能力構建的生態,也就是很多文章中說的「中間件」和「Apps」。

這里順帶解釋下很多文章中出現的「中間件」和「AI Infra」的含義。

AI中間件,是指在AI應用程序和底層基礎設施之間提供中介服務的軟件,包括模型訓練框架、推理引擎、數據處理工具等,它們可以提供人工智能應用程序所需的功能和服務,同時簡化了開發和部署過程。

Infra(Infrastructure),是指基礎設施或基礎架構,在大模型的生態系統中,Infra通常指的是為支持大模型訓練和部署而構建的各種底層技術設施,包括處理器、操作系統、存儲系統、網絡基礎設施、云計算平臺等等。

AI Infra 是提供 AI 中間件所需要的底層基礎設施的一部分。

一些公司的大模型會作為終端能力接入各種軟硬件設備,這里最容易實現的有 Google、微軟、蘋果(雖然還沒有自己的大模型)、華為、百度這樣的公司。

大模型的競爭也將帶來操作系統、軟件市場、終端市場(特別是極度依賴多模態交互輸入、輸出的設備,如音箱、手表、車載 HMI、MR)的競爭格局變化,

但 LLM 本身很難獨立成為 OS 級別的系統,這受限于幾點:

  • 純 CUI/VUI 的交互輸入局限性、人們還是需要鼠標、(軟、硬)鍵盤這樣的設備輔助輸入;
  • 輸入產生精力消耗,娛樂性質的刷推薦 feeds、訂閱流仍會是大部分人的主要訴求;
  • 來自當前 OS 系統的防御,也就是上面提到的巨頭公司們;
  • 開放的平臺和生態建立難:成為 OS 級別的系統需要有足夠的開放性和可擴展性,以支持不同類型的應用和場景。需要有完善的生態系統和開發者社區的支持,才能吸引開發者輕松地創建和集成;
  • 短時間內難以形成一家獨大的局勢:不論國內還是國外,投身LLM戰場廝殺的巨頭有很多,未來幾年內很難如 PC、手機操作系統形成部分頭部穩定主導的場面,開發者也就不會專注在一個模型上做能力補充,而是更傾向于做獨立的,不完全依附單個LLM能力的產品(也就是傾向于做 API 可換甚至接入多個 API 的應用而非為單個 LLM 建立 Plugin)

Perfect Prompt — 能夠給出不同模型在同一場景下的回復。

也許會有人做這個方向,純 LLM 的 OS 系統 受眾和應用場景都比較受限。

以上判斷基于當前的 AI 能力,也僅代表個人見解,如有不同看法歡迎討論~

二、大模型帶來的交互變化

判斷的基本邏輯在于:

  • 交互的本質是輸入和輸出,大模型并沒有帶來信息格式的變化,而是加速了信息的生產和交流。
  • 大模型帶來的能力強化主要有文本(這里如果不局限于LLM,就還有圖像、視頻)理解能力、文本生成能力、總結和歸納能力、翻譯能力等。

1. 交互鏈條變短

這也是自然語言交互被增強帶來的最顯著優勢,這點能夠直接打破現有產品交互的局限性。或者輔助用戶決策、完成機械的流程化任務。

表現1 – 輸出結果:不用通過搜索在眾多的反饋中找目標,而是直達結果。

對應場景:任何使用搜索的任務,機票、酒店、某個解決問題的答案等。

表現2 – 輸入內容:多個意圖能夠被一次性處理,縮短中間流程。

對應場景:總結所有參會人的空閑時間,尋找合適的會議室,生成一場新的會議邀請。

也就是說,傳統設計領域致力于在有限的條件下幫助用戶梳理到達目的地的最佳路徑,為用戶清除流程上的障礙。而現在可以通過AI技術去大幅優化現有產品的交互流程,同時縮短輸入和輸出過程,對傳統的交互方案帶來顛覆性的改善。

不過我對「產品 CUI 化」也保持謹慎,CUI 只是降低了一定的門檻,“持續對話”其實非常耗費腦力和精力,如果能點個按鈕就完成的事情,要 CUI 反而會將問題復雜化。

2. 改變輸入方式

更多場景可以轉變為 CUI、甚至 VUI 。

案例1:在一些政務服務場景,如果能夠通過對話的方式一步步引導填寫,對老年群體會更友好,同時填寫方式可以簡化成語言輸入;

復雜表單填寫中的一些錯誤提示也許可以通過對話的方式引導補充。

案例2:Prompt 命令生成圖像/視頻/音樂

Adobe firefly beta

但是目前看來,受限于大模型應用的理解能力,用戶輕松駕馭 Prompt 還存在門檻(即弄清楚自己的需求 并懂得如何用 prompt 表達需求),輸入方式還沒有得到極致的簡化和易用。不過已經有一些應用開始補齊這方面的體驗。

Hayo —— 米哈游旗下AI社區

3. 信息反饋更多維

Chat GPT 已經可以將信息組成新的格式,如表格、代碼等;GPT 4 能夠直接理解并處理圖像上的文本信息。

而 Meta 最新開源的 ImageBind,綁定了文字、聲音、圖像、深度、溫度、IMU 六種數據。可實現音頻生成圖像、圖像生成音頻等,未來應用的想象空間應該會更大。(不過官網并沒有看到溫度、IMU 相關的案例…)

Meta ImageBind

4. 終端能力得到加持

這點也是基于前兩點即信息輸入方式和信息反饋的。未來大模型在音箱、手表、車載 HMI、MR 這些設備上的使用價值巨大。

最直接的價值則是強化語音助手的能力。

另外就是和具體的應用結合,比如結合 Camera :通過檢測畫面信息,給出照片拍攝改進建議(角度、構圖、參數設置等),不會拍照的男朋友們再也不用擔心被罵了…

大模型能力和傳感器能力的整合也更值得期待,比如根據實時運動信息、心率給出接下來的運動規劃。

5. 對工具類產品的沖擊大于內容消費型產品

這點是從用戶信息獲取訴求上來判斷的,畢竟娛樂內容消費場景更多的考慮不是效率而是多巴胺,而對于生產、工作場景,提升效率是核心指標。

從 Notion、釘釘等應用中,大模型已經開始對人們的工作流程產生正向影響,逐步減輕知識記憶、寫作、摘要、信息查找等流程化的工作。

6. 豐富C端場景

場景1:私人助理也許會成為可能,大模型通過調用所有應用接口(日歷、郵件、行程等)獲取個人信息,成為私人顧問。

場景2:CUI 生成圖像/視頻/音樂的能力可以在各種活動玩法中發揮作用。

也許以后的網易云年度總結就會根據聽歌習慣生成一首符合你個人品味的音樂。加入一些簡單的用戶操作,人人都是「網易云音樂人」。

7. 廣告推薦形態產生變化

搜索、信息流為主的場景,變為融入問答,做到更精準、高效的廣告分發。

就拿比較好商業化的美妝行業來說,假設淘寶對李佳琪做直播內容分析和訓練,做出了個 AI 版李佳琪,支持用戶通過問答的形式獲得商品推薦。專業背景+人設背書,一定不缺用戶,品牌商也會更愿意砸錢。

三、 這波大爆發中看到產品的哪些可能性?

判斷邏輯是,應用前景、用戶需求程度、成本和商業化能力??深A見的是大模型研發成本太高,中小企業或團隊會專注在 AI 中間件、AI 應用上發力。

這里我們聚焦應用層看看。

1. 和現有產品的結合,快速且可預見的收益大

近期所有工具類產品都在發力,比較實用的有 Notion、釘釘。

2. 部分方向值得基于LLM的能力重構

如搜索、語音助手(近期出現最多的 C 端應用就是不同 character 的 Chatbot )、翻譯工具(可以舉例插件)、教育產品(語言、課程的私教方向很快就能出現頭部應用)。

3. 助力超級個體,提升知識生產效率

如果說面向大眾的 AI 產品難商業化,那么考慮為第一批使用AIGC產品的人群提供服務也是個不錯的想法,受眾群體更聚焦,服務更剛需,也更容易產生付費轉化。這個方向近期已經涌現了一批此類產品,比如協助開發、快速接入大模型 API、快捷創作 AI 產品、為自己的網站接入客服等。

此外,做輔助文字、圖像、視頻、音樂生產,提高文字、設計、創作者的生產效率也是不錯的方向。游戲領域已經有很多產品輔助 AI 生成角色、視頻、音樂、腳本提升游戲開發效率。

4. To C 個性化定制變得更重要

旅行、學習、購物、讀書等領域可以根據用戶訴求量身定做。

應用層的詳細案例將在下一篇《番外篇》中展示。

四、投身 AI 產品的建議

1. 大量產品服務會持續涌現,原因是個人開發者能力得到了第一批 AIGC 產品的加持,未來同賽道將涌現多個相似解決方案,做產品會逐漸從拼創意到拼速度、產品服務質量和拼持久力。

2. 加深產品壁壘:

  • 場景和訴求的準確洞察仍應被擺在首要位置,這將決定產品起跑線。
  • 考慮規模效應帶來的價值,比如一些 Prompt 文案、AI 圖片分享平臺未來有成為AI社區的潛質。
  • 考慮該場景用戶規模、使用頻次、消費時長,大模型能力出現前是否已經有較成熟的解決方案。
  • 提前考慮商業化問題(瞄準剛需人群和場景解決問題)。
  • 避免功能受到大模型能力升級帶來的沖擊。

3. 當精力和資源不足時,先深入某個場景解決小問題也是不錯的選擇,熟悉的領域扎根深挖反而能發現與眾不同的視角(如 Figma 插件 Magician ,只解決 UX 設計場景,提供文字描述生成圖標、UX 文案優化能力)

相關參考文章推薦:

這篇寫的很好,我深度看了兩遍:

https://mp.weixin.qq.com/s/PDHWfclMVQrS-2MLCbDm0g?from_wecom=1

超級應用出現和平臺的新特性息息相關」的一些結論可以引發思考:

https://mp.weixin.qq.com/s/RXgiIb7oqWmTysffMYim9Q?from_wecom=1

https://mp.weixin.qq.com/s/kjWScZshPAS61053GopJhg

關于 AI 產品商業化:

https://mp.weixin.qq.com/s/k16ZtaA-b0fPh-25ftDddg

https://mp.weixin.qq.com/s/wWWG

作者:Bay,騰訊體驗設計師,公眾號:Bay的設計奧德賽

本文由 @Bay 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!