“(LLM產品)評估”背后,再深一層和兩層的關鍵能力,到底是什么

0 評論 157 瀏覽 0 收藏 8 分鐘

在人工智能迅速發展的今天,如何有效評估大語言模型(LLM)產品成為了產品經理的重要課題。本文將深入探討評估 LLM 產品背后的關鍵能力,強調業務認知和理想產品形態的“畫面感”對于成功評估的重要性。

當前模型受限于評估而非智能,評估將成PM核心技能……”

1、業內大多數AI評測報告(的思路),本質上來說,都是相對“純技術視角”的,主要是為了對大眾PR、融資等等。

2、深入一些的,是最近半年,由于大模型的特殊性,業內出現了一些細分的“AI評測工具”。

3、真正要做好評估,深一層的關鍵,是業務know-how

比如之前社群里有PM同學,嘗試寫“教育+AI”場景的評測文章;最開始第一版,和常規評測報告類似,只是列舉一些體驗對比效果。

我就建議說,我們不是研究機構,不能寫那種籠統、表層的內容,而應該先有自己產品視角的非共識認知/預設(比如,在某個場景下,對于某個細分用戶群體,認為存在某個需求痛點,能夠通過某個產品體驗流程、解決多少,而且用戶愿意為此付費多少,等等)

基于這些預設,針對性地設計評測思路和具體方式,然后再去做評測,才有意義。即,驗證自己預設是否正確、再進一步調整優化。

后來,ta最終版的文章,就好了很多。

也就是說,如果沒有自己對業務本質的認知、know-how,是不可能做好評估評測(設計)的。

4、(再深挖一些)真正要做好評估,深二層的關鍵是——自己腦子里能呈現出,那個理想形態的AI產品,最終大概是個什么樣子(有某種程度的“畫面感”)——然后,才有可能通過“設計評測思路”、“做實驗”、“迭代”,一步步的具象出那個東西。

或者說,對于未來真正頂級AI-native產品經理,這個能力,是最高門檻所在。

1)什么意思?真正的AI-Native產品,一定不是簡單的chatbot對話氣泡、不是目前那些AI搜索的樣子。那是什么呢?是什么,根本不是靠邏輯推理出來的。

之前有點影子的,是類似小冰島app的用戶歡迎界面視頻、里面那個多模態的虛擬人。

為什么多模態/形象(不論虛擬或實體),可能是必須、而不是可選?為什么最近看到rokid的AR界面,左邊是虛擬形象、右邊還是文字界面時,我感覺“還不如把右邊都砍掉試試”?這種問題,根本不是講道理,能讓所有人都get到的。

你的“心”能體會到,才能get到。而大多數人,還不理解什么叫“穩定地站到‘心’這個維度”

2)正面例子。

比如iPhone。如果不是喬布斯,觸屏交互的智能手機,可能一直都出不來。

真正跨域式的創新,不是靠行業線性積累,能夠突破的。

得靠那個特別的人。

3)反面例子。

最近聽說,某大佬前輩做AI搜索項目的前因后果。一開始,他遍歷研究了很多AI產品方向,篩選出了4個備選,然后結合自己經驗特點,又如何進一步篩選,最終剩下了現在的AI搜索產品。

非常明顯的判斷是,這個事情,除非后續有重大轉變(要么是項目方向,要么是大佬自己內在),否則在當前定義和路徑下,幾乎一定是走不通的。

因為,做事的根本緣起,不能這樣,而一定是要有自己內心的某個熱忱和發心、要有自己不一樣的認知和畫面感(這是一個頂級的能力素養維度)。

4)“畫面感”?有什么例子嗎

例一,李繼剛

最近他在一個分享里說,“腦海有畫面:輸入提示詞,神經元之海中,冒出「存在」來迎接,刪除對話它就湮滅,新開對話冒出另一「存在」。

去年10月,他在另一篇文章里,也提到過“大量的空洞”、“一支箭直接射在點上”,這些,都是非常典型的。

例二,王小川

去年3月份,王小川在一個訪談里,多次提到了“畫面感”。

“當ChatGPT來之后,我已經看到這個技術能解決的問題、最后的畫面感是什么。這兩個畫面感,朱嘯虎、楊植麟都沒畫出來。楊植麟是屠龍刀,我有屠龍刀的刀了,然后去找龍?!?/p>

“我們今天需要更快把場景打開,有些場景形成數據飛輪,甚至形成全球化優勢。我有這樣一個畫面感。”

例三,某行業前輩WJS

5、總結下

1)要做好(LLM產品)評估/評測

深一層的關鍵,是有自己的業務know-how/非共識認知。

深二層的關鍵,是在自己腦子里,能呈現出,那個理想形態的AI產品,最終大概是個什么樣子(有某種程度的“畫面感”)。

而這個的根本,得不斷地提升自己的“維度”。

2)這也是為什么,我一直強調,「AI產品經理能力模型的重點素質:人文素養和靈魂境界」。

這也是為什么,我花了那么大的心血,就是為了幫助大家真正的提升維度。

只有提升了維度,才可能先在自己心里,“看”到那個東西。

這是未來所有AI產品經理和AI從業者的,巨大分水嶺。

專欄作家

hanniman,微信公眾號:hanniman,人人都是產品經理專欄作家,前圖靈機器人-人才戰略官/AI產品經理,前騰訊產品經理,10年AI經驗,13年互聯網背景;作品有《AI產品經理的實操手冊》、200頁PPT《人工智能產品經理的新起點》。

本文原創發布于人人都是產品經理,未經許可,不得轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!