“(LLM產品)評估”背后,再深一層和兩層的關鍵能力,到底是什么
在人工智能迅速發展的今天,如何有效評估大語言模型(LLM)產品成為了產品經理的重要課題。本文將深入探討評估 LLM 產品背后的關鍵能力,強調業務認知和理想產品形態的“畫面感”對于成功評估的重要性。
“當前模型受限于評估而非智能,評估將成PM核心技能……”
1、業內大多數AI評測報告(的思路),本質上來說,都是相對“純技術視角”的,主要是為了對大眾PR、融資等等。
2、深入一些的,是最近半年,由于大模型的特殊性,業內出現了一些細分的“AI評測工具”。
3、真正要做好評估,深一層的關鍵,是業務know-how
比如之前社群里有PM同學,嘗試寫“教育+AI”場景的評測文章;最開始第一版,和常規評測報告類似,只是列舉一些體驗對比效果。
我就建議說,我們不是研究機構,不能寫那種籠統、表層的內容,而應該先有自己產品視角的非共識認知/預設(比如,在某個場景下,對于某個細分用戶群體,認為存在某個需求痛點,能夠通過某個產品體驗流程、解決多少,而且用戶愿意為此付費多少,等等)
基于這些預設,針對性地設計評測思路和具體方式,然后再去做評測,才有意義。即,驗證自己預設是否正確、再進一步調整優化。
后來,ta最終版的文章,就好了很多。
也就是說,如果沒有自己對業務本質的認知、know-how,是不可能做好評估評測(設計)的。
4、(再深挖一些)真正要做好評估,深二層的關鍵是——自己腦子里能呈現出,那個理想形態的AI產品,最終大概是個什么樣子(有某種程度的“畫面感”)——然后,才有可能通過“設計評測思路”、“做實驗”、“迭代”,一步步的具象出那個東西。
或者說,對于未來真正頂級AI-native產品經理,這個能力,是最高門檻所在。
1)什么意思?真正的AI-Native產品,一定不是簡單的chatbot對話氣泡、不是目前那些AI搜索的樣子。那是什么呢?是什么,根本不是靠邏輯推理出來的。
之前有點影子的,是類似小冰島app的用戶歡迎界面視頻、里面那個多模態的虛擬人。
為什么多模態/形象(不論虛擬或實體),可能是必須、而不是可選?為什么最近看到rokid的AR界面,左邊是虛擬形象、右邊還是文字界面時,我感覺“還不如把右邊都砍掉試試”?這種問題,根本不是講道理,能讓所有人都get到的。
你的“心”能體會到,才能get到。而大多數人,還不理解什么叫“穩定地站到‘心’這個維度”
2)正面例子。
比如iPhone。如果不是喬布斯,觸屏交互的智能手機,可能一直都出不來。
真正跨域式的創新,不是靠行業線性積累,能夠突破的。
得靠那個特別的人。
3)反面例子。
最近聽說,某大佬前輩做AI搜索項目的前因后果。一開始,他遍歷研究了很多AI產品方向,篩選出了4個備選,然后結合自己經驗特點,又如何進一步篩選,最終剩下了現在的AI搜索產品。
非常明顯的判斷是,這個事情,除非后續有重大轉變(要么是項目方向,要么是大佬自己內在),否則在當前定義和路徑下,幾乎一定是走不通的。
因為,做事的根本緣起,不能這樣,而一定是要有自己內心的某個熱忱和發心、要有自己不一樣的認知和畫面感(這是一個頂級的能力素養維度)。
4)“畫面感”?有什么例子嗎
例一,李繼剛
最近他在一個分享里說,“腦海有畫面:輸入提示詞,神經元之海中,冒出「存在」來迎接,刪除對話它就湮滅,新開對話冒出另一「存在」。”
去年10月,他在另一篇文章里,也提到過“大量的空洞”、“一支箭直接射在點上”,這些,都是非常典型的。
例二,王小川
去年3月份,王小川在一個訪談里,多次提到了“畫面感”。
“當ChatGPT來之后,我已經看到這個技術能解決的問題、最后的畫面感是什么。這兩個畫面感,朱嘯虎、楊植麟都沒畫出來。楊植麟是屠龍刀,我有屠龍刀的刀了,然后去找龍?!?/p>
“我們今天需要更快把場景打開,有些場景形成數據飛輪,甚至形成全球化優勢。我有這樣一個畫面感。”
例三,某行業前輩WJS
5、總結下
1)要做好(LLM產品)評估/評測
深一層的關鍵,是有自己的業務know-how/非共識認知。
深二層的關鍵,是在自己腦子里,能呈現出,那個理想形態的AI產品,最終大概是個什么樣子(有某種程度的“畫面感”)。
而這個的根本,得不斷地提升自己的“維度”。
2)這也是為什么,我一直強調,「AI產品經理能力模型的重點素質:人文素養和靈魂境界」。
這也是為什么,我花了那么大的心血,就是為了幫助大家真正的提升維度。
只有提升了維度,才可能先在自己心里,“看”到那個東西。
這是未來所有AI產品經理和AI從業者的,巨大分水嶺。
專欄作家
hanniman,微信公眾號:hanniman,人人都是產品經理專欄作家,前圖靈機器人-人才戰略官/AI產品經理,前騰訊產品經理,10年AI經驗,13年互聯網背景;作品有《AI產品經理的實操手冊》、200頁PPT《人工智能產品經理的新起點》。
本文原創發布于人人都是產品經理,未經許可,不得轉載。
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!