揭秘:如何尋找、設計大模型產品并落地發布?

6 評論 5458 瀏覽 81 收藏 18 分鐘

AI技術的進步,給人們的工作場景帶來了很大變化,越來越多企業開始嘗試將AI技術融入到業務中,許多AI產品也應運而生。那么,產品經理要怎么尋找到可以和AI結合的場景?這篇文這里,作者介紹了大模型產品從0到1的落地經驗,一起來看。

從2月份 OpenAI 發布以來,AI 已經席卷了各個應用場景,工作和生活。我們可以看到市場上越來越多的產品在 AI 化,有報告顯示 76% 的 SaaS 公司正在使用或者測試將 AI 融入到他們業務中。22% 企業正在考慮如何將 AI 和業務場景結合,進行下一步的 AI 迭代升級。以前做不到的場景能力現在也變得可行。

此外,市場上很多 AI/AIGC 產品經理崗位的需求,也旺盛了起來。

這一整個行業的技術變革對創業者和產品經理都提出了一個重要挑戰:

  • 你的業務/產品和 AI 之間有什么關系?
  • 如何設計出你的下一代 AI 產品?

從市場目前的應用數據量來看,市場目前并不是“只在找釘子,而找不到應用場景”的階段。也不是“AI 不只是在第一階段,還沒法證明價值”。根據麥肯錫的報告,已經有非常多的企業和產品落地 AI 應用。

不過這并不意味著 AI 的整合應用,一切都已經成熟。

Alex Singla 指出:

要邁出下一步,讓生成式人工智能從實驗變成業務引擎,并確保獲得豐厚的投資回報,企業需要解決一系列廣泛的問題。這些問題包括:確定組織內生成式人工智能的具體機會、治理和運營模式應該是什么、如何最好地管理第三方(如云和大型語言模型提供商)、管理各種風險需要什么、了解對人員和技術堆棧的影響,以及清楚如何在銀行近期收益和發展規模所需的長期基礎之間找到平衡。這些都是復雜的問題,但卻是釋放真正巨大價值的關鍵所在。

作為 AIGC 產品經理,今天給大家介紹一下整體大模型從 0 到 1 的落地經驗。分為:

  1. 怎么找到可以和 AI 結合的場景
  2. 如何做 AI 的可行性驗證
  3. 算賬,引入AI 后,企業掙不掙錢
  4. 尋找潛在客戶 POC(proof of concept) 演示
  5. 落地應用并規?;?/li>

這 1-5 步想要跑得快,就需要有人熟悉 AI 大模型 + 垂直用戶場景。所以對產品經理和企業 CEO 來說,也提出了新的挑戰。

一、怎么找場景

這一步是產品基本功,我們需要朝外看,先看行業的用戶,需要完成哪些任務,核心痛點是什么。這里面哪些可以使用 AI 大模型技術能完成。

創新之父克里斯坦森有一個「任務理論」,他介紹了這么一個經典例子:

20 世紀 90 年代中期,底特律的兩位顧問造訪克萊頓·克里斯坦森教授在哈佛商學院的辦公室,深入學習顛覆性創新理論。鮑勃·莫埃斯塔和他當時的合伙人瑞克·佩迪正在發展一項利基業務,為面包店和零食公司提供建議。

莫埃斯塔分享了為一個快餐連鎖品牌打造的方案:販賣更多的奶昔。這家連鎖公司花了數月,極盡細致地研究這個問題。幾個月后,營銷人員付出了很多努力,奶昔的銷量卻一點兒變化也沒有。

因此,教授教他們從另外一種角度來思考問題:這些消費者的生活中出現什么樣的任務,才會促使他們來到這家餐廳“雇用”奶昔呢?

以這個視角為出發點,營銷團隊選了一天,在餐廳里站了18個小時來觀察顧客:人們是在何時購買奶昔的?他們穿著什么樣的衣服?是獨自一人嗎?除了奶昔之外,他們還會買其他食品嗎?他們是在餐廳里把奶昔喝完,還是開車帶走呢?

原來,很大一批奶昔是在上午9點之前賣出的,買者則是獨身來到快餐店的人。這些人大多只會購買一杯奶昔,他們不會待在餐廳把奶昔喝完,而是鉆進自己的車里開車帶走。因為清早的消費者都有一項需要完成的任務:他們不得不百無聊賴地花很長時間開車上班,因此想要用什么東西讓旅途變得有趣一些。

原來,這項任務的競爭者有許多,但沒有一位能把任務完成得無懈可擊。有的消費者雇用香蕉來完成任務,但香蕉幾口就吃完了。還有的消費者購買了甜甜圈,但是面包屑太多,讓他們手指變得黏黏的,弄臟衣服和方向盤。貝果面包則又干又沒味,讓開車的人不得不一邊用膝蓋轉方向盤,一邊往面包上涂抹奶酪和果醬。還有人購買士力架。但他覺得,早餐就吃甜點實在太罪惡了,所以再也沒有這樣做過?!钡悄涛裟??它可以算是諸多選項中的最優項。用纖細的吸管喝完一杯濃稠的奶昔需要花很長時間,而且奶昔還能幫助抵擋上午10點左右襲來的饑餓。

由此可見,這種奶昔能比其他競爭者更好地滿足需求。在消費者的眼里,其他競爭者不僅包括其他連鎖店的奶昔,還包含香蕉、貝果、甜甜圈、早餐棒、思慕雪和咖啡等。

研究團隊還發現:這些奶昔和消費者之間的共同點與他們的個人狀況沒什么關系,這些消費者的共同點是他們必須要在早上完成一項任務。

每個人的日常生活中都會出現需要完成的任務,這個時候,我們便會雇用產品或服務來完成。

此外,從任務的視角去理解用戶,你會發現什么才是你真正的競爭對手。你關注的其實更應該是客戶在解決任務中的替代方案,而不是你以為的對手。

「任務」的定義

那到底什么是用戶需要完成的任務呢,其定義是指:

  • 一項任務是指個人在特定背景下想要實現的進步。
  • 成功的創新可使用戶取得理想的進步、解決困難、實現未完成的夢想。這些創新可以完成缺少有效解決方法或不存在解決方法的任務。
  • 任務絕不僅僅涉及功能,社會和情感因素也占有很大比例,而這兩者,有時甚至要比功能因素更重要。
  • 任務是在日常生活中出現的,因此背景對于其定義至關重要,這也是創新任務中不可或缺的一個環節。用戶特征、產品特征、新科技和流行趨勢,這些都不是創新任務的關鍵環節。
  • 需要完成的任務是不斷發展和重復出現的,幾乎不可能是獨立存在的“事件”。

任務比「需求」的概念要清晰,容易定義很多。因為需求是模糊、寬泛、且無處不在的。

你可以列出你的行業場景中,目標用戶需要完成哪些任務,然后進行挑選,優先尋找 quick win(快速贏) 的解決方案。quick win 的特征是:

  • 博弈方少,項目阻力小。
  • 大家普遍吐槽不愿意做的事情。
  • 可以短平快的切入,客戶快速感知價值。
  • 你能夠悄悄地贏,同時也意味著你可以悄悄地輸(可選,這點取決于對事情成功率的把握)。

還有一種做法,是看現在 AI 產品/競品集成場景有哪些,哪些是可以遷移復制到自己的業務中的。不過這種類型的遷移,有可能是一片競爭血戰,因為大家都看得到。比如電商場景里的聊天對話。對于產品來說,切入點很重要,大家可以多思考還有哪些場景可以和 AI 做整合(可以輕松地悶聲發財)。

二、大模型可行性驗證

有了場景后,接下來需要你對大模型基本原理有一定的了解和大致判斷,哪些場景任務是有可行性的。準備一些測試數據,選擇一個大模型平臺進行實驗,可以是百川、OpenAI,或者微軟 OpenAI。

以下以微軟 OpenAI 能力舉例,拋磚引玉。實驗主要分為三個部分進行實驗:

  1. 寫 Prompt —→ 此步驟是最重要的(如果效果不理想,那么就增加 example)。
  2. 調節參數,主要考慮穩定性和模型最大 token 數量。
  3. 輸入測試數據,查看對話效果,并且不斷調整 1 和 2 步。

最終基于可行性實驗,需要驗證的是:

  1. AI 在此場景下是否能夠解決問題。
  2. 需要什么版本的大模型能較好地解決你客戶的問題,(因為模型成本會非常不一樣)。
  3. 效果是否滿意。
  4. 效果是否穩定。

通過找場景 + AI 平臺驗證,現在你已經知道了哪些場景有明顯優勢,哪些在 AI 的技術下仍然不夠成熟?;谏厦鎴鼍暗奶卣?,可以挑選出可行的場景。

三、算筆賬,AI 業務到底掙不掙錢

接下來就是業務場景的 ROI 了,俗稱算筆賬。

你的這個場景到底在 AI 的加持下,掙不掙錢。因為大模型的 API 調用是線性增長的,你調用的越多,你的成本越貴。

下圖是微軟 Azure OpenAI 的收費模式,根據你實際調用的 token 數進行收費。其中 Prompt 指的是向模型輸入的 token 數量;Completion 指的是模型輸出的 token 數量。token 數量多少在 Azure 上會列出,所以不用擔心不知道怎么計算 token。

如果你的場景里面,單次調用的成本要壓在 0.0015刀以內,那么你的這個場景肯定是不掙錢,也不適合大模型的。我們需要在回歸到第一步里面,找到用戶花代價較大的場景價值中,用大模型實驗。

因為在成本的計算中,你需要考慮,現在用戶花多少代價解決這個問題,你能幫助他減少多少。減少的這部分,你能收多少錢,能否覆蓋大模型的成本費用(如云成本)和你的開發費用。

算賬成本可以分為:

  • 大模型成本;
  • 云成本,一般分為存儲成本,帶寬成本,機器成本(如 GPU)等;
  • 三方服務 API 調用成本;
  • 人工 QA 成本(AI 一般少不了這部分,不然你無法做準確率的驗證);
  • 研發開發成本。

四、如何評價 AI 的工作,響應速度、準確率、穩定性?

通過以上實驗,你已經可以知道 AI 的能力。但是怎么去評估 AI 的工作,響應速度、準確性、穩定性、魯棒性,需要多少數據集進行驗證?這就是接下來如何把 AI 工作量化和下一步規?;臅r候需要關心的部分。

上圖是艾瑞咨詢列出得大模型服務能力評估體系。非常的全面。不過我們實際在使用的過程中,不會這么使用。右側其實是產品怎么去找場景、價值;左側目前業界常用的 AI 也是準確率(可以進一步拆分為 Precision 和 Recall。你可以通過構建一些測試數據集,來驗證你的場景在 AI 大模型下的準確率。這里會需要進行人工驗證。

五、完成產品 MVP 和工程化工作

完成了場景的可行性驗證,接下來我們需要考慮產品化。有人會問:“如何設計 AI 原生體驗產品?”“AI 是一個 feature 還是一款產品?“

這其實很好回答,回到你的用戶故事中去。在用戶需要完成某個任務的場景中,用戶是怎么解決他的問題的,他的流程是怎么樣的。流程里面你的業務/產品扮演什么角色,是一個端到端的解決方案,還是里面某個環節部分,如何融入到客戶的用戶故事中去,是一個 App/Web/API?

AI 的應用設計,產品經理需要著重考慮三個方面:

  • 客戶體驗:AI 的用戶體驗和及時反饋常做的不好,用戶是否有及時反饋
  • 規?;耗壳按竽P偷恼{用有 Rate limit 限制。一個Region GPT-4,8k token 的服務調用限制是20K/min。你需要考慮如果你有海量的數據和用戶,需要怎么解決 Rate limit 限制
  • 數據隱私和安全:做企業 SaaS 服務的基本繞不開數據隱私的話題,業界比較好的案例可以參考 Notion 和微軟 Azure 的安全能力,基于各個企業自己的安全機制來處理此部分。

https://www.notion.so/help/notion-ai-security-practices

接下來根據這些關鍵信息,去全局地設計的產品。又回歸到傳統的產品設計了。

AI 是一次技術的升級,它可能全部顛覆以前傳統的方法,也可能是傳統方法的加持。但是不管如何,對于產品經理來說,整體的設計流程并沒有改變。但是里面多了一個重要變量:AI。

此外,大家如果做大模型項目/應用的時候需要注意,如果 AI 整合進業后務,有可能會去顛覆一個行業。作為產品經理和創業者,除了產品方案本身,其實我們還要考慮很多對行業、對企業組織運營的影響。推薦大家閱讀本專欄相關創新的文章。

為我投票

我在參加人人都是產品經理2023年度評選,希望喜歡我的文章的朋友都能來支持我一下~

點擊下方鏈接進入我的個人參選頁面,點擊紅心即可為我投票。

每人每天最多可投30票,投票即可獲得抽獎機會,抽取書籍、人人都是產品經理紀念周邊&起點課堂會員等好禮哦!

投票傳送門:https://996.pm/YNx1o

專欄作家

圈圈,微信公眾號:lovepm,人人都是產品經理專欄作家,專注與熱愛產品工作。

本文原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 能否再講講,當前AI在不同領域,或在您深耕的領域內,都是在什么場景下集成了AI呢?

    來自北京 回復
  2. 寫的非常專業!

    來自浙江 回復
  3. 很棒的科普文

    來自廣東 回復
  4. 好文!

    來自日本 回復
  5. 很贊的文章!

    來自上海 回復
    1. 謝謝喜歡,也可以關注公眾號,一起進群溝通大模型哦

      來自上海 回復