AI產品經理B端產品典型案例——從0到1構建機器學習平臺

0 評論 6306 瀏覽 49 收藏 14 分鐘

編輯導讀:現在,越來越多的重復繁瑣的工作正在由機器人代勞,而隨著人工智能的發展,機器學習平臺未來能幫助人類解決更多復雜的事情。本文作者分析如何從0到1構建機器學習平臺,希望對你有幫助。

一、需求分析

1. what

首先解答一個問題,什么是機器學習平臺。第一步就是要了解什么是機器學習,主要指的是現如今大火的人工智能的實現方法(比如利用決策樹、聚類、貝葉斯分類、SVM、adaboost等等,當然也有當前主流各種深度神經網絡模型Alexnet、resnet等等),跟人工智能、深度學習的關系可以參考我的另一篇文章《AI產品經理的7堂必修課:必備的AI基礎知識》此處不做贅述,當然這些知識也應該是一個AI產品經理應知應會的。

什么是一個機器學習的平臺呢?因為前面提供機器學習是人工智能的實現方法,那么這個平臺就是AI算法工程師實現人工智能算法所需要的工具集,為什么是工具集而不是工具;因為平臺的定義絕不僅僅是單一功能的,而是涵蓋了從0到1如何實現一個算法模型的數據準備、算法模型選擇、驗證、測試與優化、量化與部署,即從無到最終實現。因為這是一個相對復雜的系統工程,每一個步驟或者是每一個不同類型的任務需要的工具就會有差別,因此我們需要一個平臺提供端到端閉環的完整服務。

最終實現的事情可以這樣理解,我們輸入是一些我們在日常生活中想要AI計算機解決的問題(比如如何快速識別人臉、如何在手機上分類圖片),輸出就是一個完成的AI服務(無論是在線的網頁訪問還是離線的手機上調用)

2. who

我們的用戶是誰?

首先上文提到了AI算法工程師,因此是一個個有特定職業技能的個體,因此我們定義成是一個to C的產品么?不要忘記知名產品經理俞軍老師說過:“用戶不是人,而是需求的集合?!?/p>

我們所看到的AI算法工程師(學生),他們都是被一個個組織所雇傭,最終是為了解決一個個企業/組織面臨的有待用AI方法解決的問題。但是如果沒有平臺,其實這些事情也可以做,只不過相對效率就低了很多。因此我們的平臺定位就是:高效高質量的解決組織面臨的需要AI算法模型解決的問題。

因為商業的本質是追逐利益最大化的,如何提升AI算法模型從無到有的每一環節的效率且并最終可以做到邊際成本為零(批量的復制生產AI模型且不會出錯,或者版本一致性較差等問題),甚至可以做到替代部分人甚至替代全部的人,這個應該是機器學習平臺追求可以不斷優化迭代的方向,也是企業組織會為你的產品買單的原因,因此這個平臺定位是一個to B的產品。

3. when & where

解決了上一個問題,這個問題就十分好回答了。

既然我們的用戶是利用AI解決實際生產經營問題或者提供AI服務的組織,那么他們使用的場景應該就是典型的workplace,當然包含可遠程辦公接入的場景,接入的設備默認就是相對專業的電腦而不是各種移動端設備。且由于我們是to B類的產品。且一般ai算法模型的訓練迭代可能是7*24的,因此對于平臺的穩定性、安全性、容災性要求更高。

但是對于剛開始僅對內部服務的平臺除外,這類平臺初期,可以多邀請早期內部的算法同事優先使用,在早期發現各種問題,并進行敏捷迭代,穩定后再逐步推廣到范圍更大的組織使用。其實很多to B的產品應該都是這樣的路線,比如釘釘、飛書,其實都是從內部需求中不斷打磨最終才拓展到外部,面向更大的市場,做商業上的變現。

二、競品分析

其實機器學習平臺并不是一個很創新的產品,其實早期做云平臺的公司,都從PaaS逐步向上做SaaS做更增值的部分,那么機器學習應用就是一個很典型的場景。

根據IDC發布的報告,可以看到機器學習平臺賽道已經聚集了三支實力軍團:以BAT、AWS和微軟為代表的云服務商;以第四范式為代表的AI平臺公司;以新華三為代表的大數據公司。從2021年上半年的中國AI云的市場占有份額TOP我們重點分析下百度、阿里、華為、騰訊以及海外代表亞馬遜;

圖1、IDC發布的2021上半年中國AI云服務市場份額占比BAT占據前4名中的三席

接下來對這五家進行一個橫向的對比分析:

表1、主流AI學習平臺對比分析

通過表格分析可知,如今主流平臺的核心優化點都在于提升的效率,無論是一站式服務、節約成本、零門檻上手、快速訓練/部署等等,此外平臺預置預訓練大模型也將是未來機器學習平臺的一個突出趨勢。

三、如何實現how

通過分析國內外主流機器學習平臺,我們得出機器學習平臺的全流程,具體流程梳理如下思維導圖:

圖2、機器學習平臺全流程拆解

如果想要進一步了解每每一個機器學習平臺產品的功能模塊細節,建議大家可以去各家官網上查閱產品文檔,相信我,認真讀懂整個產品文檔,你應該可以構建一個60分的機器學習平臺了。個人比較推薦華為modelarts和百度的EasyDL,兩家的文檔結構清晰、內容翔實。

但是由于這幾家的平臺產品都是面向全行業的用戶,比如百度EasyDL支持圖像、文本、語音、OCR、視頻、結構化數據(數據智能),但是我們一般自己構建的平臺更多的是針對自己組織所遇到的問題,因此一上來并不需要特別全面,而是針對某一個任務完成端到端流程的打通,后續再橫向拓展兼容其他類型的任務。

再比如,我現在遇到的問題就是計算機視覺CV領域的非常常見問題圖片多標簽,這是一個分類問題,谷歌的imagenet整個數據集包含21841類,1400萬張圖片,其中常用的子集包含1000類,120萬張圖片,為什么我們還在做類似的問題,就是因為大而全必定就會在某個具體領域具體產品場景上表現夠好,比如我們的手機相冊,隨著隱私保護逐步引起大家重視,不太可能要求用戶把數據全部同步到云端。

如何通過機器學習平臺自動化的提升端側提升用戶端側相冊照片的多標簽表現力,需要從數據整理、模型訓練(增量學習、大模型蒸餾小模型)、測試和調優(在滿足用戶使用場景的測試集上進行驗證,看迭代的模型是否較上一版本有顯著提升,同時需要考慮端側的算力與功耗的平衡)。

雖然商業化的機器學習平臺有其優勢,比如更穩定、功能更全面、更自動化,但是針對自有問題場景深度定制的平臺可以更精準的定位痛點、解決本質問題。自有平臺與商業平臺可以進行優勢組合,自有平臺做商業平臺無法解決的,商業平臺完成已經非常成熟的、經過大規模商業論證的部分。最終讓機器學習平臺價值最大化。

圖3、相冊某任務的用戶行為分析,用來反推機器學習平臺需要重點優化的功能

前期構建過程中,可以多與具體負責該功能的ai算法工程師進行訪談,了解其當前工作中的主要困難、比如一些商業化的平臺無法解決的但是高頻遇到的,主要影響其效率的;并結合最終應用場景的用戶埋點數據進行分析,包括一些NPS數據,用戶當前對于哪些場景滿意度較差、哪些環節影響了使用體驗、打斷了用戶的使用節奏,那么這些就是我們需要總結歸納,通過平臺來解決的問題。

當然做前期的產品調研也要考慮到未來平臺產品的可擴展性,下一步計劃解決什么樣的任務,與平臺技術專家多溝通,深入了解用什么樣的架構/設計可以兼容未來的潛在需求,聊聊平臺產品成功時候的樣子。

四、如何在早期提升用戶的活躍度,實現從0到1 的用戶增長

因為從0到1的時候還不涉及商業化變現,但是其實一個平臺本身可以通過一些自身的論證數據來體現其價值。比如,數據準備效率從100人天縮短至10人天,訓練耗時從1天變成0.5天等等。平臺本身的用戶活躍度和使用時長也可以很好的說明一些問題。

同時早起可以營造一個內部開放共享的生態環境,比如類似華為和百度的AI市場,鼓勵大家內部開源模型、數據等等,同時對于積極開源的用戶可以按照貢獻值提供平臺特殊的福利,不一定是以金錢來衡量,但是卻是算法工程師很剛需只有你可以提供的。

比如說,貢獻值高的用戶有排隊訓模型的VIP通道,模型可以加速訓練,可以優先體驗一些平臺的新功能(一鍵式部署/自動采集標注數據等等);這些對于組織內部有限的資源,且工程師每天可能會花很多時間來等待資源訓練的話,貢獻度高的用戶在你這個平臺上就可以體驗到“爽”的體驗。其實這背后的道理跟做其他產品是一樣的,別讓用戶“等”、別讓用戶“想”、別讓用戶“煩”,要讓用戶有參與感!

隨著平臺逐步壯大后,從1到N的商業模式其實上面推薦的商業化平臺都有很好的示范,比如拿百度的EasyDL距離,圖像在訓練模型階段不收取任何費用,僅在模型部署應用階段計費,分為:公有云API計費(按QPS計算)、私有服務器部署計費、設備端離線SDK計算(按裝機數量計算)、軟硬一體方案計費(整機+算法服務的一整套解決方案,直接賣設備)。大家可以直接參考。

最后,希望看完這篇文章的你對于如何構架一個機器學習平臺或者是打造一個B端的產品能有一些啟發。

 

作者:大仙河,7年AI產品相關經驗;微信號 :大仙河知識學堂

本文由 @大仙河? 原創發布于人人都是產品經理,未經許可,禁止轉載

題圖來自Pexels,基于 CC0 協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!