人工智能PM系列文章(三)AI工程化的系統(tǒng)思維框架

2 評論 10131 瀏覽 71 收藏 10 分鐘

本篇文章從三個(gè)關(guān)鍵階段介紹一下我理解的AI工程化的系統(tǒng)思維框架。每個(gè)人理解的工程化以及在每個(gè)不同業(yè)務(wù)類型公司中工程化的流程一定是不同的,但至少你可以參考這樣的思維模式進(jìn)行自己的修煉。

這段時(shí)間筆者就一直在考慮用什么樣的內(nèi)容作為系列終結(jié)篇最合適,通過我的觀察:大多數(shù)的AI PM實(shí)際上都很盲目的去學(xué)AI技術(shù),而且學(xué)的很深,尤其是那些產(chǎn)品新人。

學(xué)這些東西本身沒問題,但是這樣的時(shí)間和精力分配上就出了問題——入門任何一行最快的方法和手段就是實(shí)踐,讓實(shí)踐中遇到的問題帶領(lǐng)你探索AI領(lǐng)域的技術(shù)這樣不僅印象深刻而且可以舉一反三。

當(dāng)然,日常平時(shí)積累一些常用的概念還是必要的,比如至少你要知道什么是二分類問題,什么是ground truth、熵(entropy)的概念,dynamic learning的概念等等。

AI工程化的概念實(shí)際上在中國沒太多人提及,而我通過調(diào)研大量文獻(xiàn)后發(fā)現(xiàn)產(chǎn)品經(jīng)理更需要系統(tǒng)的理解和掌握AI工程化的流程和實(shí)踐能力。

反觀技術(shù)人員,他們每天要學(xué)習(xí)各種國外頂級期刊的論文,要掌握最新的框架和語言,但產(chǎn)品經(jīng)理需要的是積累工程化的經(jīng)驗(yàn),并逐漸形成自己的一套“打法”,包括看待問題的視角、切入點(diǎn)。

在數(shù)據(jù)少的時(shí)候,如何做冷啟動(dòng)訓(xùn)練模型的經(jīng)驗(yàn);通過混合部署和異構(gòu)計(jì)算節(jié)省計(jì)算資源從而節(jié)省整個(gè)公司的成本;在做模型校驗(yàn)尤其是離線學(xué)習(xí)、增量學(xué)習(xí)、在線學(xué)習(xí)時(shí)如何能快速找到指標(biāo)進(jìn)行評價(jià)和量化泛化效果,當(dāng)某一個(gè)業(yè)務(wù)場景下的模型訓(xùn)練好后是否可以考慮在其他場景中進(jìn)行移植,盡管遷移學(xué)習(xí)(transfer learning)或者叫progressive (continual) learning仍然有一些實(shí)現(xiàn)上的困難,但至少也會為企業(yè)提升效率,節(jié)省開支。

一、需求定義的工程化

技術(shù)體系的構(gòu)建離不開需求,而需求離不開行業(yè)理解和商業(yè)模式的價(jià)值觀導(dǎo)向。

某些技術(shù)經(jīng)理看到了國外最新的技術(shù)框架就想拿來用到自己的體系中,總是忽略ROI,甚至缺乏Vision,當(dāng)然并不是所有的技術(shù)經(jīng)理都這樣,只是出發(fā)點(diǎn)不同,看問題的視角不同,經(jīng)歷不同而已。

產(chǎn)品經(jīng)理需要關(guān)注行業(yè),比如做機(jī)器人的智能交互,涉及到了自然語言理解、交互語義理解、對話策略生成以及通過知識圖譜進(jìn)行在不同的場景下進(jìn)行意圖搜索等等。

產(chǎn)品經(jīng)理要對這些核心的關(guān)鍵業(yè)務(wù)需求進(jìn)行定義,技術(shù)就可以有導(dǎo)向性的進(jìn)行框架設(shè)計(jì)和技術(shù)調(diào)研,而且在描述需求的時(shí)候要回歸場景,場景描述的越詳細(xì),越周全,技術(shù)才會找到最適合的方案去解決。

例如在電商平臺中,由于不同的人群,不同的行業(yè)關(guān)注的重心截然不同;產(chǎn)品經(jīng)理要結(jié)合實(shí)際場景提出“千人千面”的需求,即針對不同人有不同的排序模型,因?yàn)閭€(gè)性化的特征在不同場景中的權(quán)重是不同的。

產(chǎn)品提出了這樣的需求,技術(shù)就會去找解決方案,比如可以通過向量化召回泛化能力、排序特征、排序模型精準(zhǔn)度等方面進(jìn)行深度學(xué)習(xí)的優(yōu)化和改良,并通過多場景的聯(lián)合優(yōu)化最終實(shí)現(xiàn)產(chǎn)品設(shè)計(jì)的目標(biāo)。

其實(shí),無論技術(shù)經(jīng)理還是產(chǎn)品經(jīng)理如果都可以站在需求本質(zhì)以及行業(yè)視角看待問題,無論以任何手段和方式解決問題都會實(shí)現(xiàn)協(xié)同最終幫助產(chǎn)品走向成功的。

二、算法實(shí)現(xiàn)的工程化

需求定義清楚了,接下來就需要算法工程師發(fā)揮才智了,但是通常算法能力的發(fā)揮需要強(qiáng)大的計(jì)算能力和底層系統(tǒng)架構(gòu)的支撐,這涉及到了軟硬件的協(xié)同并進(jìn)。

公司的產(chǎn)品總監(jiān)有些時(shí)候也要對搭建類似的架構(gòu)成本負(fù)責(zé),至少要對數(shù)量級和搭建成本有理解,因?yàn)橥晟频膶?shí)時(shí)計(jì)算平臺、機(jī)器學(xué)習(xí)平臺通常需要?jiǎng)虞m千萬的GPU引擎投入,而且為了更快速的驗(yàn)證算法以及做模型訓(xùn)練,還需要構(gòu)建深度學(xué)習(xí)訓(xùn)練平臺,為了實(shí)現(xiàn)端到端的日志治理、特征提取、模型訓(xùn)練和自動(dòng)化服務(wù)部署等流程。

產(chǎn)品人員要對以上流程至少有概念上的認(rèn)知,這些流程也是工程化實(shí)踐的關(guān)鍵環(huán)節(jié),要對人員投入、部署周期、以及關(guān)鍵節(jié)點(diǎn)的核心價(jià)值有深入的理解和預(yù)判,否則沒法跟算法團(tuán)隊(duì)達(dá)成一致并深入溝通——而這些投入都是需要精確的計(jì)算ROI的,例如采取GPU和CPU異構(gòu)計(jì)算就是在某種程度上節(jié)省了公司的成本達(dá)到效率最高化。

以上說的這些工程化流程都是隨著公司業(yè)務(wù)的不斷擴(kuò)大以及對算法需求的提升循序漸進(jìn)的,而算法需求牽引著公司系統(tǒng)架構(gòu)的不斷升級。

例如從一開始的離線模型到在線模型再到深度學(xué)習(xí)模型,最終實(shí)現(xiàn)在線深度學(xué)習(xí)過程,都是伴隨著成本投入逐步提升的,產(chǎn)品經(jīng)理要判斷不同時(shí)期的產(chǎn)品需求,而不是技術(shù)越先進(jìn)越好。

三、量化及衡量標(biāo)準(zhǔn)的工程化

產(chǎn)品經(jīng)理要通過量化定義以及衡量尺度的把控,實(shí)現(xiàn)聯(lián)合收益最大化,而不是此消彼長。

在工程實(shí)踐中經(jīng)常遇到某種場景,即通過某一個(gè)指標(biāo)召回率的提升就判定某個(gè)算法模型的成功與否,但同時(shí)因?yàn)槿狈θ只目紤],形成了拆東墻補(bǔ)西墻的局面。

現(xiàn)實(shí)的AI工程場景中類似的局面還有很多,即由于缺乏協(xié)同量化衡量標(biāo)準(zhǔn),算法對于產(chǎn)品的整體目標(biāo)來說并沒有實(shí)質(zhì)性的改變卻同時(shí)提升了成本投入,那么這樣的結(jié)果就是需要產(chǎn)品經(jīng)理來負(fù)責(zé)的;所以在產(chǎn)品定義階段、算法測試、校驗(yàn)階段,就需要投入精力從多維度量化衡量標(biāo)準(zhǔn)。

只有多維度衡量標(biāo)準(zhǔn)的提出,才會推動(dòng)算法團(tuán)隊(duì)進(jìn)行改良。

例如在互聯(lián)網(wǎng)廣告、電商以及競技游戲AI的領(lǐng)域中必須通過多智能體的強(qiáng)化學(xué)習(xí)才能實(shí)現(xiàn)雙向連通并達(dá)到效果最優(yōu)。

對于多智體協(xié)同感興趣的可以通過理解Lotka-Volterra模型作為切入點(diǎn)進(jìn)一步學(xué)習(xí)。

四、系列總結(jié)

整個(gè)人工智能產(chǎn)品經(jīng)理系列圍繞著AI PM的思維模式、知識體系、如何使用數(shù)據(jù)、日常工作流程、常見算法理解和應(yīng)用、以及需求的洞察和工程化思維這些內(nèi)容,將AI PM的基本素質(zhì)和“知識圖譜”描繪出來。

該系列中一定有很多我自己主觀的認(rèn)知,并不適用于每個(gè)人和每家公司——因?yàn)槲腋鼜?qiáng)調(diào)的不是方法而是理念和思想,產(chǎn)品經(jīng)理如果淪為公司的執(zhí)行就真的很難進(jìn)步,無論產(chǎn)品總監(jiān)還是產(chǎn)品經(jīng)理都要有自己的打法和套路才能在不同的商業(yè)場景中得心應(yīng)手。

另外,所有這些思想、體系、以及商業(yè)目標(biāo)的貫徹執(zhí)行都是依靠產(chǎn)品人員和技術(shù)人員充分的溝通和戰(zhàn)略上達(dá)成一致。只有這樣,算法工程師才會主動(dòng)的幫助你提供更多算法上的創(chuàng)新,架構(gòu)師會幫助你不斷優(yōu)化架構(gòu)以實(shí)現(xiàn)技術(shù)效果和成本的最佳平衡,最終實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新、算法驅(qū)動(dòng)創(chuàng)新的動(dòng)態(tài)協(xié)同。

最后,我希望每個(gè)關(guān)注人工智能的產(chǎn)品人都能找到自己,提升自己。

 

作者:特里,頭條號:人工智能產(chǎn)品設(shè)計(jì)。畢業(yè)于University of Melbourne,人工智能領(lǐng)域產(chǎn)品經(jīng)理,專注于AI產(chǎn)品設(shè)計(jì)、大數(shù)據(jù)分析、AI技術(shù)商用化研究和實(shí)踐。

本文由 @特里 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash ,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 那請問作者,要成為AI產(chǎn)品經(jīng)理,有什么AI方面的教程可以推薦一下呢?

    來自廣東 回復(fù)
  2. 學(xué)習(xí)了

    來自北京 回復(fù)