深度報告|AI新職位“人工智能訓(xùn)練師”
1-3歲的互聯(lián)網(wǎng)人是人工智能訓(xùn)練師的主要來源,而人工智能產(chǎn)品經(jīng)理將會是最合適的上升職位。
研究背景
有人說,“人工智能訓(xùn)練師”是AI給人類帶來的第一個非技術(shù)類“新職位”,這也許能讓大家對AI多一些客觀認(rèn)知、甚至是好感;不過這個新職位,AI領(lǐng)域從業(yè)者的認(rèn)知度還不高——
- AI公司為什么要設(shè)立這樣一個職位
- 職責(zé)邊界是什么
- 什么樣的人適合
- 職位發(fā)展前景如何
等等問題,都還是業(yè)內(nèi)空白,為此我將在正文中為大家一一揭曉。
核心結(jié)論
- 人工智能訓(xùn)練師的定義:通過分析產(chǎn)品需求和相關(guān)數(shù)據(jù),完成數(shù)據(jù)標(biāo)注規(guī)則的制定,最終實現(xiàn)“提高數(shù)據(jù)標(biāo)注工作的質(zhì)量和效率”以及“積累細(xì)分領(lǐng)域通用數(shù)據(jù)”的價值。
- 人工智能訓(xùn)練師的行業(yè)認(rèn)知度:開始得到杭州、北京等城市2年以上AI公司的重視,考慮到人工智能訓(xùn)練師的人才缺口5年后將增長20倍以上,該職位將會愈加受到各家AI公司的重視。
- 人工智能訓(xùn)練師的職業(yè)規(guī)劃:1~3歲互聯(lián)網(wǎng)產(chǎn)品經(jīng)理最有可能成為人工智能訓(xùn)練師的主要來源職位;而AI產(chǎn)品經(jīng)理將成為最合適的上升職位。
目錄
- 人工智能訓(xùn)練師的產(chǎn)生背景
- 人工智能訓(xùn)練師是什么
- 人工智能訓(xùn)練師的人才缺口
- 人工智能訓(xùn)練師的職業(yè)規(guī)劃
- 結(jié)語
一、人工智能訓(xùn)練師的產(chǎn)生背景
一般而言,AI公司從客戶(用戶)那里獲取到的原始數(shù)據(jù)無法直接用于模型訓(xùn)練,在“人工智能訓(xùn)練師”出現(xiàn)以前,是由AI產(chǎn)品經(jīng)理先用相關(guān)工具簡單處理,再交給數(shù)據(jù)標(biāo)注人員進行標(biāo)注加工,但因為標(biāo)注人員對數(shù)據(jù)的理解和標(biāo)注質(zhì)量差異很大,導(dǎo)致整體標(biāo)注工作的效率和效果都不夠理想。
同時,AI公司在其細(xì)分領(lǐng)域內(nèi)積累了大量數(shù)據(jù),這些數(shù)據(jù)往往在使用一次后就不再產(chǎn)生更多價值,隨之帶來了第二個問題,數(shù)據(jù)無法沉淀和復(fù)用。
基于這兩個問題,“人工智能訓(xùn)練師”應(yīng)運而生。
注:“人工智能訓(xùn)練師”這個職位,據(jù)說最早是由BAT某部門在2年前創(chuàng)造的。
二、人工智能訓(xùn)練師是什么?
1. 定義
人工智能訓(xùn)練師,是通過分析產(chǎn)品需求和相關(guān)數(shù)據(jù),完成數(shù)據(jù)標(biāo)注規(guī)則的制定,最終實現(xiàn)“提高數(shù)據(jù)標(biāo)注工作的質(zhì)量和效率”以及“積累細(xì)分領(lǐng)域通用數(shù)據(jù)”的價值,從工作流和工作難度等角度看,它介于數(shù)據(jù)標(biāo)注和AI產(chǎn)品經(jīng)理之間。
2. 工作職責(zé)
人工智能訓(xùn)練師的工作職責(zé),主要有以下三點:
- 提供數(shù)據(jù)標(biāo)注規(guī)則:通過算法聚類、標(biāo)注分析等方式,從數(shù)據(jù)中提取行業(yè)特征場景,并結(jié)合行業(yè)知識,提供表達精準(zhǔn)、邏輯清晰的數(shù)據(jù)標(biāo)注規(guī)則,最終確保數(shù)據(jù)訓(xùn)練效果能滿足產(chǎn)品的需求;
- 數(shù)據(jù)驗收及管理:參與模型搭建和數(shù)據(jù)驗收,并負(fù)責(zé)核心指標(biāo)和數(shù)據(jù)的日常跟蹤維護;
- 積累領(lǐng)域通用數(shù)據(jù):根據(jù)細(xì)分領(lǐng)域的數(shù)據(jù)應(yīng)用要求,從已有數(shù)據(jù)中挑選符合要求的通用數(shù)據(jù)(適用于同領(lǐng)域內(nèi)不同客戶/用戶),形成數(shù)據(jù)的沉淀和積累。
注:在不同公司,人工智能訓(xùn)練師的職責(zé)具有一定差異性,比如有的偏重前期的數(shù)據(jù)挖掘和模型訓(xùn)練,有的偏重后期的產(chǎn)品運營和產(chǎn)品體驗。
3. 職位辨析
(一):人工智能訓(xùn)練師和數(shù)據(jù)標(biāo)注、AI產(chǎn)品經(jīng)理的異同
1)人工智能訓(xùn)練師和AI產(chǎn)品經(jīng)理的異同
人工智能訓(xùn)練師需要和AI產(chǎn)品經(jīng)理討論需求,進而制定數(shù)據(jù)標(biāo)注規(guī)則,并提出產(chǎn)品體驗優(yōu)化建議。
2)人工智能訓(xùn)練師和數(shù)據(jù)標(biāo)注的異同
人工智能訓(xùn)練師需要和數(shù)據(jù)標(biāo)注人員緊密協(xié)作,把控好整個流程的輸入規(guī)則和輸出結(jié)果,最終輸出標(biāo)注準(zhǔn)確的數(shù)據(jù)(供模型訓(xùn)練)。
3)人工智能訓(xùn)練師的工作流程圖:
下圖,展示了人工智能訓(xùn)練師和數(shù)據(jù)標(biāo)注、AI產(chǎn)品經(jīng)理協(xié)作的工作流及其每個節(jié)點的交付物。不難發(fā)現(xiàn),人工智能訓(xùn)練師在數(shù)據(jù)標(biāo)注和AI產(chǎn)品經(jīng)理之間,起到橋梁的作用。
注:人工智能訓(xùn)練師的工作交付物“數(shù)據(jù)標(biāo)注規(guī)則模板”,可見完整版深度報告(下載方式見文末)。
(二):人工智能訓(xùn)練師和初級互聯(lián)網(wǎng)數(shù)據(jù)產(chǎn)品經(jīng)理的異同
1)兩者工作職責(zé)的主要區(qū)別在于“積累細(xì)分領(lǐng)域通用數(shù)據(jù)”,這項工作將為公司創(chuàng)造新的價值,比如:
- 大大減少后續(xù)標(biāo)注人員的工作量,提升業(yè)務(wù)的接入速度和效率。
- 逐步建立細(xì)分領(lǐng)域的行業(yè)壁壘。
總之,由于一般的數(shù)據(jù)不能全領(lǐng)域通用,所以不同應(yīng)用場景下,細(xì)分領(lǐng)域通用數(shù)據(jù)少的問題,將成為整個行業(yè)的痛點和機會。
2)在AI工作場合,原本由初級互聯(lián)網(wǎng)數(shù)據(jù)PM完成的“貢獻數(shù)據(jù)采集標(biāo)準(zhǔn)、打通數(shù)據(jù)資源、數(shù)據(jù)應(yīng)用的推廣”等工作,并沒有交給人工智能訓(xùn)練師,而是由更適合的AI產(chǎn)品經(jīng)理完成,原因在于這部分工作更偏重前端的需求和推廣(AI產(chǎn)品經(jīng)理更熟悉和擅長產(chǎn)品體驗及流程)。
4. 能力模型
基于人工智能訓(xùn)練師的工作職責(zé),需要具備哪些能力呢?通過調(diào)研分析,我們總結(jié)出了如下的能力模型:
數(shù)據(jù)能力:了解科學(xué)的數(shù)據(jù)獲取方法論,能運用數(shù)據(jù)處理工具(如 Excel等),邏輯思維強。
行業(yè)背景:熟悉公司行業(yè)領(lǐng)域知識,特別是語言或圖像方面數(shù)據(jù)的特點。
分析能力:基于產(chǎn)品的數(shù)據(jù)需求,及時發(fā)現(xiàn)、提煉問題特征,產(chǎn)出優(yōu)化方案和建議。
溝通能力:具備較強與不同崗位同事同頻交流的能力,能通俗易懂的闡釋專業(yè)術(shù)語信息。
AI技術(shù)理解力:能夠厘清基本的AI概念,并了解其技術(shù)邊界(能做什么和不能做什么)。
AI行業(yè)理解力:具備AI行業(yè)知識(如了解行業(yè)術(shù)語)或相關(guān)產(chǎn)品運營經(jīng)驗,在此基礎(chǔ)上能夠預(yù)判行業(yè)趨勢、深挖場景痛點、設(shè)計AI方案。
三、人工智能訓(xùn)練師的人才缺口
1. 當(dāng)前人才缺口
暫未形成明顯的人才缺口,因為一方面,大部分公司都是近期才開始設(shè)立這個職位,人才需求量不多(不超過三位數(shù));另一方面,目前大多數(shù)人才需求,通過公司內(nèi)部運營人員轉(zhuǎn)崗和外部招聘就能滿足。
1)人工智能訓(xùn)練師的職位畫像
- 工作經(jīng)驗:大公司的要求明顯高于創(chuàng)業(yè)公司,一般在三年以上
- 工資范圍:主要集中在8k以下
2)人工智能訓(xùn)練師的公司畫像
- 發(fā)展較為成熟的智能客服類公司,對于人工智能訓(xùn)練師的需求量明顯領(lǐng)先于其它行業(yè)。
- 出人意料的,杭州AI公司表現(xiàn)出了更高的敏銳度(有4家公司,和北京并列第一),背后原因可能是政府的大力推動——根據(jù)2017年11月杭州人社局發(fā)布的相關(guān)政策,人工智能訓(xùn)練師不僅被納入杭州市專項能力考核項目,而且獲得高級專項能力認(rèn)證的人工智能訓(xùn)練師將有機會申請公租房及杭州落戶加分等政策福利。(原文鏈接:《杭州人社局:人工智能訓(xùn)練師將有機會享受落戶加分等福利》)
- 成立2年以上的公司(73%)更需要人工智能訓(xùn)練師,一般情況早期創(chuàng)業(yè)公司側(cè)重搭建產(chǎn)品技術(shù)框架、驗證解決方案和商業(yè)模式,沒過多精力放在“提升效率”或“積累細(xì)分領(lǐng)域通用數(shù)據(jù)”上,所以“人工智能訓(xùn)練師”對于需控制團隊規(guī)模、降低管理成本和風(fēng)險的早期創(chuàng)業(yè)公司而言,非必需單獨拆分的職位。
- 已上市和A輪的公司,相對而言對人工智能訓(xùn)練師的需求量更大。
- 另外需要說明的是,按道理CV(計算機視覺)領(lǐng)域也有數(shù)據(jù)標(biāo)注工作,但我們搜索了10多家(計算機視覺)領(lǐng)域公司的招聘頁面,暫時都沒有發(fā)現(xiàn)人工智能訓(xùn)練師的需求,這可能是因為相對“標(biāo)注語料數(shù)據(jù)”,“標(biāo)注圖像數(shù)據(jù)”更簡單,主要找外包公司即可完成。
注:以上結(jié)論,來自對15家公司職位描述信息的分析匯總。
2. 未來人才缺口
1)未來5年人才缺口將增長20倍以上
- 在即將到來的2018年,人工智能訓(xùn)練師的人才缺口預(yù)計將達到近1000人;
- 兩年后的2020年,伴隨著AI行業(yè)的高速成長,人才缺口也將隨之猛增至2018年的四倍,達到近4000人;
- 按照這個發(fā)展趨勢,到2022年人才缺口將突破2萬人,相當(dāng)于職位自然流入人才數(shù)量的四倍左右,人才缺口越來越大,需要引起行業(yè)的足夠重視。
2)職位畫像和公司畫像在未來可能發(fā)生的變化
- CV(計算機視覺)領(lǐng)域公司可能也會逐步建立自己的人工智能訓(xùn)練師團隊,因為隨著CV領(lǐng)域商業(yè)化越來越成熟,各家公司對于數(shù)據(jù)標(biāo)注的質(zhì)量和效率要求會越來越高,甚至數(shù)據(jù)需求的CV領(lǐng)域可能會越來越細(xì)分,進而導(dǎo)致外包數(shù)據(jù)標(biāo)注公司可能滿足不了。
- 成立年限小于2年的AI公司,可能會更加重視招募人工智能訓(xùn)練師,因為一方面,這個職位的行業(yè)認(rèn)知度在逐漸提升,另一方面,更重要的是,各家公司會越來越意識到,在業(yè)務(wù)初期,細(xì)分領(lǐng)域的某些數(shù)據(jù)就能提升用戶價值,并同時建立初步的行業(yè)壁壘。
3. 結(jié)論:未來,各家AI公司會愈加重視“人工智能訓(xùn)練師”這個職位
隨著大部分AI創(chuàng)業(yè)公司逐漸完成產(chǎn)品驗證,所服務(wù)的行業(yè)領(lǐng)域越來越多,市場將進入快速增長期,構(gòu)建數(shù)據(jù)方面的行業(yè)壁壘(積累領(lǐng)域數(shù)據(jù)、提升數(shù)據(jù)標(biāo)注效率等),將逐漸成為一種趨勢,而“人工智能訓(xùn)練師”正好能滿足這些需求,在未來幾年會得到各家公司更多的重視與關(guān)注。
四、人工智能訓(xùn)練師的職業(yè)規(guī)劃
1. 人工智能訓(xùn)練師的來源職位,主要是1~3歲互聯(lián)網(wǎng)產(chǎn)品經(jīng)理
從行業(yè)現(xiàn)狀看,無論是外部招聘還是內(nèi)部轉(zhuǎn)崗,絕大部分人工智能訓(xùn)練師的應(yīng)聘者都不具備AI相關(guān)的專業(yè)或行業(yè)背景,因此在人才選拔時,公司會更看重數(shù)據(jù)和產(chǎn)品相關(guān)經(jīng)驗,人才來源主要有以下三類:
- 內(nèi)部轉(zhuǎn)崗:從客服等和數(shù)據(jù)有關(guān)的運營崗位中平級轉(zhuǎn)崗;
- 內(nèi)部轉(zhuǎn)崗:從數(shù)據(jù)標(biāo)注員中擇優(yōu)提拔;
- 外部招聘:從有1年以上互聯(lián)網(wǎng)產(chǎn)品經(jīng)驗的產(chǎn)品經(jīng)理中招聘篩選。
而這3個來源之中,目前1~3歲互聯(lián)網(wǎng)產(chǎn)品經(jīng)理就有4~5萬(并且由于互聯(lián)網(wǎng)產(chǎn)品經(jīng)理已經(jīng)供大于需,他們正面臨找工作的壓力);另一方面,一般1歲以上的互聯(lián)網(wǎng)PM,能力也已經(jīng)可以勝任人工智能訓(xùn)練師了。
綜上所述,1~3歲互聯(lián)網(wǎng)產(chǎn)品經(jīng)理將最有可能成為人工智能訓(xùn)練師的主要人才來源。
注:1~3歲互聯(lián)網(wǎng)產(chǎn)品經(jīng)理的數(shù)量,由四個基礎(chǔ)數(shù)據(jù)估算得出(2016年底互聯(lián)網(wǎng)從業(yè)者人數(shù)、2016年底互聯(lián)網(wǎng)從業(yè)者人數(shù)同比增長率、產(chǎn)品經(jīng)理從業(yè)者人數(shù)占比、3年以下工作經(jīng)驗從業(yè)者人數(shù)占比),數(shù)據(jù)取自拉勾網(wǎng)《2016年互聯(lián)網(wǎng)職場生態(tài)白皮書》和經(jīng)緯&獵聘《互聯(lián)網(wǎng)人才 360° 印象報告》。
2. 人工智能訓(xùn)練師的上升職位,主要是AI產(chǎn)品經(jīng)理
- 職位創(chuàng)造價值更大:AI產(chǎn)品經(jīng)理更關(guān)注整體的產(chǎn)品體驗和商業(yè)價值,對于公司能產(chǎn)出更大的價值。;
- 職位能力要求更高:在數(shù)據(jù)分析能力、相關(guān)行業(yè)經(jīng)驗基礎(chǔ)上,還需要具備AI技術(shù)理解力、AI人機交互設(shè)計、AI行業(yè)理解力等更高階的能力素質(zhì)。
綜合來看,從人工智能訓(xùn)練師轉(zhuǎn)型AI產(chǎn)品經(jīng)理大約需要6~12個月的時間,出色的工作表現(xiàn)和抓住時機的決心將在轉(zhuǎn)型過程中將起到?jīng)Q定性作用。
附:一個真實轉(zhuǎn)型案例
SY同學(xué),從數(shù)據(jù)標(biāo)注轉(zhuǎn)型到AI產(chǎn)品經(jīng)理,花費了6個月,這應(yīng)該是最快的速度了,因為她的每一步都是能力剛剛ready時,公司就有內(nèi)部轉(zhuǎn)崗或借調(diào)使用的headcount機會。
- 剛?cè)肼殻哂谐吖ぷ髻|(zhì)量與效率,明顯高出其他同期入職同事
- 1個月后,指導(dǎo)其他兼職標(biāo)注人員
- 3個月后 ,公司內(nèi)其他部門有AI產(chǎn)品助理空缺,正好內(nèi)部借調(diào)(從產(chǎn)品助理工作開始)
- 6個月后,正式轉(zhuǎn)型AI產(chǎn)品經(jīng)理
五、結(jié)語
1. 關(guān)于我們
1)個人介紹:朱明德,3年互聯(lián)網(wǎng)電商PM經(jīng)驗,正轉(zhuǎn)型AI產(chǎn)品經(jīng)理,主要通過學(xué)習(xí)飯團“AI產(chǎn)品經(jīng)理大本營”的AI相關(guān)內(nèi)容,加速成長。
特別說明的是,本人最近正在尋找“人工智能訓(xùn)練師”相關(guān)工作,坐標(biāo)上海(蘇州、杭州亦可),目標(biāo)薪酬10k-15k。如果有AI公司愿意提供面試機會,可填寫下面鏈接:https://www.wjx.top/jq/19154712.aspx?(或掃描下面二維碼),我后續(xù)會和您取得聯(lián)系,謝謝。
2)指導(dǎo)顧問:黃釗hanniman,圖靈機器人-人才戰(zhàn)略官,前騰訊產(chǎn)品經(jīng)理,5年AI實戰(zhàn)經(jīng)驗,8年互聯(lián)網(wǎng)背景,微信公眾號/知乎/在行ID“hanniman”,飯團“AI產(chǎn)品經(jīng)理大本營”,分享人工智能相關(guān)原創(chuàng)干貨,200頁PPT《人工智能產(chǎn)品經(jīng)理的新起點》被業(yè)內(nèi)廣泛好評,下載量1萬+。
本報告得到諸多同行大力支持。
- 特別感謝指導(dǎo)顧問 圖靈機器人@黃釗?老師在寫作和調(diào)研過程中提供的幫助和建議(前后30多天時間里,針對10多個修改版本的文章框架和排版細(xì)節(jié),總計提了300+個建議;并且?guī)椭埩瞬簧倨渌鸄I公司的調(diào)研對象)。
- 感謝四位大力配合的調(diào)研對象:圖靈機器人@鄭殊予、追一科技@劉杰?以及另2位不便署名的同行;
- 還要感謝@Shertin?對報告提出的修改意見。
由于成文時間倉促,報告中難免有疏漏之處,歡迎您提出問題、評論和建議。
2. 核心結(jié)論
1)人工智能訓(xùn)練師的定義:通過分析產(chǎn)品需求和相關(guān)數(shù)據(jù),完成數(shù)據(jù)標(biāo)注規(guī)則的制定,最終實現(xiàn)“提高數(shù)據(jù)標(biāo)注工作的質(zhì)量和效率”以及“積累細(xì)分領(lǐng)域通用數(shù)據(jù)”的價值。
2)人工智能訓(xùn)練師的行業(yè)認(rèn)知度:開始得到杭州、北京等城市2年以上AI公司的重視,考慮到人工智能訓(xùn)練師的人才缺口5年后將增長20倍以上,該職位將會愈加受到各家AI公司的重視。
3)人工智能訓(xùn)練師的職業(yè)規(guī)劃:1~3歲互聯(lián)網(wǎng)產(chǎn)品經(jīng)理最有可能成為人工智能訓(xùn)練師的主要來源職位;而AI產(chǎn)品經(jīng)理將成為最合適的上升職位。
作者:朱明德 ,“AI產(chǎn)品經(jīng)理大本營”成員之一。
本文由人人都是產(chǎn)品經(jīng)理專欄作家?@黃釗?授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash ,基于 CC0 協(xié)議
數(shù)據(jù)標(biāo)注規(guī)則模板呢?不是見文末嘛
模板找到了嗎
對于人工智能訓(xùn)練師的具體崗位內(nèi)容描述過于概念化,沒有進行實際的舉例解釋,讓普通的小白從一開始閱讀就顯得異常的困難。建議運營實際案例進行解說會使行文更友好。謝謝分享
數(shù)據(jù)標(biāo)注規(guī)則模板在哪兒呢
飯團“AI產(chǎn)品經(jīng)理大本營”怎么進?
你好,可以先關(guān)注飯團的服務(wù)號“fantuan-app”,再進入飯團“AI產(chǎn)品經(jīng)理大本營”的主頁http://fantuan.guokr.net/groups/219/ 就可以支付了。(注:千萬不要保存支付二維碼,會有概率性的bug)
準(zhǔn)確度和量的把控很重要,而且相比較產(chǎn)品經(jīng)理的薪資和成就感要低很多。應(yīng)該是大公司可以承擔(dān),小公司傾向于找外包。
最近正在幫阿里巴巴的智能設(shè)計實驗室找 AI 產(chǎn)品經(jīng)理及 AI 運營的人,有意向的可以關(guān)于馬力老師旗下的「知群 X 可能性與大設(shè)計」關(guān)注相關(guān)招聘相關(guān)的資訊。
請問現(xiàn)在還有嗎
現(xiàn)在還有招嗎。
知道 飯團 AI產(chǎn)品經(jīng)理大本營怎么進嗎
工資太低