藏在實習生招聘里的“行業公式”:AI如何解決“中國式問題”

1 評論 1936 瀏覽 14 收藏 17 分鐘

在AI距離應用較遠、成本相對模糊的條件下,理解這樣一個公式或者可以成為企業探索AI的支點:你的產業到AI之間,是否有數據、算法、平臺這樣一個三角形產業關系。而它們間的產業合作能力又是否能被企業接受。

我們經常說,今天人工智能的核心矛盾,是打開新聞發現“wow!AI好厲害”和回到工作中悲嘆“人工智能在哪里……”之間的矛盾。

對于中國千百萬具體行業來說,今天人工智能還是朦朦朧朧、似是而非的一件事。找一下本行業和AI相關的動向,一般我們會發現三樣東西:

  1. 歐美某AI公司做了一個本行業應用。奈何遠在天邊,也不怎么符合國情。
  2. 某論文里提出了AI新技術。可是等到應用,也不知道自己退休了沒有……
  3. ?某創業公司的PPT里有相關技術。一般這種比較傲嬌,遲遲不想從PPT里走下來……

綜合起來看,今天在面對AI時,中國市場上各行業的普遍困惑是:AI聽起來很美,看上去很遠,大家又不敢貿然當第一個吃螃蟹的人。心動和行動之間,缺少一個靈光一閃的可行性方案。

說得更直白點,傳統行業和各個企業,缺乏的是一套能夠復制、符合實際需求的解決問題思路。最好有個公式,讓各個行業可以一鍵粘貼,得到快速并有價值的AI方案。

今天讓我們來研究一個真實案例,試著一起來找到一個這樣的“公式”。當然,案例本身也頗具價值,因為它發生在一個任何企業都可能邂逅的領域:在線招聘。

前不久,腦極體采訪了云腦科技(沒錯,我們都是腦字輩的),作為一家跨越中美兩國的人工智能行業平臺公司,云腦科技的商業模式就是利用深度學習產品為傳統行業服務。在他們與百度、實習僧共同推進的智能招聘項目中,AI與中國式互聯網問題的膠著碰撞可謂暴露無遺。

一、絕不小的“小問題”:中國式實習生招聘

讓我們先來了解下,人力資源領域的“中國式問題”。

在歐美國家,人力的昂貴、人才流通的需求頻率相對較緩,加上監管的嚴謹性,都讓人力資源事業處在相對較“穩”的曲線中。而AI進入人力資源領域,也更多是從智能獵頭、背景審核等輔助功能的AI化開始。

但在中國,互聯網招聘的人才虹吸效應以及巨大的人力缺口,導致今天的人力資源必須實現快進快出。如果不能高效準確找到人才,企業甚至很可能被產能拖垮。這就讓“快”成了中國HR的第一準則。

但僅僅快還不夠,HR同時還要準。如果面試錄取率不佳,企業會直接質疑HR的職業能力。這導致很多HR同學常年在業務部門需求和大量雷同的簡歷中無盡掙扎。而在招聘實習生時,類似問題會尤其凸顯。

因為實習生招聘中很可能會遇到這樣幾個尷尬:

  1. 簡歷特別多,看完就已經暈了。
  2. 由于投遞者都是在校學生,很難明確職業意向,簡歷與職位需求經常存在偏差。
  3. 實習生簡歷內容簡單雷同,HR難以判斷取舍。

這些因素的堆疊,導致實習生招聘很可能在企業中變成缺乏效率、高流失率,并且沒什么科學依據的工作。而在互聯網時代,企業招聘實習生又大量依托線上平臺。特有痛點+線上存量數據+AI,會不會有什么意外驚喜呢?

二、百度+云腦:一個人力資源問題的AI解決方案

采訪中我們了解到,國內著名實習生招聘平臺“實習僧”與云腦科技的深度合作中,共同完成了AI人才庫:利用實習僧平臺上留存的招聘數據,云腦訓練匹配模型,以此實現以AI進行初步簡歷篩選。

顯然,這個AI解決方案旨在解決HR實習招聘的真實痛點,實習僧平臺沉積的幾十萬職位描述和幾百萬簡歷數據也為深度學習提供了優厚的條件。

那么接下來的問題是:到底如何讓美好的技術想象變為現實。

為了讓AI輔助HR,更好地完成實習生簡歷初篩問題,云腦使用實習生招聘環節中的三個重要數據:

  • HR發布的職位描述文本;
  • HR瀏覽、標記和發出面試邀約的簡歷文本數據;
  • 學生們的簡歷文本、瀏覽記錄與選擇投遞的公司與職位描述。

為了統籌這些文本數據和行為數據,云腦結合門禁卷積神經網絡(Gated CNN)和注意力機制,訓練適用于招聘領域的門禁卷積神經網絡(Gated Query Model, GQM),在保證文本匹配準確性的同時,還能提供匹配的細節。

最終實現了HR在平臺發布職位描述后,模型自動檢索匹配庫內海量簡歷,實現分鐘級的匹配,并按照匹配度倒序推薦給HR。

在這里我們當然沒有必要解釋算法背后的函數關系,但有幾點技術邏輯卻是值得我們注意的。因為在今天中國的AI與行業結合中,這些問題會反復經常出現。

1.需要適應中文的獨特性

我們了解到,在針對中國互聯網招聘數據進行簡歷與需求的精準匹配時,云腦面對的首要問題是解決中文自然語言處理場景中,中文分詞、詞性標注、句法分析等缺乏技術借鑒鏡像的問題。

在降低了文本向量維度的同時,也需要保留文本語義信息,兼顧算法的處理效率。

2.克服有效數據困境

互聯網招聘平臺數據僅僅能有效記錄,HR瀏覽了哪些實習生簡歷、發出了哪些面試邀約是比較容易記錄的。但在這之后,現場面試反饋記錄、錄用情況,甚至錄用之后的實習效果,就都是互聯網平臺難以記錄的了。

為了解決實習僧平臺數據不閉環的問題,云腦先根據場景定制化了一個簡單可快速上線的模型,搜集HR針對每個崗位描述發出的面試邀約,用來搜集可用于深度學習的數據樣本。

當真實的招聘需求、獲得面試邀約者基本信息及雙方的行為數據量足夠之后,再進行第二階段的深度模型的迭代,通過文本分析、數據挖掘和行為學習,自動捕捉企業用人偏好,防止錯失潛在的優秀簡歷和候選人。

3.解決開發框架問題

與很多主流AI創業公司不同,云腦在開發智能招聘算法時,沒有采用歐美主流開發框架,比如TensorFlow、Caffe等等,而是用到了百度的PaddlePaddle。

采訪中聊到這個問題時,云腦方面表示:根據他們的測試和實踐,TensorFlow等開發框架雖然社區資源會更齊備,但由于這些框架不一定能滿足商業應用場景中對速度與效率的追求。

與歐美框架相比,PaddlePaddle從一開始就為了解決并行計算問題,其利用GPU的并行度更強。也就是說,在同等數據相同網絡結構的條件下,PaddlePaddle展現出了更快的速度強大效率。

根據我們的觀察,這也不是個孤立問題。越來越多的AI公司投入產業實戰當中時,都會發現訓練框架對大規模應用的友好程度,直接決定了企業的商業化進度。這種情況下,性能更好,更支持大規模應用的框架顯然占據優勢。

此外,基于PaddlePaddle的生態合作,也為AI企業開發基于中文互聯網數據的算法提供了支撐。比如PaddlePaddle會提供更多專項中文數據集,并且開放了近20種工業級模型,比如語音識別、文本分類、圖像分類、機器翻譯、物體識別等,這些能力適合中國國情和中國企業融匯進入AI世界。

從基礎訓練到分布架構徹底開源,由于PaddlePaddle今天在中國AI產業中的獨特性和生態價值,其也被視為“最適合中國國情的深度學習框架”。

于是我們看到,在云腦的算法模型和百度PaddlePaddle的無間合作下,智能招聘實習生這時似乎真的看到了曙光。

三、據說,效果是企業每招一個人,能省160塊

招聘平臺加算法的效果如何評價,最終當然要數據說了算。采訪者我們了解到了一些有意思的數據,或者可以說明這個商業智能應用的直觀價值。

1. 企業招聘速度提升,更主要的是,省錢了……

對算法加入前后的邀約率分析,智能招聘算法上線之后,將簡歷初篩這個高時間成本的找簡歷、看簡歷和篩簡歷過程,優化為HR根據AI推薦簡歷,發出面試邀約一步,面試邀約率實現了5倍提升,推薦的成功率比之前提高了50%,大大提升了HR的工作效率。

企業更快找到人才,招聘速率被提升后,企業每招到一個人的成本約可降低160塊人民幣。算法已服務了3萬余個崗位的精準匹配,累積優勢十分可觀。

2. 優化招聘需求,提升HR精度

在效率提高、成本下降之外,AI招聘帶給企業的新想象力,是企業可以更好地招到原先容易錯失的人才。

以教育機構好未來當前正在招聘機器學習實習生為例,在新興的垂直技術領域,比如機器學習、區塊鏈等,HR通常面臨著不知道要招聘什么人才、也不知道去哪里找到他們等問題。

使用了AI(H)后,可根據企業所在的行業、職業描述所在的專業領域、借鑒其他企業的招聘案例等,自動匹配到在垂直領域有相似科研經驗、項目實踐經驗和獲得類似面試邀約的候選人,有效協助HR更好的在新興的技術領域搜尋人才。

這對于企業發展的助力,或許是難以用量化金錢來衡量的。

3. 提升深度模型的可解釋性

深度學習模型本身具有不可解釋性,但在力求公平公正的招聘場景下,企業仍舊存在一些使用疑慮。云腦針對這類的場景需求,在智能招聘算法中,改進了模型設計,在保留了模型表達能力的基礎上,解釋需求與簡歷間的文本特征匹配關系。

企業和應聘者在使用精準匹配的過程中,不僅能夠幫助HR找到最符合的應聘者、幫助應聘者找到最符合的HR,同時還能夠給予雙方一份詳細的建議理由。

四、從個案到“公式”:AI如何解決互聯網時代的問題

通過以上云腦、百度、實習僧,加上若干應用企業參與的整個案例,我們可以看出AI在招聘這件事上也是可以大展拳腳的。

但更有價值的信息,是我們可以從整個合作關系中發現,解決某個傳統行業或者企業通識問題,AI到底如何來開啟第一步。

在智能招聘案例中,首要解決的是數據問題。缺失了可進行深度學習訓練的有特征數據,那么一切都白搭。

這個案例中,線上招聘平臺實習僧成為了數據輸出者。在互聯網時代,很多數據都留存在平臺上,這給更多行業以想象空間。但如果想要深入到企業內部流程當中,本行業、本企業的線下數據也是重中之重。而如何確保數據安全性,以及組成企業、行業、平臺間的數據對接,將是接下來AI產業發展中的任務。

接下來,是云腦這樣的AI公司,結合實習僧的數據提出了一系列垂直于行業的解決方案。

這其中有大量中文,或者中國產業格局里必須要克服的問題,基本功不過硬肯定不行。

此外,百度提供的PaddlePaddle也成為了AI能夠商業化工作的前提。

適應中國企業需求,善于支持AI并行計算與大規模部署的AI平臺,顯然不是創業公司能夠負擔得起的,而海外平臺又不接地氣。因此上,百度這樣平臺級別的輸出能力就會成為主要解決方案。

而平臺的價值,也不僅僅是能力輸出,而是綜合資本、流量、影響力、技術解決能力的示范價值與生態化賦能產業基礎。比如百度就基于PaddlePaddle及其開放能力建立了PaddlePaddle訓練營,為開發者和企業提供轉型和應用AI的平臺,既有針對開發者的系列課程培訓、線上線下活動,也有面向企業的AI市場。

假如百度本身平臺的品牌扶持與價值培養能力,對于具體行業問題的引導是多方面的。

或許到此我們可以看出:算法創新、行業數據、平臺三者構成了一個產業共生體,通過三方面不能或缺的能力,集合式為第四方解決了問題。

在AI距離應用較遠、成本相對模糊的條件下,理解這樣一個公式或者可以成為企業探索AI的支點:你的產業到AI之間,是否有數據、算法、平臺這樣一個三角形產業關系。而它們間的產業合作能力又是否能被企業接受。

在更多的人才和更普及的AI能力之前,運用恰當的產業合作來實現AI,幾乎是唯一的正路。

面對十分復雜的中國式問題,或許我們要做的,是發展出一套中國式AI,并以最快速度把它投向千百萬行業。

寒來暑往后,才是秋收冬藏。

 

本文由 @腦極體 原創發布于人人都是產品經理。未經許可,禁止轉載

題圖來自網絡

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!