一文說清AI智能平臺
編輯導語:如今平臺產品已不是新概念,隨著AI技術的成熟,AI平臺產品也越來越多。那么,為什么要做AI平臺?這些AI平臺又有哪些類別呢?讓我們跟著作者,一起去探尋吧。
有一天,小李的領導說:“我們要做AI平臺!”。
雖然平臺產品也不是新概念了,隨著AI技術的成熟,AI平臺產品也越來越多,但光憑做平臺一句話,小李還是犯了難——大大小小的“平臺”很多,究竟我們要做什么樣的AI平臺呢?磨刀不誤砍柴功,小李決定先研究下市面上已有的AI平臺找找靈感。
一、AI平臺產品分類
AI平臺大致可以分為AI開發平臺和AI支撐平臺(名字是小李瞎起的)兩類。
1. AI開發平臺
AI開發平臺面向的是模型開發者,圍繞AI模型/算法的生命周期(數據收集、標注、模型結構設計、模型訓練、模型部署等階段)提供工具。開發平臺產品需要對算法開發流程、算法種類豐富度都有較好的積累,因此大部分平臺類產品是由內功比較深厚的大廠推出的。
(百度BML功能架構)
1)用戶
都叫開發平臺啦,用戶想必應該是開發人員,使用AI開發平臺的研發人員對人工智能的了解程度不盡相同,他們可能是業務應用的開發人員(只需要調用某個模型API),也可能是AI工程師(需要對模型調參數,甚至重新設計網絡結構),但歸根到底AI開發平臺是面向開發人員的B端產品。
2)場景
在需要AI能力支撐的時候,用戶可以使用AI開發平臺提供的不同層級的工具/功能(嵌入級、API級、數據訓練級、模型定制級、算法開發級),實現所需的AI能力。
3)解決問題
AI賦能其他產品。AI平臺作為一個產品,想解決的核心問題是如何便捷的讓其他應用或產品獲得智能化的能力??吹胶芏鄰娬{AI平臺是為了讓AI算法開發更簡單的說法,但歸根到底,如果不是其他產品需要AI模型或者AI能力,自然也不需要算法開發,更就沒有必要有所謂AI開發平臺存在了。
2. AI支撐平臺
AI支撐平臺大多是面向運營人員/業務人員,為某個AI應用提供能夠使之work的配置、管理等“支撐”功能。智能對話平臺就是一種非常典型的AI支撐平臺,因為智能對話應用并非只依賴某個模型就能實現,所以需要根據業務場景進行技能管理、對話設置等工作,智能對話平臺就是這些配置功能的載體。
1)用戶
主要是業務人員或者運營人員,也就是需要對某個應用的具體規則、具體內容進行設置的工作人員。
2)場景
在使用某個智能應用時,用戶需要根據實際業務場景對應用中的某些功能進行配置,才能使應用按照需求運行起來。
3)解決問題
使智能應用按照用戶的期望運行起來。那為什么這些應用需要配置呢?為什么不能固化呢?因為應用的使用場景千差萬別,比如在銀行的智能客服和商場的智能客服,雖然底層的技術途徑一致,但具體客服面對的問題、使用的話術完全不一樣。
從產品角度看,為了使產品的通用性更強,我們往往會設計一個通用的應用框架,然后把高頻且重要的功能做成可配置項以適應更多用戶的需求。也不是說把功能固化下來不行,但那樣的話產品就變成了定制化的項目,成本非常高且無法復用。
(AI開發&支撐平臺對比)
二、AI開發平臺
1. 按AI模型生命周期拆解
知乎看到的一個比較好的平臺產品定義:“平臺產品提供共用性強的工具,連接多端多角色之間的活動或交易”。AI開發平臺產品也一樣,是圍繞著圍繞AI模型/算法的生命周期提供工具,連接不同層次開發者對AI模型設計、訓練、使用等活動。
AI模型的生命周期,大概是這樣的:
AI開發平臺即然是服務于AI模型生命周期的工具,自然也離不開以上這些模塊。所謂平臺,可以只針對某一個環節,比如數據收集+標注環節,或者模型部署環節,也可以針對整個生命周期,這就解釋了為什么同是AI平臺,有大有小。
如果我們從AI模型生命周期角度拆分,那么就有:
1)數據標注平臺
面向數據接入、清洗、標注等和訓練數據有關的工作。數據接入、清洗的工作其實和大數據的關聯性比較強,有些標注平臺甚至是大數據系統的組件。
對于AI標注/數據平臺來說,一個思路是類似百度的EasyData,針對模型訓練數據提供一部分預處理功能(如縮放、翻轉圖像提高模型魯棒性,或者對圖像進行濾波、降噪等增強操作)和智能標注功能(先利用已經訓練好的模型自動標注一把,然后再由人工校準或微調),正是這些功能支撐起了數據標注平臺。
另外一個不錯的思路是更側重“標注”這個動作本身,類似basicFinder,做數據需求方和數據標注商的撮合生意并提供標注工具。
2)模型設計平臺
這個一般不會作為單獨的產品,個人猜測原因主要是模型結構設計門檻高、需求小。從我自己的經驗來看,使用開源框架開發和使用平臺提供的工具效率差別不大。
模型設計的功能大多是作為開發平臺一個模塊,通過可視化拖拉拽、notebook等方式進行模型結構設計。
3)模型訓練平臺
提供模型訓練的算力、環境,這個是AI平臺中比較常見的產品,由于模型訓練對硬件資源的高消耗,通常會租用云計算資源來完成模型訓練,所以很多模型訓練平臺是與云平臺捆綁的,完成包括負載均衡、并行訓練等工作。
4)模型部署平臺
提供把模型從訓練環境部署到推理環境(云端、邊緣端等)的工具。這個功能相對簡單,較少單獨作為一個產品,一般是也是作為開發平臺的一個功能模塊。
一個例外是邊緣/嵌入式環境部署平臺(如百度EasyEdge),由于硬件適配比較繁瑣,所以目前看到百度是做成一個相對獨立的產品的。
5)模型推理平臺
提供各式各樣的模型接口,供用戶直接調用,一般還提供包括模型調用管理、接口管理等功能,這種推理平臺主要是以模型作為核心競爭力的。另一種推理平臺則以算力作為競爭力,類似云平臺,用戶將模型部署在平臺上可獲得彈性擴縮容等能力。
2. 按業務需求拆解
參考螞蟻AI平臺的一篇分享,AI平臺按照不同層級的業務需求可以分為5級:功能嵌入、API調用、數據訓練、模型定制、算法開發。
- 功能嵌入:通過iframe等實現成本最低的手段,將某個功能模塊嵌入到自己的系統中。
- API調用:直接調用平臺提供的成熟API,比如調用身份證、駕駛證之類的OCR識別API。
- 數據訓練:平臺的模型符合需求,但需要提供自己的訓練數據來解決具體場景需求。
- 模型定制:平臺的現成模型不太符合要求,所以要對算法參數進行配置,然后訓練出符合自己需求的新模型。
- 算法開發:最高級的情況,就是業務方懂算法、要開發新算法。平臺則提供“算法開發、數據管理、模型訓練、模型測試和發布”等一系列深層次的能力,來提升算法研發的效率。
把5級業務需求和生命周期對比來看,業務的按需分層和模型生命周期的各個階段基本是呈對應關系的。需求越高級,追溯到的生命周期越靠前。
功能嵌入和API調用級需求只涉及模型推理,數據訓練級需求涉及數據標注、訓練、部署以及推理過程,模型定制和算法開發級需求就涉及全流程的功能了。
3. 一些典型產品
上圖給出了一些AI開發平臺產品的AI模型生命周期覆蓋情況,可以看到大部分產品其實都是提供全生命周期的功能的。當然不是說以上的分析沒有意義,按生命周期或者按需求層次拆解還是可以幫助我們捋清產品架構的。
個人覺得其中百度的功能架構是最舒服、邏輯性最好的。百度的AI開發平臺包括BML和EasyDL兩個,BML是全流程的開發平臺,覆蓋了AI模型全生命周期;EasyDL定位是零門檻開發,所以只支持到數據訓練級別的開發。
這樣的拆分其實就是依據前邊所說的業務需求等級進行的,拆分之后目標用戶要清晰很多。BML中相對獨立的數據相關功能和邊緣部署相關功能又都拆成組件/小平臺,可以供用戶單獨調用,從而提高靈活性。
騰訊TI系列平臺中,TI-ONE定位是“一站式機器學習服務平臺”,但暫時沒有看到關于數據標注方面的功能,數據處理只提供相對簡單的數據接入和數據預處理功能。預置模型相對來說也比較少,大部分是機器學習方面的模型,深度學習模型較少。
TI系列的其他兩個平臺TI-Matrix和Ti-EMS分別是“AI應用服務平臺”和“無服務推理平臺”,個人感覺都更偏向云服務一些,主要是服務調度、擴縮容等能力。
華為ModelArts也提供從數據標注到模型推理全流程的開發工具,其中“自動學習”的功能模塊基本對標百度EasyDL,提供重訓練級別的模型生成,但暫時沒有按照需求層級進行產品拆分。
三、AI支撐平臺
AI支撐平臺比起AI開發平臺,更類似業務平臺,比如內容審核、智能對話等。圍繞的是一個核心算法,通過配置提升這個算法/能力的通用性。
下圖舉個內容審核平臺作為栗子~橫向是發布圖片的業務流程,縱向是審核平臺的功能,可見審核平臺是和業務緊密結合的。
審核平臺的核心其實就是分類問題(把輸入的圖片分為合規、不合規),外部輸入是圖片,輸出是圖片是否合規、違規類型、準確率等信息,而審核策略的制定、驗證則是為了支撐圖像分類算法在內容審核這個場景下work,說到底“支撐”就是配置、設置。
四、一點思考
1. 為什么需要AI平臺?
從用戶的角度看:用戶需要的是以盡可能低的成本(時間及費用)獲取所需的AI能力。AI平臺提供的開發工具、預置模型都可以減小用戶獲取AI能力的投入。
從AI平臺公司的角度看:AI平臺提供的是一套標準化的工具/流程,80%的需求可以由標準化的產品來滿足,而非每個需求都單獨定制解決方案。通過AI平臺這樣的標準化產品來提升ROI,從而實現盈利。
不論是從用戶角度,還是從提供AI平臺的公司角度,其實AI平臺的存在都是為了提升投入產出比。
但個人感覺,目前AI平臺公司對AI平臺的需求是要大于用戶的,這就造成了產品多用戶少的囧境。用戶對AI平臺的不認可,一方面可能是對AI能力帶來的收益的不確定;另一方面可能是對AI平臺提高ROI的不確定(有可能使用了AI平臺但還是無法節約人力投入)。所以如何讓用戶發現AI能力的價值,進而發現AI平臺的價值還是個值得思考的問題。
2. 如何做到AI平臺的差異化?
市面上那么多AI平臺,如何做到讓用戶選擇你的產品呢?差異化。
怎么做到差異化呢?不同用戶對AI能力或應用的需求側重各不相同,但是無外乎數據、算力、模型三要素。
1)數據入手的差異化
當前很多行業還是存在缺乏數據積累的事實的,所以數據對于這部分公司來說就是最大的痛點。從數據角度入手的AI平臺,最直接的是可以主打提供行業數據。如果數據不可獲取,可以退一步和大數據平臺結合提供數據采集、清洗、標注(自動、人工)等功能,解決用戶數據方面的痛點。
前邊提到的basicFinder,就是由標注平臺逐步發展出來的AI平臺。
2)算力入手的差異化
不論是訓練階段還是推理階段,AI模型對算力都是強依賴的,因此從算力入手的AI平臺也是發展最早的一種,一般都和云平臺緊密結合,最后的收益落腳點都是云資源。
隨著AI芯片發展,以嵌入式設備為載體的邊端智能也越來越多,所以算力入手也可以指嵌入式算力。華為算是以算力為核心的代表公司。
3)模型入手的差異化
雖然大多AI算法都有開源的版本,但開源模型往往是通用模型,沒有針對特定場景優化,沒有一般沒法直接應用。比如圖像識別在醫學領域和在自動駕駛領域可能用同樣的算法,但需要喂不同的數據,進行不同的參數優化,最后得到適用于不同場景的模型。比如face++就對人臉識別相關的各類模型都做了優化。
一個熱門方向AI+行業,就是在數據和模型角度都針對本行業進行差異化的設計。比如針對醫藥領域的醫渡云,針對稅務領域的慧算賬等等。
3. 如果要做AI平臺,怎么入手?
個人感覺現在做AI平臺是件很難的事情了,本身這類產品就已經有點供大于求了,做差異化也需要結合已有的積累(無論是數據、算力還是模型),所以從頭做一個成功的AI平臺真的非常困難,留給AI平臺的機會可能只有+行業了。
大膽開麥:短期之內做AI支撐平臺的難度遠小于AI開發平臺,而成功率應該是要高于AI開發平臺的。與其做一個大而全卻沒有明確目標用戶的AI開發平臺,不如圍繞一個點做一個真正有人用的AI支撐平臺。
#專欄作家#
LCC,微信公眾號:sillybaby的互聯網求生指南,人人都是產品經理專欄作家。2B+AI 產品經理,相信科技向善,致力于用AI解決實際問題。
本文原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
邏輯很清晰,看完了很有啟發
文章講的挺清楚的,我主要看了思考的部分,給作者點個贊