機器學習的未來,真的能技術民主化嗎?
編輯導語:機器學習這一概念對大多數人來說,還是相對陌生的,但其實許多行業的業務場景都可以結合機器學習平臺,達成更高效率的業務分析操作。本篇文章里,作者便從Amazon SageMaker Canvas出發,對機器學習平臺的發展做了解讀,一起來看一下。
人工智能一直是近幾年熱炒的話題,但隨著資本興趣的轉移,人工智能行業也逐漸趨于冷靜,各企業算法工程師崗位逐年縮減,競爭也逐年激烈。
一個朋友跟我說,他18年的時候轉了NLP方向,他覺得他算是跨專業轉型的最后一批選手,再后來他手里的簡歷基本是清北華五計算機科班的了。從從業人員水平來看,人工智能已經變成普通人不再能輕易能涉足的行業。但技術如果不能服務社會,賦能行業,那便是無用的技術。
目前人工智能行業處在冷靜期,但用戶對機器學習的需求從未冷靜。更多的企業在一邊沉淀技術,一邊積極尋求更好的落地場景。
從17年底開始,陸陸續續有企業發布機器學習平臺,其實所謂機器學習平臺本質是機器學習工具。而工具的好處在于,AI企業終于不用花太多精力在場景選擇上,而是追求產品的卓越上。就像賣剪刀的企業,不用太關心剪刀是拿去剪繩子還是剪紙片,用戶自己會發揮剪刀的價值。
最近體驗了一下Amazon SageMaker Canvas,感受到AI企業正很努力地將人工智能變成普通人能夠輕松使用的技術。
先聊一下Amazon,2017年11月亞馬遜云科技推出了SageMaker這一機器學習平臺,并且在三年內收獲了很多世界500強知名企業客戶。在去年12月份,SageMaker為了讓更多人能以更低的門檻享受到機器學習的服務,他們推出了SageMaker Canvas。
我們先不著急直接看SageMaker Canvas是什么,我們先了解一下機器學習平臺是什么樣的賽道。
一、冰山下埋著千億規模市場
隨著C端互聯網經濟增長放緩,越來越多的人將目光投向B端,技術逐漸向產業傾斜。騰訊、阿里、亞馬遜等大廠概莫如是。
而B端目前如火如荼發展的正是數字化轉型。清華“姚班”的帶頭人姚期智院士公開說,數據、算法、算力是數字經濟核心技術。機器學習同樣離不開數據、算法、算力。
根據最近一篇東吳證券的行業報告可以看到,國內機器學習賽道目前是百億規模市場,但帶動的卻是千億產業規模。
我們可以將相關產業規模和機器學習市場規模比較,相關產業規模大概在機器學習市場規模的7倍。美團在做外賣業務的時候燒錢燒了20億美元,王慧文有一句話很經典:知道市場體量,才有燒錢的魄力。美團外賣燒了20億美金,但是現在美團外賣規模1000億美金,市場每天外賣單數5000萬單。冰山下的千億市場,才是真正值得機器學習從業者們耐心挖掘的。
國內機器學習產業規模
二、大廠和獨角獸的角力
機器學習市場帶動的相關產業規模僅國內就有上千億產業規模,鋪開到全球范圍,這無疑是一個大金礦。對于人工智能細分領域的創業公司有很多,但是對于機器學習平臺,就只能看大廠和獨角獸們的角逐了。因為一方面機器學習平臺燒錢,另一方面機器學習平臺需要大量數據去訓練和驗證平臺能力。
2020年百度開始密集地發布線上活動,推廣百度智能云。而同時,華為云不甘落后地推出ModelArt。
而對比國外,早在2017年,Gartner第一次提出數據科學平臺(也叫AI平臺)概念,將機器學習、深度學習模塊納入數據分析平臺之中。Alteryx在18年進入數據科學平臺魔力象限領導者,同期國內也涌現出第四范式、九章云極等優秀企業。
Amazon SageMaker 在2021年進入Gartner數據平臺魔力象限,值得一提的小插曲是,Amazon SageMaker在2020年本就該在魔力象限遠見者中占據一席之地,但由于發布時間比評選時間晚了點,錯了過了當年的評選,而是獲得當年的榮譽提名。
Gartner在2021年對Amazon SageMaker的評價優勢是:
- 云平臺的深度和廣度;
- 性能、可擴展和精細度;
- 數據標記和人機交互功能。
需要注意的事項是:
- 不斷發展公民數據科學新引力;
- 需要快速開發以匹配競品的功能;
- 成熟的本地、混合和多云的支持。
因為Gartner對Amazon SageMaker的這番評價,讓我更加想了解一下Amazon SageMaker。
三、SageMaker Canvas:亞馬遜云科技的科技民主化之旅
終于要聊到想聊的正主了。SageMaKer Canvas是亞馬遜云科技在平臺概念和目標用戶上的一次全力突圍。從產品使用過程來說,是一次能感受到產品背后后厚積薄發的酣暢體驗。
Canvas是SageMaker的全新功能,通過低代碼的形式讓非專業人員也能便捷地享受機器學習的福利。
我有一個朋友是物流運營的小伙伴,她希望客戶的訂單都能按時送達。為了滿足這個目標,她希望能夠對訂單是否能準時送達做提前預測,以便她能提前發掘可能延期的訂單。我從她手里要來了兩份脫敏后的數據,一份是商品清單,另一份是發貨訂單。
因為Canvas的介紹里并不需要寫代碼,我嘗試使用Canvas搭建一個訂單送貨的預測模型,看看是否能實現她要的。Canvas的操作如同它的引導書一樣,僅有四步:選擇數據,創建模型,分析結果,生成預測。
Canvas首頁
1. 選擇數據
我把從朋友那邊拿到的脫敏數據上傳到Canvas里以便訓練使用。Canvas的數據導入有4種方式:本地上傳、Amazon S3導入、Snowflake導入、Redshift導入。
第一次上傳失敗了,因為本地上傳需要在S3里修改一項配置,在按官網操作之后,順利地上傳了本地的CSV文件。Amazon S3是亞馬遜自己的云存儲,類似云盤。Redshift是亞馬遜的數倉平臺。
比較意外的是看到了Snowflake,可能很多人不知道Snowflake,這是一家做云原生數倉的公司,推的是DaaS,但收費模式卻是SaaS企業最想要的模式,建議SaaS企業的小伙伴可以研究一下。
比較意外是亞馬遜自己有Redshift為啥還要引入第三方數倉,轉念一想也挺有道理,一方面Snowflake確實做得好,有廣大的用戶群,另一方面snowflake是云服務商而不是云設備商,Snowflake也可以是亞馬遜的客戶。
Canvas的數據錄入頁面
通過本地上傳數據之后,Canvas支持Join功能。這個可能稍微偏一點技術,其實就是開發最常用的Join函數的意思,能夠把數據庫表拼接。
首先,我把朋友給的商品清單和發貨訂單進行拼接,兩張表里有相同的字段ProductID。拼接之后我得到了一個維度更多的CSV文件,或者說特征更多的CSV文件。
然后將拼接好的數據上傳到了Canvas里。Canvas會對上傳的數據進行簡單的統計。下圖里JoinData是我拼接后的文件,我們后文就專業一點叫把這個CSV文件稱為數據集。這個數據集大小是16列10000行。
在導入數據集的時候,Canvas支持數據集的預覽,避免用戶導入錯數據集。
Canvas選擇數據頁面
2. 創建模型
正常來說,建模這個事情真的是煉丹師們登場,非專業人士緊急避讓。但是Canvas里的操作簡單到讓人不可思議。
在創建模型的頁面選擇自己關注的字段,然后選擇自己需要參與到模型分析的字段就可以了。這里簡單一點理解,就像求解一個復雜的函數 y = f (x1, x2, x3,…… )。我們關注的字段是 y,需要參與分析的字段是x1,x2,x3等等。相當于是在尋求一個函數的計算結果。
比如在這次訂單的測試里,我把是否準時送到這個字段作為我關注的字段 y,我們用 y=1 表示可以準時送到,y=0表示不能準時送到。剩余的字段運輸優先級、距離、發貨地等作為x1,x2,x3進入模型參與運算和分析。
Canvas創建模型
通過預分析建模,能夠得到SageMaker建議的模型分類。比如預測是否能準時送達,SageMaker給出的建議是一個二分類的模型,就只會出現兩種結果,準時送達和不準時送達。
在預分析建模后,能夠得到模型的準確率和各個特征的影響系數。影響系數越大,表示這個字段對結果越重要。比如圖里可以看到預建模的結果是,運送優先級最大程度影響是否能按時送達。
但是預建模只能讓我們知道準確率,還沒有更詳細的信息。Canvas支持標準建模和快速建模,根據數據集的大小不同,標準建模和快速建模的耗時也不同。我用10000行數據測試,快速建模大概需要2-15分鐘,標準建模需要1小時45分鐘左右。
標準建模能讓模型更加準確,運算的時間也更長一些。這里滿足了兩類人的需求,定性的看問題的小伙伴快速建模就可以了,對結果定量嚴格要求的用戶可以標準建模,標準建模還能將模型分享給算法團隊進行進一步的開發。
算下來創建模型頁面就三個配置模塊,建模完成以后就進入了下一階段數據分析。
3. 數據分析
數據分析階段和創建模型的預建模步驟拿到的信息類似,主要是模型準確率和各個特征的權重。也可以單獨看某個特征值的預測影響。而最主要的是能夠看到分析結果里的高級矩陣,同時能看到F1得分、準確率、精確度、召回率和AUC。
Canvas 分析頁面
Canvas 高級矩陣頁面
這些高級矩陣的指標其實是由頁面里藍粉框內的TP、TN、FP、FN數值計算得到的,這一部分業務人員其實不是很關心,但是可能有小伙伴感興趣,我們簡單掃個盲。
- TP:True Positive,即正確預測出的正樣本個數(實際是準時,模型預測也是準時)。
- FP:False Positive,即錯誤預測出的正樣本個數(實際是延期,被模型預測成了準時)。
- TN:True Negative,即正確預測出的負樣本個數(實際是延期,模型預測也是延期)。
- FN:False Negative,即錯誤預測出的負樣本個數(實際是準時,被模型預測成了延期)。
準確率(Accuracy)= (TP + TN) / 總樣本 =(944 + 945)/2000 = 94.45%。定義是:對于給定的測試數據集,分類器正確分類的樣本數與總樣本數之比。
精確率(Precision)= TP / (TP + FP) = 944/(944+54) = 94.589%。它表示:預測為正的樣本中有多少是真正的正樣本,它是針對我們預測結果而言的。Precision又稱為查準率。
召回率(Recall)= TP / (TP + FN) = 944/(944+57) = 94.306% 。它表示:樣本中的正例有多少被預測正確了, 它是針對我們原來的樣本而言的。Recall又稱為查全率。
F1分數(F1 Score),是統計學中用來衡量二分類模型精確度的一種指標。它同時兼顧了分類模型的精確率和召回率。F1分數可以看作是模型精確率和召回率的一種調和平均,它的最大值是1,最小值是0。
AUC(Area under curve)曲線下面區域的面積,這條曲線一般指ROC(Receiver operator characteristic curve)曲線。按照定義,AUC是ROC曲線下的面積,而ROC曲線的橫軸是FP,縱軸是TP。
4. 生成預測
第三步主要是分析模型訓練的結果,沒有過多可操作的頁面,模型生成之后,第四步可以通過模型來預測結果。
在預測新結果的時候,我們只需把新的特征值放進模型,模型會計算出對應的結果。
我們任意設定訂單的優先級,運輸方式,目的地距離等參數,Canvas能夠基于我們輸入的特征值給我們返回一個預測結果:準時或者延期。Canvas可以直接單點預測和批量預測。
利用批量預測的功能,我朋友就能得到她后續處理的訂單是否能準時送達的預測結果了。
單點預測
批量預測
5. 使用小結
我大概統計了一下操作用時,第一次使用花了半小時左右,主要在探索功能上多花了點時間。熟練操作后可能5-10分鐘就可以把Canvas的完整流程走完。
看下來Canvas把建模完全變成了黑盒測試,用戶只需給Canvas設定輸入參數和輸出參數,Canvas就可以實現模型創建,并能為用戶提供預測功能。官方主打的低代碼雖然和APaaS行業里的低代碼認知有挺出入,但從操作流程來看也說不上虛假宣傳,確實沒有需要coding的地方。
我想這個產品應該算是亞馬遜云科技對技術民主化的一次探索,將晦澀復雜的技術用最簡單的方式呈現,以期降低用戶使用技術的門檻。從Canvas的產品表現來看,實實在在降低了機器學習準入門檻。
但是,完全沒有人工智能知識或數據分析知識的小伙伴可能上手還是有一些困難,這個困難不是囿于產品的使用,而是囿于知識版圖的缺失。
不知道Canvas后續會不會進一步降低使用門檻,還是說目前產品目標受眾就是懂一部分數據分析和人工智能的運營人員。如果用戶只局限在互聯網相關的產品運營人員的話,那可能就有點格局沒打開。還有很多場景值得機器學習發揮,比如銀行通過客戶的行為數據預測用戶是否可能會延期還款,工廠通過設備的監控數據預測設備是否會損壞。
在這些場景下,需要掌握機器學習能力的人不再是產品經理,運營。還有銀行的風控、工業里的IT和OT人員等等。
從Canvas簡潔的UI畫風來看,Canvas團隊對產品要求的還是相對嚴格的。包括在數據拼接和數據導入的時候,有很多小細節來做柔性處理。比如數據拼接時,對不同數據來源數據集的字段用不同的顏色表示;比如數據導入之后,在選擇目標列的時候,對所有字段的類型做了預定義,并且配了很形象的Icon去表征數據類型。
但是在模型構建的部分只能看到耗時和預測用時,無法看到剩余用時或者訓練進度。這里的設計會讓用戶處于沒有安全感的等待中。用戶并不知道是因為網速問題、瀏覽器問題、還是Canvas的服務問題一直未完成訓練。
Canvas的頁面細節
另外,無論是SageMaker Canvas也好,還是其他的ML平臺也好。整個行業應該沒有很好的模型可解釋性。這一點是比較反人類認知的。我們從小接受的教育都是要邏輯嚴謹,要不然也不會在數學物理里做了那么多證明題。
現在ML平臺的解決方案是非常簡單粗暴的,給一堆特征參數,然后返回一個預測結果。但是為什么有這個結果,是目前誰都說不清楚的。如果ML平臺把模型可解釋性提高,相信會有更多的用戶接受。
四、市場所需的機器學習平臺到底是什么樣的?
前面聊了很多我自己的使用體會,我們也一起了解了一下市場到底需要什么樣的機器學習平臺。Garnter2021數據科學和機器學習平臺的魔力象限里提到,他們對機器學習平臺的考量標準在五個點:
- 數據科學和機器學習平臺能力;
- 企業的收入和增長;
- 客戶數量;
- 市場吸引力;
- 產品能力評分。
但是Gartner的考量維度是以一個中立視角從企業層面對機器學習平臺進行評價。而更能說明產品能力的,還是用戶反饋。勇于嘗鮮的部分企業用戶其實已經對現有的機器學習平臺開始了深度探索,我從字母點評整理了一個小樣本的機器學習平臺調研結果,可以一起看一下。
機器學習平臺第三方評價
機器學習平臺用戶滿意度
從第三方的數據來看,不同用戶對主流機器學習平臺能力評價總體接近,一些頭部機器學習平臺的客戶滿意度遠超行業平均值。從用戶的實際口碑來看,Amazon SageMaker的產品競爭力比較靠前,用戶普遍反饋的是可以放心地讓SageMaker托管自己的機器學習任務,而相對抱怨較多的是Amazon的付費模式過于復雜。
其實普通企業用戶對機器學習平臺核心訴求就兩點:
1)安全
機器學習平臺需要保證用戶的數據絕對安全,這也是很多企業目前還在猶豫上不上公有云的困擾,企業需要確保自己的數據不泄露,不被篡改。
2)準確
對于選擇了機器學習平臺的用戶來說,他們需要模型能有較為精確的結果。而準確性也是對機器學習平臺的算法能力比較大的挑戰,模型是否準確其實在用戶心里也是個二分類問題,不會嚴格的像算法里給出90%精確這樣。用戶心里需要的是放心的托管和信任。在這兩點核心訴求的滿足上,ML平臺缺一不可。
而在這兩點核心訴求之上,才是便捷易用和模型可解釋。當然一開始著手設計低門檻的產品和平臺是否安全、模型是否準確這兩點并不沖突。
目前已經獲得客戶好評的企業,不知道打造的是不是最終市場所需的機器學習平臺,但至少眼前他們的路是正確且踏實的。
五、最后
最后,要回過頭反思一下咱們標題的問題了。毫無疑問,Amazon SageMaker Canvas的出現,是在傳遞一個信號,亞馬遜云科技正在把復雜深奧的技術,簡化成一系列簡單的配置,讓更多人可以輕易地借助機器學習的力量改善自己的工作狀況。
但無論是從大廠動向的觀察,還是從歷史發展必然性的反思,機器學習的未來應該是科技向善,科技親民,讓更多的人享受到真實有效的服務。當前疫情之下,國內經濟發展啟動雙循環。企業運營迫切需要改革,效率迫切需要提升,技術民主化才真正是當下各類科技的最佳實踐,所以標題的問題不再是問題,而是科技企業們需要給出的答案。
#專欄作家#
忙里偷賢,公眾號:忙里偷賢,人人都是產品經理專欄作家。B端產品,低代碼玩家,工具類產品思考者。熱愛分享,務實的理想主義者。
本文原創發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議。
機器學習確實是第一次了解到相關概念,文章寫的很詳細
不愧是獲獎前三的大佬,分析邏輯好嚴謹,感謝分享!希望后續看到牛人更多有意思的文章!!
機器學習的未來應該是科技向善,科技親民,讓更多的人享受到真實有效的服務。尤其疫情當下,科技企業們更應給出答案。
目前人工智能行業處在冷靜期,但用戶對機器學習的需求從未冷靜。更多的企業在一邊沉淀技術,一邊積極尋求更好的落地場景。