物流業務分析師的機器學習神器——Amazon SageMaker Canvas產品測評

1 評論 1608 瀏覽 3 收藏 13 分鐘

編輯導語:日益復雜的業務需求和數據分析需求,催化了更智能、更多元化的分析工具的出現。而亞馬遜云科技推出的Amazon SageMaker Canvas,就是這類智能分析工具之一。本篇文章里,作者結合物流領域的業務,對這款工具進行了體驗測評,一起來看看吧。

隨著數字化進程和人工智能的加速普及,企業人工智能(AI)和機器學習(ML)開發人員嚴重短缺,面對日益興起的數據分析需求,亞馬遜云科技推出了讓人興奮的機器學習新功能——Amazon SageMaker Canvas。

Amazon SageMaker Canvas進一步降低了機器學習使用門檻,運營分析師們掌握無需編碼,即可使用點擊式界面進行更準確的機器學習預測。這允許了任何有興趣學習更多關于ML的人,可以免費嘗試使用這項技術。

話不多說,下面我以物流垂直細分領域的常見數據,來體驗下SageMaker Canvas的魅力!

一、分析場景和數據準備

1. 分析場景

分析每次的揀配數量與耗時和質量的相關性,本次從各環節規定時間內運送的箱數、各環節耗時、各環節箱質量狀態這幾個因子中找出關聯。

2. 業務場景

模擬物流作業人員在規定時間內揀配不同數量的箱子,最終的完成率和質量是不一樣的,分析找出單次作業最佳的揀配箱數。給業務運營同學在制定運送任務策略時,有數據可參考,做出更合理高效的作業策略。

分析的結論是否正確不重要,重要的是模擬出關聯+探索不同角度的分析方法+不同工具的使用。

3. 數據來源

脫敏和虛擬的倉庫內部物流數據。

4. 數據集定義

某廠倉庫內的物流作業過程,有一段是“下發要貨任務——分揀物品——發運物品——配送物品”,每個過程按要貨箱數進行運送,每個運送環節按一定的時間截取當前的完成率,每次運送的用時情況、每個環節物品的質量情況,分別記錄為以下內容:

二、測評體驗步驟和數據分析結構

1. 登陸賬號

注冊和登錄賬號,在控制臺搜索SageMaker,點擊進入SageMaker控制臺。

2. 導入和管理數據

在S3里新建儲存桶,導入數據。導入格式注意是.csv,文檔內不能有中文,剛開始體驗時沒注意格式規范,導入失敗了幾次。整體體驗還是比較流暢的,第一次登陸和設置時需要多讀指引文檔和留意頁面提示。

3. 啟動應用程序

在SageMaker Domain里,找到Canvas(中文版為:畫布) ,點擊啟動【畫布】。

4. 部署

大概1分鐘,后端應用部署完成。

5. 新建模型

在SageMaker Canvas里,點擊【+New Model】。

6. 導入數據

導入剛才在?S3里的數據。

7. 選擇目標列

本次分析我選了【demand case】為目標列,SageMaker Canvas會自動用適合的模型進行分析。

為什么選【demand case】為目標列呢,因為【demand case】是要貨箱數,所有的物流作業,都基于【demand case】才有后續的過程、耗時、質量的分析。再例如,如果你的分析是廣告投放、市場推廣類的,目標列的可以是營銷漏斗的第一層。

8. 選擇有效字段進行分析

字段【NO.】是序號,與數據不相關,不勾選該字段,不然會影響預測;其他字段相關性較高,進行保留。

切換圖標和列表樣式,都可以進行有效字段的篩選。

9. 構建模型

我們來個簡單的,點擊【Preview model】,可查看模型的預測準確率。我這個模型準確率算蠻高的,達到了96.154%。

然后點擊相應的列,可以查看每列數對預測結果的影響。

點擊【Quick build】可以進行簡易分析,還有標準模式,那個等待用時久一些。

下圖展示了構建模型的過程。

10. 模型評估

在使用模型對新數據進行預測前,還可以評估模型的執行情況、每列數據對預測結果產生的影響情況。下圖展示了評估頁面、評估得分以及不同列的影響情況。

還可以通過更改輸入值,來查看預測值的變化情況。

點擊【Scoring】選項卡,查看模型預測的相關可視化結果和指標。

在箱數較少時,一次作業能完成的概率比較大,說明安排此類物流任務時,一次作業10箱或更少箱時,作業人員能比較順手。

此時,運營分析師可以分析原因:可能是不同搬運工具和工具可承載情況的影響;找出可能的策略:增加不同類型的搬運工具、調整搬運組合可能對效率有正向影響等。

11. 做出預測

SageMaker Canvas有兩種預測方案:

  1. Batch——針對整個數據集進行預測。
  2. Single——針對指定的單一數值進行預測。

我們分別來體驗一下:

1)預測方案A:選擇Batch進行預測

對于每一組預測,SageMaker Canvas返回如下內容:

  • 預測得到的值;
  • 預測的值為正確結果的可能性;
  • 指定用于生成預測所用的數據集。

下載所有數據,可以再次進行二次分析(這也是體驗最棒的模塊):

例如:可能性超過98%的數據占到了總數據的86%。該數據匹配上作業ID和員工ID,即可分析出員工在不同時間里,不同作業數量情況下的作業效率、準確率的分布趨勢,可以模擬出員工的作業穩定度。

又例如:可能性低于80%的數據里,這些數據匹配上作業工具ID,可以分析出員工在不同作業要求下,他們的工具的使用習慣分布的預測。

然后定位到優秀員工的工具使用習慣里,可以推薦出哪些工具更適合多采購,哪些工具可以加強培訓等,哪些員工優秀的作業技巧多等。

可能性的數據可以匹配很多關聯字段進行聯想思考,為運營帶來更多策略參考。

2)預測方案B:選擇Single prediction進行預測

我更改了【distributioncase】的值,查看預測值相對于平均預測結果的變化情況。

點擊【Update】 ,生成預測數據。

更改多個【Value】,預測值會有變動,可以直觀地結果發現,處于流程上游的值變動的話,對最終數據影響更大(這也符合邏輯)。

綜上,對于運營分析師來說,千頭萬緒的數據中,要分析出關鍵點和趨勢,更推薦選擇Batch,數據越多,干貨越多,還有意想不到的內容。?

三、總結一下

Amazon SageMaker Canvas提供了一個可視化的、 點擊式的用戶界面,讓運營分析師可以輕松地生成預測,無需代碼即可進行機器學習預測,簡單方便好上手。

在數據的準備上,可以把結果字段,例如合格率、完成率、成功率、轉化率、用量、耗時等進行整理,不要直接用過程數據,這樣分析會更直接。

在數據分析上,可以與關聯ID打通,在跨流程、跨主題的數據里,尋找關聯點。這也是數據分析師提高數據敏感度、深入了解業務的過程了。

希望以上的體驗分析,能給您帶帶一點點啟發~

 

作者:Felice,某廠資深產品經理&產品運營

本文由 @ToB Talk 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 找出可能的策略:增加不同類型的搬運工具、調整搬運組合可能對效率有正向影響等。

    來自廣西 回復