以智能貨柜為例,談談CV領域“識別錯誤”的3類場景

0 評論 4091 瀏覽 12 收藏 9 分鐘

筆者從工作實踐出發,以智能貨柜為例,梳理了CV領域識別錯誤的3類場景,并對這些“錯誤”給出了自己的建議。與大家分享。

一、圖像識別任務簡介

先簡單說明下圖像識別四大任務:分類、定位、檢測、分割。

  • 圖像分類:任務的輸出是判斷輸入圖像所屬分類。形象說明:給一張有人的圖片,模型判斷圖片類型是“人”or“鳥”。
  • 目標定位:在圖像里面目標較少或固定,任務的輸出是把在圖像里的目標找出來標注具體位置。形象說明:給一張有人的圖片,模型把人框出來。
  • 目標檢測:在圖像里面目標較多且不固定,任務的輸出是把在圖像里的目標找出來標注具體位置,難度比目標定位更大。形象說明:給一張有很多人的圖片,模型把所有人都框出來。
  • 語義分割:基于目標檢測的基礎下,更精準的標注出圖像里的目標。形象說明:給一張有很多人的圖片,模型把所有人按輪廓框出來。

二、識別錯誤場景

以下介紹的圖像識別錯誤場景主要圍繞目標檢測和目標分類任務,在識別“商品”這個領域下,識別錯誤場景一般分為以下三類:

  1. 漏識別:應檢測目標沒有被檢測到;
  2. 識別錯誤:目標被檢測到,但是識別分類錯誤;
  3. 識別多:不應檢測目標被檢測到并且進行了分類。

1. 識別錯誤:漏識別

發生原因:

  1. 陽光直射,圖片曝光,導致漏識別,或者其他類似的環境問題,導致拍攝效果質量差,圖片失去了正常準度;
  2. 商品相互遮擋,被遮擋的商品沒有了特征,無法識別;
  3. 從模型角度:部分商品識別效果不好,欠擬合。

解決方案:

  1. 貼防光膜,擋陽光,但是會造成視覺體驗差,幾乎看不到商品。其他類似環境問題也可以通過“物理”手段解決;
  2. 增加光照(異常)場景下的圖片訓練數據(給模型針對具體錯誤場景更好的泛化能力),拿更多真實環境的圖片作為訓練數據;利用數據增強,調整圖片亮度模擬光照作為訓練數據;
  3. 利用IOU(檢測目標面積的交并比)和一些圖像相似度對比算法(余弦對比、像素點對比等),在漏識別的情況下通過后處理邏輯重新將漏檢測的目標“硬生生”識別出來。(本質上,模型依舊是識別不準確,但是實際效果是ok的)

但是加后處理邏輯算法是有潛在成本的,首先會讓團隊精力沒放在模型真正的準確度上,一直專注完善邏輯;

其次就算怎么加邏輯,也有沒辦法覆蓋到的場景,最后就是邏輯越來越復雜,反而會導致整體識別體驗效果變差。

2. 識別錯誤:識別錯

發生原因:

  1. 兩個商品很相似(人眼也分不清楚到底哪個是A哪個是B),經常相互識別;
  2. 從模型角度:部分商品識別效果不好,模型欠擬合/過擬合。

解決方案:

  1. 不斷調參,優化模型,補充訓練數據,增加訓練數據質量;
  2. 減少/拒絕相似商品同時出現在同一場景下。(培訓大客戶,委婉的解釋“最好不要”??梢詮妱菀稽c的時候就“暫時不支持這樣操作”);
  3. 通過產品邏輯處理,例如“模板”式識別:在該環境,識別出A和B,都默認當成A。(超級悖論,邏輯>AI);
  4. 物理式區分相似商品,如直接將A更換包裝(只要能落地商業,成本<收益,管他是什么手段)。

3. 識別錯誤-識別多

發生原因:

  1. 一個商品認成了兩個(如頭尾長一樣),或者背景和商品很像。在模型沒有優化之前,這是很常見的問題;
  2. 從模型角度:過擬合,某些不在識別范圍內的物體也識別成了商品。

解決方案:

  1. 把一些容易識別成商品的物體當作負樣本訓練;
  2. 不斷調參,優化模型,補充訓練數據,增加訓練數據質量。

三、萬能方案

把大概率出錯的內容交給系統/人工修正處理,再把內容輸出到用戶。例如用戶完成購物,產生一筆訂單超過了500元,但是在對應場景一般不可能出現超過100元的訂單,這種情況先把訂單交給人工檢查一遍沒問題了,再去扣款通知用戶。

通過產品邏輯和功能去規范用戶行為,規范交互流程,把“極度容易出錯/現階段無法支持”的行為排除掉。

四、經驗總結

(1)單個模型的內容label越多,即便同個模型在訓練測試時得出的指標(準確率)無太大差異,但因為有大量的相近label交錯,實際場景下的穩定性很差,label數量與運營穩定性是非線性關系。

在AI技術只能照顧到90%的場景的時候,剩下的10%場景可以增加“二重防護”甚至“三重防護”:例如增加重力感應、RFID感應的手段兼顧輔助,去完善產品體驗。最終呈現出來的體驗效果是ok的,是符合用戶預期的,當然同時會增加一些成本。

(2)tob的AI產品,有時候會放棄c端用戶體驗,優先考慮b端商家(大部分情況下有一方得到利益,另外一方利益必定受損)。

例如智能貨柜:識別錯誤情況多了以后,對于貨柜運營商家來說承受的貨損和運營成本就會增加,商家就會懷疑技術能力甚至撤離貨柜布點和取消合作。

不僅如此,也會造成顧客認為機器經常亂扣錢,導致其不會回歸購物場景。

(3)一定要折衷的話,前期會偏向“寧愿扣款錯誤,后續退款給用戶,也不讓商家承受損失”。

畢竟c端用戶只要在一定時間內能及時退款,或者是不及時扣款,是可以通過售后流程去把控的,但是商家(特別是小商家)對貨損十分敏感。

(4)AIPM要想辦法通過某些渠道提前控制使用者對產品的預期。

2B的AI產品要在培訓時點明現階段支持什么,不支持什么,哪些場景靠AI是不靠譜的。不然客戶購買了產品回去心理落差很大。又要有技巧的通過一些話術使得客戶有期待。在商務會議場景下,又要適當的“放大”產品能力。

2C的AI產品通過前端交互引導、品牌認知廣告一些方式,引導用戶的對產品技術和體驗的心智發展。

 

作者:zain,微信號:gdn1016756845;公眾號:五百桶戶(ID:zainosl),交流是最好的進步途徑之一。

本文由 @zain 原創發布于人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!