平安產險科技中心首席AI專家肖嶸:跨越AI的最后一公里

1 評論 6420 瀏覽 21 收藏 19 分鐘

2019年4月13-14日,人人都是產品經理舉辦的【?2019產品創新大會·深圳站】完美落幕。平安產險科技中心首席AI專家肖嶸老師,給大家分享了《跨越AI的“最后一公里”》。

大家好,我是肖嶸。做了十多年的技術工作,去年加入平安財產險,在AI方面做一些智能產品的創新工作。

可能大家不理解,怎么把一個技術宅硬生生的逼成了半個產品經理,這是為什么?主要是AI的創新實在太難了——AI的產品落地,技術跟產品的中間存在一個巨大的一個鴻溝:如何跨越AI的最后一公里。

這幾年,人工智能技術在行業里有了很多應用:人臉識別、自然語言處理、深度學習等等。但是,哪些人工智能技術是已經相對成熟了呢?比如說人臉識別,火車站機場基本上都能用得到,但是光線差一點,或者有點逆光就不行了。

為什么?

因為這些技術和它的訓練數據關聯性非常強。在任何一個場景通用的算法基本上是找不到的,這里面有一個問題:如何針對我的應用場景,選擇一個足夠好用的算法?

這就涉及到深度打磨的過程。今天就從5個場景給大家分享一下,如何做一名創新的AI產品經理。

一、移花接木:AI寵物識別

這個部分,我們從“寵物識別”來說起。

現在身邊養寵物的人越來越多,寵物的整個市場、規模、保費規模等都在增加。

但是寵物險這個市場其實還沒有完全開發起來,因為有非常大的風險——今天我給我的貓投保了,但是寵物是沒有身份證的,貓也沒有什么生物驗證的技術(即使有也不成熟);如果我拿鄰居家生病的貓來理賠,保險公司是很難檢測出問題的。

這種情況下,是否跨越用人臉識別的技術做一個貓狗臉的識別——這其實是一個非常自然的一個想法。

人臉識別有幾個步驟:

  • 把人臉的位置找出來;
  • 把人臉上五官找出來,進行精確定位;
  • 在五官精確定位的基礎上,抽取人臉特征進行比對。

我們把人臉識別的技術搬到了貓狗臉識別上,效果也非常好。

人臉能做到99.8%,我們能做到95%,很大程度上解決了貓狗臉識別的問題。這就是移花接木,把這朵花(人臉識別)接到木(寵物識別)上去。

它有兩個維度的創新:

  1. 行維度:比如人臉識別創新到貓狗上。
  2. 列維度:有一個新的算法,比如人臉識別搬到貓狗臉識別上去,在貓狗臉識別上有一個新的算法,新的網絡架構出來了,搬到人臉識別上去應用,同樣得到性能的提升。

二、起死回生:OCR圖像分類與識別

在OCR技術中,圖片質量和真實場景是一個很復雜的情況,導致OCR準確率一直不是很高。

以新車合格證為例:它的vin碼有17位,即使每個字符識別的準確率能到99%,它一個碼全對的概率也只有0.99*17次方,約等于84%的準確率。

大家可以想象一下,一張表格有很多字段,每個字段每個字符都識別爭取,是一件非常難的事情。身份證可能是個比較簡單的問題,能做的比較高一些,但是在很多復雜場景下,如何應用OCR技術,其實非常難——只有百分之七八十的準確率。而如果要交付,肯定要99%以上對不對?如果只有百分之七八十,就需要人工再確認一遍。

這種情況下,對效率提升就不是那么明顯。

在這種場景下,我們怎么來解決這個問題?

做技術的人應該非常清楚,OCR技術分成三個步驟:

  1. 文字檢測:告訴你文字在哪;
  2. 文字識別:每個字符是什么;
  3. 文字理解:理解這個字符是什么意思。

我們以身份證舉例:

在“出生”這里,我們畫了一個框,但是“1654”這四個字是什么意思?是金額還是其他的?在這個特殊場景里面,我們還需要知道這個位置是什么意思。

OCR技術的三個步驟:一是識別文字范圍,二是識別文字字符,三是根據當前的上下文和模板。

意思是,在這個過程中,三個步驟的準確率不完全一樣的。識別比較難一些,文字理解部分,是有一些前沿的知識在里面。所以,我們是不是可以運用不同的技術手段,把效果提升上去?

OCR技術為什么不準確?

很大一個原因是圖片質量不太好,所以我們引入了圖片質量的算法——當資源質量不好的時候,在用戶端就直接攔截掉。

OCR技術是依賴于不同的表征類型的,我們引入了遷移學習,對圖像進行分類,找出是身份證還是新車合格證(OCR技術在理解的時候必須要結合具體的場景,所以不能把身份證放到新車合格證的識別場景去做),用算法把不同的表現分解出來,放到不同的分類器里面去。

所以,我們的OCR技術處理流程變成了:

客戶端獲取圖片-篩選出質量合格的圖片-對圖片進行自動分類

整個流程,我們需要上傳四個類型的證件,通過圖片分類和質量篩選,找到四個合適的圖片,上傳流程就可以結束了。如果類型缺失或者圖片質量不佳,在用戶端實時提醒。

在識別的時候,我們可能設定一些可信度:當算法不能夠完全確認的情況下,直接把無法確定的部分攔截,調用人工進行判斷,完全可信的就自動進入下一個環節。

(人工判斷任然是現在采用的一種輔助模式,人工判斷會產生新的標注信息。因為這些人工標注的都是計算機判斷不準的部分,利用計算機的深度學習引擎可以對算法進行更新迭代,讓模型自動升級)

通過這樣的方式,我們統合圖像質量評估、圖像分類、圖像識別三大技術,使得整個OCR技術能全自動運行起來。對用戶而言,基本上就是直接拍個照問題就解決了,后面人工的部分他是看不到的(人工部分隨著模型的迭代可以降低甚至消除)。

我們的OCR引擎剛上線的時候,只有百分之七十幾的一個準確率,隨著模型的自動更新迭代,現在我們做到了百分之九十幾,未來可能還會繼續更高。

而且我相信,OCR技術和圖像分類也是一樣(大家都知道在圖像分類技術上,它已經超過人類了),在未來的3-5年之內,也能超過人類。

三、老樹新花:AI智能閃賠

在已有的一些場景/應用上,我們能不能繼續突破/更新。

我們以平安的“AI智能閃賠”這個產品為例:

(此處插入視頻)

看視頻可能會覺得很炫,但是實際使用中,依然會有很多的問題:

  1. 用戶拍攝的時候,很多時候不是那么準的——要么過大,要么過小,這會導致后面的識別就不準確。
  2. 人是很聰明的,如果對這輛車拍個遠景,再對著一輛撞壞的車拍照,然后說這是我的損傷,來報案理賠——這種情況,我們是無法識別其中的風險的。
  3. AI技術在落地上受限于場景。比如說反光,車拍一下陽光或者路燈照在車上的反光,會直接影響到損傷部位的判定——它顯示就是個亮斑,而亮斑是不是損傷是沒法判斷的。

我們進行反思之后,抓住了幾個點:

  1. 智能抓拍
  2. 安全
  3. 增強圖像質量

這里面我們提供了一套解決方案,對老技術進行了一次整體的升級換代。在這里面,我們的技術人員和AI技術員有過深入溝通,發現很多東西其實你只要想到那個方向,其實都是可以解決掉的。

比如:智能抓拍。在拍照過程中,我們通過手機視頻的物理檢測,可以告訴你離車是遠還是近,直接在屏幕里提示你“往前走進一點”還是“離遠一點”,在視頻中完全可以通過交互實現。

另外,視頻其實就是不斷的連續幀的集合,每一幀之間都是有相似性存在的。通過幀與幀之間的相似性,可以鎖定一個證據鏈,形成類似“從遠處拍車,到近處的局部”照片,結合車輛的檢測和相似性給定鎖定的證據鏈,防止篡改視頻,降低理賠的風險。

前面說的亮斑問題,困擾我們很久,后來我們采用的方法很簡單。

反光是一個非常有意思的物理現象,反光的位置是由你觀察的位置和光源的位置所決定的。當你往前移動的時候,反光的位置也在移動,而損傷的部位是不會動。而我們在拍攝視頻的過程中,我們的人和反光點都是在往前移動的,但是損傷不會移動,我們通過多幀圖像進行融合,增強圖像來解決亮斑影響損傷判斷的問題。

所以,AI的技術其實并沒有固定的模式,都是多個人工智能技術的融合過程——在應用場景中,發現的每一個難點,如何匹配流程上的變化,把技術/算法進行升級,解決掉這個問題。

四、芥子須彌:智能機器人

在人工智能應用中,很多技術是“膠水技術”——它可以把很多技術整合在一起,形成一個更加完整的體驗。

比如說我們的聊天機器人小新,基本上就是完成一些用戶的溝通需求:與用戶閑聊,查詢一下天氣之類的,Google的還可以預定披薩,幫你接電話之類的,解決一些情感、溝通的問題。

而這個機器人的技術,我們在工業或者商業的應用上,可以做成業務型機器人——完成多倫問答,滿足客戶的特定需求,完成特定業務流程(比如說詢報價,詢報價是固定的流程,用戶輸入他的身份證,輸入他的車架號車牌號,然后再看你有什么需求,整個業務流程是非常確定的)?;旧隙际峭ㄟ^文字/語音和機器人溝通,但是技術其實不限于此。

機器人可以把整個業務流程打通在一起,而這種技術,在其他公司/其他場景也可以得到應用。所以機器人技術,是一種非常好的膠水技術。

我們自己的客戶助手,用戶咨詢/投訴/業務辦理的問題,通過客戶助手機器人就可以自動進行。

比如:用戶會問“理賠的流程是什么?”

根據我們的知識圖譜,機器人可以告訴用戶理賠流程下面涉及到幾個步驟。

用戶再接著問“我的進度在哪,進度到底怎么樣?”

我們通過分析用戶的意圖是“要查詢當前進度”(這會涉及到很多NLP技術),機器人會給用戶一個合理的反饋,甚至給出一些建議,比如說:可以查一下違章什么的(通過推薦和算法)。

通過AI的多種技術的融合,在機器人上能有一個非常好的體驗。

五、大巧不工:AI開放平臺

一個AI算法,是需要一個技術平臺,一套體系來完成更新迭代的過程。AI最重要的問題,在于它的技術是不停更新的。

2011年語音技術從深度學習開始突破以后,2018年已經做到非常接近人的水平。圖像技術在2012年之前,跟人的差距非常大,但是在圖像細分領域,2012年之后每年都有巨大的提升,2017年的時候就已經達到人類的水平。

我們構建了一個AI的開放平臺,包含了訓練/上線/更新/監控等整個全自動的模塊,可以完成一個閉環,把我們很多的技術都對接到這個平臺上面去。這樣一個平臺的建立,可以使整個AI技術達到自動更新完善的一個過程,現在整個的AI開放平臺已經服務到多個部門當中,統一集合的同時使得深度學習的資源可以跨部門共享。

六、總結

在AI如何跨越最后一公里的過程中,可以看到:如果要成為一個合格的AI產品經理,除了產品經理本身的硬實力軟實力之外,還需要什么?

  • 需要一些創新,很多流程和傳統流程是不一樣的。在整個創新的過程中,你可以找到很多場景,通過AI技術和實際的場景深度融合,把原來的流程顛覆掉。
  • 第二個是好奇鉆研,產品經理對技術要有一個非常好的把握度,要去了解一些技術的發展,主動去了解一些信息。

為什么AI技術到完全落地還有一個巨大的鴻溝?

這個技術在你的場景是否合適,能不能用,涉及到什么判斷因素,如何衡量每一個步驟的效果?等等這些。

2021行業大會全國巡回預告

聚焦運營增長策略、產品經理能力變革之路、產品創新趨勢、數字化轉型實戰方法、B端創新賦能產業變革等熱門話題板塊,匯聚上百位一線實戰專家,數千位圈內精英,分析前沿創新實踐,探索2021產品與運營新可能。

掃描下圖二維碼↓↓↓添加大會小秘書豆豆,享門票預售獨家優惠,【免費預約】領取2021全年11場大會嘉賓現場演講PPT+思維導圖!

點擊下方圖片或戳此鏈接http://996.pm/Mny6Q,了解大會詳情。

相關閱讀

所有的創新,最后都是人的問題

遠望資本程浩:漸進式創新都是給行業老大打工!

好創新壞創新:如何實施營銷創新推動品牌增長?

產業互聯網,到底如何才能落地

一位好的產品經理,也是一位好的掌舵手

容許產品有缺點,不許產品無特點

創新:一段充滿風險的向死而生的道路

研究完95后群體,我發現了這幾點新機會

 

本文為【2019產品創新大會·深圳站】現場分享整理內容,由@小編Ella 整理發布。

未經許可,禁止轉載,謝謝合作

題圖來自大會現場

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 【2020年度產品經理大會】全國巡回現已全面開啟售票!

    今年,我們以「發現產品經理的新可能」為主題,深入地探索產品經理與技術、體驗、創意、產業、B端的連接;讓大家看到產品經理賦能產業升級,為各領域變革所帶來的商業創新,以及自身發展的更多可能性。

    點擊查看大會詳情:
    http://996.pm/76Xd4

    來自廣東 回復