滴滴研究院:解讀滴滴調度系統中的人工智能

2 評論 27663 瀏覽 114 收藏 16 分鐘

一文讀懂滴滴背后的人工智能。

作者了解到,去年滴滴成立了機器學習研究院,之后改名為滴滴研究院。

滴滴研究院副院長葉杰平:揭開滴滴人工智能調度系統的真面目

滴滴研究院做的事情是結合大數據與機器學習,搭建滴滴交通大腦。滴滴交通大腦需要收集每個城市、每一時刻的所有交通出行相關數據,然后做出最優的決策(匹配、導航等),從而提高出行效率。接下來我來分享一下滴滴過去一年在大數據和人工智能方面的探索。

滴滴研究院副院長葉杰平:揭開滴滴人工智能調度系統的真面目

App 首頁中的人工智能

打開滴滴出行 App,首頁中就包含很多人工智能:

滴滴研究院副院長葉杰平:揭開滴滴人工智能調度系統的真面目

預測目的地

我們先會精確定位用戶的位置,下方是用戶所要去的目的地。很多情況下我們能夠預測到用戶去哪里:因為很多出行是比較有規律的:早上上班、晚上回家。我們利用用戶的出行數據從時間和地點中預測用戶去的目的地,這是人工智能的一種體現。

估價

我們常見的價格預估背后其實也有著非常復雜的計算過程,涉及到路徑規劃和時間預估(ETA)。其中從起點到終點的路徑規劃是非常核心的一部分,找到最佳路徑后,我們需要計算出 A 到 B 的距離。隨后著手解決行程所需的時間估算:起點到終點需要 20 分鐘還是 30 分鐘。結合路徑和時間,我們給出一個預估價。

拼車

拼車選項也是非常復雜的機器學習問題,我們需要計算用戶點擊拼車后從起點到終點過程中找到一個拼友的概率。如果概率不大,這名乘客就很可能得一個人從頭坐到尾,而滴滴給出的折扣也會低一些,如九折等。如果這條是熱門路線,路途中很可能會有其他乘客與你在同一時間去同一個或附近的地方。這種情況下,我們可以打一次力度稍微較大的折扣。

叫車后的人工智能應用

乘客與司機匹配

滴滴研究院副院長葉杰平:揭開滴滴人工智能調度系統的真面目

當用戶確認叫車后,滴滴需要做訂單匹配,找到最適合接該用戶的司機。這一流程也是一系列的機器學習問題。

那么如何權衡訂單合不合適,可以有多種辦法解決:比如距離和時間上離你最近的司機。當然,權衡訂單問題背后也包含個性化搜索,如個別用戶可能只喜歡某一類車型、某一種類型的司機。尤其是女性用戶在深夜十一二點,可能對車型和司機的要求比較高,這需要進行個性化匹配。

如果用戶選擇拼車,系統如何找到最適合的一輛車:這輛車有可能是空車,也有可能是載人車,與此同時,算出 A 到 B 的時間。

熱力圖

這里會遇到一種情況,新司機希望空駛時間越少越好,但往往不知道去哪接單,這時候滴滴會給到一個熱力圖,告訴司機哪些區域未來的半個小時,有可能有很多訂單需求。

滴滴人工智能的核心:訂單分配

滴滴研究院副院長葉杰平:揭開滴滴人工智能調度系統的真面目

滴滴研究院目前做的最核心的事情是訂單分配。在某個時刻有成千上萬的乘客,同時也有成千上萬的空閑車輛,我們要完成司機和乘客的最優匹配,權衡標準是匹配度。計算匹配度最簡單的方法是用距離進行評估,滴滴在前幾年均是用距離進行匹配。但路面距離計算仍存在很多不合理的地方,因為各個路段的狀況不同,有些地方特別堵,有些則相反,同樣是一公里但行駛所耗時間可能完全不同。這里就急需增加時間這一維度。而計算時間又是一大難題,比預估距離還要難。

所以滴滴實現訂單最優匹配需要遵循這兩大核心:做出最優路徑規劃,預估時間。

大規模匹配

計算出某個訂單的時間和距離后,會遇到一個問題:由于滴滴數據量特別大,每一個乘客不只是讓一個司機去匹配,而是需要跟周圍上百個司機匹配。在任何一個時刻,滴滴的匹配量高達千萬次以上,在一兩秒鐘完成上千萬次的路徑規劃,這是一項非常大的挑戰。

這項決策與搜索不同,用 Google 搜索出結果后,再過 10 分鐘結果依舊與之前相同。而滴滴在匹配時,哪怕滯后兩秒鐘這個司機就可能過了某個十字路口,使得路徑規劃狀況完全不同。我們現在建立起一個機器學習系統,該系統包含歷史數據和實時數據,只要在有滴滴的地方,我們就知道車輛行駛的速度和路況。然后找特征,建立系統,也可用深度學習做路徑規劃和時間預估。

滴滴研究院最近建立了一套深度學習系統,然后加上路況和其他信息去進行預測,這是滴滴在深度學習領域的一次嶄新嘗試。簡單對比下結果,去年開始用機器學習再到最近的深度學習使誤差大概降低了70%左右。

接下來需要做最優匹配,這里有很多不同的方法。滴滴有出租車、快車、專車、豪華車等等多條業務線,滴滴能否把各個業務線打通?比如用戶叫了快車,但周圍可能沒有快車司機來接用戶,那有沒有可能利用算法去做決策,在這個時刻讓專車或出租車司機來接這位用戶,該調度方案要做一個全局的最優匹配,充分發揮滴滴優勢。

在北京,高峰期大家打車困難可能會認為是由于運力不夠導致,但經過分析發現,在高峰期滴滴的運力其實是足夠的,主要是因為車輛分布不合理。

滴滴研究院副院長葉杰平:揭開滴滴人工智能調度系統的真面目

此我們開發了一套系統,把整個地球分割成無數個六邊形。每一時刻都在檢測每一個六邊形,然后在某個六邊形里面計算訂單數和空車數,計算供需是否平衡。

運力問題解決

司機沒有在他應該在地方是我們需要解決的一大問題,如果有一個平臺可掌握所有信息,這樣使其能做出最優決策、最優調度以及導航決策。解決這個問題的第一種方法就是動態調價。我們也在探索另外兩種解決方式:

供需預測、運力調度:如何完成預測,我們先來還原一個場景,比如說某個大會大致在晚上 6 點結束后,很多人會有打車需求,這就是預測的一種體現。此外,我們之前也提到人們出行普遍是有規律的,所以能預測某一時刻、某一區域可能缺多少輛車,這樣我們就提前 15 分鐘或半小時做調度,把過剩的運力從周圍調過去,緩解供需問題。這里牽涉到供需預測,供需預測本質上就是一個時間序列的預測問題。

拼車:如果兩個乘客的行程和出行時間類似,就無需兩個司機去接,而是把兩個訂單整合為一個組合訂單,用一個司機來接。拼車中涉及到一項非常重要的問題就是用戶體驗:用戶體驗體現在兩個維度,一是價格便宜,二是在接另外一個人時繞的路程和時間不要太多。我們希望把兩個訂單整合起來后,這個行程路徑是相似的。為此,我們建立了幾個機器學習模型估計路徑匹配度的高低。

預測乘客體驗

行程結束后,我們也需要去預測乘客的體驗是好是壞。由于歷史訂單中有些乘客會進行投訴,比如說拼車匹配欠佳、繞路。而有些用戶則會給出好評。我們從大量歷史數據學習出來哪些特征是導致乘客抱怨的原因,哪些特征會導致好評。

拼車最核心的一點是定價,里面用的也是機器學習優化算法。核心想法非常簡單,如果乘客發了拼車單,我們會預測這個乘客起點到終點系統為它找到拼友的概率大不大,匹配度如何?如果預測出他很大概率自己一個人會從頭到尾走到底的話,折扣相對就會更低,反之則會高一些。

除此之外,我們也做了很多圖像方面的工作。比如駕照圖像檢測,識別證件號碼等,讓司機的很多手續無需要到滴滴辦公室即可解決。

評分系統

滴滴研究院副院長葉杰平:揭開滴滴人工智能調度系統的真面目

我們可以把滴滴看做是一種搜索引擎,即乘客搜索司機。與百度搜索信息不同,在百度搜索結束后,就沒有其他后續問題。但乘客在滴滴中搜索好司機后,滴滴需要保證安全和出行體驗。于是我們在近期引入一套機器學習系統,預測司機的服務質量和服務態度,衡量服務好還是壞需要通過分析大量乘客的打分、評語數據。

以往 滴滴和 Uber 都采用星級打分制,后來我們發現該功能并不完美?,F實情況是用戶要么不打分,要么給較高的五分或四分,使得星級評分功能不夠有效。

這本質上是用戶習慣問題,為了讓評分系統更加全面,平臺把乘客留下的所有痕跡都整合起來,然后給出一個分數評判。比如乘客打出星級后,又進行文字評價態度很差、繞路等,針對乘客給出的兩個維度信息,我們再根據軌跡等多項數據,然后給出綜合的分數。分數越高,滴滴也會保證司機的收入越高,推動司機主動提高服務質量。

這里存在另外一個問題,就是乘客惡意給司機寫差評。針對這一情況我們建立了一個判責機器學習系統,該模型能夠判差評的背后是司機的責任,還是乘客的責任。如果責任不在司機,我們就不會降低它的分數。判責系統上線后滴滴平臺司機滿意度有了顯著提高。

系統可視化

最后我們提一下非常重要的系統可視化性,這套系統能夠看到歷史訂單行程中發生了什么事情,如哪些區域是我們比較感興趣的、成交率高的,訂單多的。其次是區域變化情況,如早高峰時訂單量漲了,晚高峰訂單量跌了,應答率可能在早晚高峰非常低,平時可能非常高,我們可以迅速知道每個區域、每個時刻的情況。

上述為區域,我們也可以有一個城市的維度,比如這個城市大概有多少訂單?大概有多少司機?乘客發出訂單需求成交率大概有多少?我們也能掌握過去和現在的情況,司機實時看到熱區所處的位置,引導司機沿著熱區去走,減少空駛時間、提高平臺效率。

除此之外,我們也能實時看到跨城情況,尤其是春節之前等節假日,因為有很多人會拼車回家。為此,我們也會找到一些比較特殊的區域,單獨去分析它發生了什么事。

可視化系統也能讓大家看到全城各個時刻供需不平衡情況:哪些區域供大于求,哪些區域求大于供,哪些區域供需平衡,以及現在和過去發生了什么事。針對這些現象,我們需找到應答率低、成交率低的原因。

 

本文來自騰訊大數據峰會暨 KDD China 技術峰會,滴滴研究院副院長、密歇根大學終身教授葉杰平博士現場演講。

葉杰平:滴滴研究院副院長,美國密歇根大學的終身教授。葉杰平是機器學習領域國際領軍人物,其主要從事機器學習、數據挖掘和大數據分析領域的研究,尤其在大規模稀疏模型學習中處于國際領先地位。

作者:亞峰

來源:http://www.leiphone.com/news/201612/jKMwo56PIXS0f4Ea.html

本文來源于人人都是產品經理合作媒體@雷鋒網,作者@亞峰

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 把這個排隊派單問題想明白、描述清楚,已經很不容易了

    來自廣東 回復
  2. MARK

    來自北京 回復