支付系統設計:對賬處理(二)
可以說,對賬是支付系統最頭疼的事情。每一筆交易,都要做到各參與者的記錄能夠吻合,沒有偏差。對賬系統的工作,是發現有差異的記錄,即軋帳;然后通過人工或者自動的方式,解決這些差異,即平帳。
對電商系統來說,每一筆交易,在所有相關主體側都要能對得上:
- 交易主體,如果發起人是個人,必須能夠從個人交易歷史記錄中找到這筆交易。但大部分人不會保留電子記錄,所以一般是提供可以下載的賬單或交易記錄,讓用戶自己對去。
- 交易對手,一般是商戶。商戶側對賬處理同用戶側,也僅僅提供對賬單。
- 交易渠道側,這是對賬的重點,一是核實交易流水,二是核實交易傭金,畢竟是租用人家通道做結算的。
那有哪些記錄需要對賬? 目前主要是兩個:一個是交易記錄;一個是退款記錄。
對賬處理流程
一般來說,對賬流程涉及到如下步驟: 渠道對賬單下載、本地交易記錄準備、軋賬、平賬。
渠道對賬單下載
銀行,第三方支付,銀聯等,基本都會提供對賬單下載的功能。不過也有少數工作做不到位或者太到位的銀行,只提供賬單查詢后臺,不提供對賬單下載功能。
對開發人員來說,這里有幾個坑:
- 對賬單格式不一。文本,XML,csv的都有。為了后續能夠統一處理,在賬單下載完成后,需要進行標準化處理。
- 下載方式不一,HTTP,HTTPS,FTP的,都有。下載程序需要按照渠道的協議來處理。
- 下載時間不一,一般是凌晨1點后,到中午12才能用的也有。如果在預定的時間取不到數據,需要注意重試讀取。
- 穩定性差。FTP服務器出問題那是常有的事。渠道側解決方案往往就是重啟。所以重試機制是必要的。
看一下第三方支付的對賬單情況:
銀行直連的對賬情況:
技術選型上,HTTP(S)用apache httpclient即可實現鏈接池和斷點續傳, FTP也可以使用Apache Commons Net API。 但不管是哪一個,都需要設置重試次數和鏈接超時間。重試次數和間隔的設置需要小心,重試太頻繁,容易把服務器打死.;時間間隔太大,又會阻塞后續處理步驟。5~10分鐘是一個合適的重試間隔區間。
鏈接超時指在服務器出現問題時,連接在指定時間內獲取不到數據即自動斷開。這個很容易被忽略。我們有一次系統出問題,是渠道側的FTP假死后重啟,導致我們的客戶端掛住,一直在等待重新鏈接。
渠道對賬單標準化
找個例子大家看看, 比如微信的對賬單,他是csv格式的,包括如下信息:
- 交易時間:這是在微信側的支付完成的時間。 這個時間會成為一個陷阱。
- 公眾賬號ID,商戶號,子商戶號,設備號: 這些信息需要做驗證,確保是自己的單子,不要讓微信把老王家的單子也給發過來了;
- 微信訂單號,商戶訂單號: 這兩個是對單的核心。前者是微信側產生的訂單號,在微信支付接口返回值中有。但是萬一收不到這個返回值,那在本地記錄中可能就空了。 后者是我們發送給微信的訂單號,一般用這個來做對單依據。兩邊的數據中都會有這個值。
- 用戶標識,交易類型,交易狀態,付款銀行,貨幣種類,總金額,企業紅包金額: 這幾個就是對單的核心字段,必須確保雙方是一致的。
- 商品名稱,商戶數據包,手續費,費率:這些是可選驗證。
而某寶的對賬單,是文本格式的,用空格隔開。他們家的就簡單很多,只有商戶訂單號,交易流水號,交易時間,支付時間,付款方,交易金額,交易類型,交易狀態這些字段。
由于每個渠道的賬單格式都不盡相同, 在得到賬單后,下一步是對賬單做標準化處理,這樣軋帳以及后續工作就可以統一處理了。 標準化后的賬單數據可以放在文件系統或者數據庫中。這取決于交易數據量。每天百萬以上的量,還是使用文件系統,比較合適。數據庫操作相對比較慢,也浪費資源。
基于文件系統的標準化涉及如下內容:
- 文件格式標準化:統一使用csv或者json或者xml格式。如果是使用hadoop或者spark來對賬,使用csv是個不錯的選擇。
- 文件存儲統一化:文件目錄,文件名都需要遵循統一命名規范。
為了加快處理速度,我們使用hdfs作為文件系統,有利于后續的對賬的處理。
本地交易記錄準備
本地交易記錄的準備,總的來說有如下方法: – 啥都不做,直接用原始數據。鑒于大部分系統使用的是mysql,這也意味著在MySQL上做對賬。對賬時需要大量的數據查找工作,必然會影響線上業務。在數據規模較大,比如超過100萬時,就不太合適了。
- 當然,還有一個選擇是使用備庫來執行對賬,這樣既簡單,也不影響線上業務。這是典型的空間換時間的做法。
- 如果業務大到需要分表分庫才能處理,那對賬數據準備也不一樣。使用分庫也不現實,因為分庫一般是按照主體id,而不是渠道id,來分庫,這樣對賬就需要在多個庫上進行,效率反而降低了。而對分表分庫建立從庫也非常耗費資源。這種情況下,需要同步一份數據到(hdfs)文件系統中,或者NOSQL數據庫上。
由于交易記錄是支付系統核心數據,有大量的應用,如信用、風控等,都需要交易記錄數據。這些應用對交易記錄的需求還不完全一致,為了提升性能, 交易記錄會使用異步的方式來將數據投遞給使用方。 交易記錄在入庫時,投遞消息到消息系統中。使用方監聽這個消息,一旦收到新消息,則從交易記錄庫中查詢數據,獲取數據并更新到庫中。關于此類數據同步的文章不少,這里就不詳細介紹。
軋帳
軋帳是按照客戶訂單號來比較本地交易記錄和渠道交易記錄是否一致。從算法角度,是計算兩個數組的差異。在單機運行時,可以采用的算法不少,這里不詳細介紹。 我們推薦采用mapreduce來軋帳,這有個優勢,可以按照訂單號將渠道提供的記錄和本地記錄shuffle到同一個reduce處理上,這樣就可以很容易進行數據比對。 軋帳中最大的坑,莫過于切分點的問題。
比如以整0點為切分點,那存在一個問題,本地23:59發起的交易,到了渠道側,可能會在00:01處理,這一筆交易變成第二天的帳了。實際處理中,一筆交易在渠道側處理,花上幾分鐘都有可能。 對于切分點附近無法確認的帳,做一個時間窗,在時間窗內的數據,留待第二天對賬時繼續處理。
平帳
發現兩邊不一致的數據,那應該如何處理?數據量不大時,記錄起來,人工甄別就行。但如果數據量很大,每天上千條,人工處理就成本太高了。這個沒有統一的處理方法,需要根據有問題的數據,做個分析,然后做自動處理。 針對交易記錄的對賬的處理,主要有如下情況:
- 本地未支付,支付渠道已支付。這主要是本地未正確接收到渠道下發的異步通知導致。 一般處理是將本地狀態修改為已支付,并做響應的后續處理,比如通知業務方等。
- 本地已支付,支付渠道已支付,但是金額不同,這個需要人工核查。
- 本地已支付,但是支付渠道中無記錄;或者本地無記錄,支付渠道有記錄。在排除跨日因素外,這種情況非常少見,需要了解具體原因后做處理。
針對退款的對賬處理,主要有如下情況:
- 本地未退款,支付渠道已退款,則以支付渠道為準,修改本地為已退款狀態,并觸發后續處理。
- 本地已退款、支付渠道已退款,但是金額不同,需要人工核查;
- 本地已退款,但是支付渠道無記錄;或者支付渠道有記錄,但是本地沒有。 在排除跨日因素外, 這種情況非常少見,需要了解具體原因后做處理。
總之,對賬工作,即復雜也不復雜。需要細心,對業務要有深入的了解,并選擇合適的架構。
相關閱讀
作者:鳳凰牌老熊,程序員 & 架構師,來自中科大的本科,研究生在軟件所學習。先后在中科輔龍、三星(中國)研究院和國內一些大型的互聯網公司呆過。在中科輔龍公司負責電子政務內容管理系統建設,負責研發龍馭系列產品的研發,這款產品最終實施到2000多個電子政務網站上,期間也參與了一些支付反洗錢以及支付系統的建設。之后在三星中國研究院,負責自然語言處理(NLP)以及智能家居相關項目。智能家居項目在2014CES消費電子展上作為三星重點項目推介。2014年開始加入愛奇藝公司,負責數據倉庫和支付系統的建設。
本文由@鳳凰牌老熊(微信公眾號:shamphone) 原創發布于人人都是產品經理 。未經許可,禁止轉載。
消費券的發放和使用
1. 在收到支付成功回調后保留渠道支付成功時間,對賬時采用渠道時間來進行對賬;
2. 如果渠道側不提供成功時間,對賬時采用平臺時間與渠道時間進行對賬,對賬時平臺長款時間在接近日切點時可放到第二日進行對賬,如渠道長款可根據渠道ID到我平臺支付表中查詢,進行差錯狀態細化,有可能因為時間的差異此筆交易已成功;
3. 如果交易數據量大,可采用分批對賬,MAPA – MAPB 流水排序交易,已10萬數據分頁查詢為例先消耗完的數據進行下次分頁查詢,差異先統一存儲,所有數據對賬后進行整體處理;
4. 對賬產生的差異應針對渠道或平臺賬戶進行資金凍結,來保證對賬數據與賬戶數據一致性;
很有條理 很有用!干活滿滿
請問現在對賬思路都是 人工上傳賬單或者自動獲取賬單,然后找到業務訂單去對賬(賬單-訂單對賬),是否還有別的對賬思路呢
請問,現在第三方支付都要統一接入網聯,這些功能是否還需要系統自己實現呢
簡書上有人轉載你的文章,有標明轉載地址。是你自己么?還是朋友?http://www.jianshu.com/u/897526abf799
感謝 感謝,良心干貨篇,多謝
對于一個即將轉入支付系統的程序猿, 看到你的文章如沐春風, 感覺業務思路上清楚多了,多謝講解
我也是支付行業,很是喜歡你的筆記和感悟,對一個踏入新行業不久的新人來說,是一件值得慶幸的事情。
我想咨詢下,像這種交易單的下載通過支付寶,微信,銀聯借口就能直接下載獲取嗎?還是說是需要財務人員到相關的平臺將相關的賬單導出放到FTP,程序再定時獲取與本地的訂單數據來做核對呢?
請教一下:交易流水表,如何按照交易流水號來做分庫、分表的依據。這樣需要查詢某個用戶的所有交易流水,由于是按照交易流水切分,數據會分散在多個庫、多個表。展示起來,就需要跨庫、跨表查詢了。尤其是,要分頁展示某個用戶所有的交易流水。在支付寶上有。求教作者這方面,怎么處理?
按照用戶來分表分庫,流水號根據用戶ID來生成。
對于切分點附近無法確認的帳,做一個時間窗,在時間窗內的數據,留待第二天對賬時繼續處理。
–請教一下,這個時間窗如何設置?能大概講下?謝謝
點贊,好文。
“軋帳中最大的坑,莫過于切分點的問題”,這個對于沒做過的人,真的不見得注意到這個坑;
想起我們做通信的時候,一次正常的呼叫,有很多信令記錄點,比如起呼是一個信令記錄點,在23:59分發起; 接通是一個信令點,在00:01分發生; 這樣,起呼就在上一個時間點,接通在下一個時間點,當我們按小時來統計接通率的時候,這就悲劇了;
這個怎么統計比較好啊
前輩,解決切分點問題的時間窗是指什么呢?
好文!但是發現一個小小的瑕疵,“本地未退款,支付渠道已退款,則以支付渠道為準,修改本地為已退款狀態,并出發后續處理?!边@個地方是不是應該為“觸發”。
謝謝, 是筆誤。
以表敬意
太棒了,居然有一系列的分享,大神就是這樣
看到以前自己天天面對的業務,哈哈,還有些懷念呢。
現在面對什么業務
時髦的O2O,線下智能POS與線上結合
好文,希望能寫的更深入點,多舉一些實際場景 ??
良心文章
謝謝。