前淘寶工程師談12306:做它比做淘寶難
如果把12306外包給IBM或者阿里巴巴來做,能否比現在做得好?
如果是以前,我肯定會回答:是。因為我們始終認為,一個年投入超3億元的賣火車票網站,沒有什么理由做不好吧?其實不光是小編這樣認為,包括眾多媒體,甚至專業人士都曾噴過12306,但近日一名前淘寶工程師通過科普的方式給了我們一記響亮的耳光:做12306網站難度遠高于淘寶。
我曾在淘寶寫過一段時間代碼,2012年在一家百強民企做電商副總,當時在極為艱苦的條件下帶隊開發了一個B2C網站,走支付寶和銀聯支付通道,年營業額千萬級。
在平時,12306也就是個正常的電商網站。但一到黃金周,12306就是一個全站所有商品都秒殺,所有SKU(庫存量單位,物流管理術語,編者注)都是動態庫存的變態。
媒體人噴12306,是他們不懂技術,沒有能力和耐心來分析背后的難度。技術人員噴,則是因為大部分的技術人員在短時間思考時,容易陷入過于樂觀的誤區。
至于12306一期工程3個億(含硬件)貴不貴我不評價,我只提供一個數字供參考,百度一年的研發費用(不含硬件)是10億,這個數字來自百度財報。網上能查到。3億看起來好大一個數字,真用到超大型的電商系統、搜索引擎系統里面,其實也不算什么天文數字了。
再解釋一下,為什么秒殺壓力大,以及為什么12306的動態庫存很復雜。
先說秒殺。
2013年12月25日前后,天貓搞了一個圣誕季積分兌換活動,持續幾天。25號上午10點12分,放出了15000個天貓魔盒,從成交記錄上看,是19秒內全部搶完。
實際上,我也參加秒殺了,我應該是5秒內答題完成并提交訂單,結果告訴我排隊的人太多,14秒以后重試。
我想,14秒以后哪還有我的事情呀,于是重新答題秒殺,結果出現了服務器錯誤的頁面。反復刷新幾次,就告訴秒殺結束了。
淘寶是什么技術水平呢,淘寶有至少4000技術人員,至少4萬臺服務器。以淘寶這樣的技術水平,也不能做到秒殺時讓每個用戶都沒有擁擠感,為什么呢?
一是要尊重物理原理。一臺服務器一秒鐘能承受的計算量是有極限的,任你怎么優化,采用多高效的算法和編程語言,都突破不了某個極限。
二是要考慮經濟效益。十一黃金周的時候,北京主城區到八達嶺長城的路堵得嚴嚴實實,但不能因為黃金周的高峰,就把這段路修成長安街那樣10車道的高速公路。
再說動態庫存。
淘寶秒殺天貓魔盒的時候,只有一個商品(行話叫做SKU),它的庫存是15000個。有一個人秒殺到了,庫存就減1,19秒賣完的,一秒要成功產生789個訂單。想象一下,你在廣場上賣火車票,一秒鐘有8萬人舉著錢對你喊:賣給我!
好了,講了這半天淘寶,可以說12306了吧?
我以北京西到深圳北的G71次高鐵為例,它有17個站,3種座位。表面看起來,這不就是3個商品嗎?G71商務座、G71一等座、G71二等座。大部分輕易噴12306的技術人員就是在這里栽第一個跟頭的。
實際上,G71有136*3 =408種商品(408個SKU),怎么算來的?請看:
如果賣北京西始發的,有16種賣法(因為后面有16個站),北京西到:保定、石家莊、鄭州、武漢、長沙、廣州、虎門、深圳……都是一個個獨立的商品,
同理,石家莊上車的,有15種下車的可能,以此類推,單以上下車的站來計算,有136種票:16+15+14…+2+1=136。每種票都有3種座位,一共是408個商品。
旅客A買了一張北京西(01號站)到保定東(02號站)的,那【北京西到保定東】這個商品的庫存就要減一,同時,北京西到石家莊、鄭州、武漢、長沙、廣州、虎門、深圳等15個站臺的商品庫存也要減一,也就是說,出一張北京到保定東的票,實際上要減16個商品的庫存!
這還不是最復雜的,如果旅客B買了一張北京西(01號站)到深圳北(17號站)的票,除了【北京西到深圳北】這個商品的庫存要減一,北京西到保定東、石家莊、鄭州、武漢、長沙、廣州、虎門等15個站臺的商品庫存也要減1,保定東到石家莊、鄭州、武漢、長沙、廣州、虎門、深圳北等15個站臺的商品庫存要減1……總計要減庫存的商品數是16+15+14+…+1=120個。
想象一下,8萬人舉著錢對你高喊:賣給我。你好不容易在錢堆里找到一只手,拿了他的錢,轉身找120個同事,告訴他們減庫存,而這120個同事也和你一樣被8萬人圍著;也和你一樣,每賣出一個商品要找幾十個人減庫存……這就是12306動態庫存的變態之處。比你平時買東西的任何網站的庫存機制都復雜幾十上百倍。
再說一下搶票插件,防機器人搶票,也不是加個圖片驗證碼那么簡單。驗證碼設置得復雜一點吧,人們要噴:這只是便宜大學生和辦公室白領,農民工連26個字母都認不齊,怎么搞?搞動畫驗證碼吧,也有人噴:視力不好的人怎么辦?最后驗證碼搞得太簡單了,皆大歡喜了,其實最高興的是開發搶票插件的公司。
以上討論只是把12306當成和淘寶一樣沒有歷史包袱從零起步的交易系統,實際上,它不是,它后面的票池,還有電話售票、火車站售票、代售點售票等多個傳統渠道要服務。除了客運服務,12306還有全國最大(很可能也是全球最大)的大宗物資貨運系統。
架空政策(包括定價政策、警方打擊黃牛政策、身份驗證政策)談技術,是不可能解決春運搶票困局的,要想讓春運的時候每個人在12306搶票都毫無擁擠感(但不一定能搶到票,鐵路運力擺在那),那就是逼著12306買一大堆服務器對付春運,春運過去后,成為跟amazon一樣牛逼的云計算服務商。和逼北京修一條10車道的高速公路去八達嶺長城一個道理。
目前的12306技術上是還有問題,比如,搶票高峰,輸入個身份證號和圖片驗證碼都卡得要死(本人親測),服務器端繁忙,你瀏覽器端卡什么呀?
但人家在進步。相信2015年春運的時候,技術已經不再是一票難求的主要問題。在鐵路運力不可能神速增加的情況下,要做到春運更公平地買票,需要靠政策調整。
本文作者 王強
技術難,UI和交互體驗,沒什么技術含量吧,小編這篇文章,看后,讓人惡心,只能說明你一直做的是業余的,我想如今好多三流的公司做的都是,這樣的產品。
12306要考慮的東西非常多。舉個例子上周我想買濟南到西安的火車,我選中的這個車次(T372)濟南到西安顯示無票,在濟南站的前一站章丘(離濟南很近的一個站)到西安反而有票。該列青島始發,先通過章丘,再過濟南,章丘到西安有,反而濟南到西安沒有呢?12306考慮的情況太多了,是一個無比復雜的工程,在每個城市站點放票數量應該都是有限的,會考慮其他車次的運行情況,考慮到更多人的長途情況,章丘到濟南這種短途無論如何也不可能提前買T372的。
實體經濟的很多系統的邏輯復雜度真真秒殺互聯網,不過很多互聯網人看不到而已~
最本質的原因是買票的人多,車票就那么幾張,無論多牛逼的系統,總有大部分的人買不到票!