深度解讀:如何撬動政府數據搶占萬億市場
編輯導語:政府數據是政府在運作過程中采集到的數據,我們在日常辦事中會遇到,比如常遇到的身份認證、信息綁定等等,這就是政府數據的案例;本文作者詳細的分享了關于政府數據與如今各行業的發展與融合的思考,我們一起來了解一下。
筆者以前主要關注的是在金融科技行業相關的數據、場景及應用,持續觀察了解過程,發現這個行業的數據玩家的數據采集、數據使用及數據權屬非常不清晰,存在風險非常大,與政策的整體大基調是相悖的。
雖然2020年前都沒有明確的政策文件,但獵人基于一些相關的個人信息安全法等數據及信息安全條文,及基于任何場景的最終使用對象肯定會落實到人這一基礎點;無論是前期的數據采集及最終的數據的使用均需要自然人及法人的授權,而當時情況至少80%以上數據采集及數據使用未獲得用戶授權;最近幾年很多不合規的頭部機構倒閉或停掉相關業務,其實也在映證這一點。
這類頭部數據玩家90%以上屬于非備案、非征信、非官方機構,但卻做著合規機構的相似的業務,這個商業模式就存在非常大的風險。而與這些數據機構合作的正規機構業務由于核心數據產品均采用其數據為主,這些數據機構倒閉或數據不能服務都對正規機構核心數據產品業務直接停滯或風控能力大幅度降低,營收水平大大受挫。
而政府數據(國家擁有的數據,或者泛指政府擁有的數據,分為部委數據(全國性數據),地方政府數據(區域型數據))作為權屬最清晰,也是來源最合規的數據出口;在筆者的研究中發現,在這塊的定位、這類數據的服務平臺或產品應用服務公司,其實非常少。
但政府數據的一些基礎的市場化應用其實在我們日常生活都經常接觸到,是最直接的收益群體;例如身份證信息核驗、跨行綁定銀行卡信息核驗、手機號實名制識別等,這些產品其實也就是我們的政府數據應用案例,身份證信息核驗來自公安部、跨行綁定銀行卡信息核驗來自銀聯、手機號實名制識別來自運營商。
因此,筆者判斷政府數據的潛在價值有待釋放,特別是在金融科技行業,這個最需要合規安全的數據源的場景。
一、政府數據潛在價值體現
政府數據相信很多讀者都不怎么熟悉,這里各位可以先看下這些關鍵詞,感受下這些關鍵詞背后政府數據的價值所在。
我這里把這些關鍵詞,連成一段話給各位感受下:數據是第五大生產力,在我國數據中80%屬于政府數據,政府數據屬于新型國有資產,歸國資委管理。
國家正在大力推動數據要素市場化,引導數據交易在合規數據交易平臺上交易。數字經濟規模占GDP的3分之一,核心要素是數據。
數字經濟發展趨勢有“五化”:數字產業化、產業數字化、數字化治理、數據價值化及數據資產化。
二、政府數據是什么
政府數據的概念可以參考《深圳經濟特區數據條例(征求意見稿)》中的“公共數據”的定義:
“公共數據”是指本市各級行政機關和依法授權行使行政職能的組織以及具有公共管理和服務職能的企事業單位(以下統稱“公共管理和服務機構”)在依法履職或提供公共管理和服務過程中收集或產生的,以一定形式記錄、保存的各類數據及其衍生數據。
本條例所稱具有公共管理和服務職能的企事業單位包括但不限于本市行政區域內與人民群眾利益密切相關的教育、衛生健康、供水、供電、供氣、供熱、金融、電信、公共交通等企事業單位。
政府數據簡單理解為政府在運作過程中采集到的數據,這些數據因為政府相關部門職能的不一樣,采集到的數據維度類型也是不同的。
為了讓各位更直觀的了解政府數據的現有形態及情況,獵人通過比較熟悉的數據寶公司的政府數據矩陣給各位做個簡單的內容普及;數據寶作為全國在政府數據這塊的領跑者,已鏈接了近50家部委(全國約70家部委)的數據,我們通過數據寶的政府數據鏈接譜圖,來更進一步了解政府數據的情況,同時了解為什么政府數據能支持如何多的應用場景。
政府數據分散于各個部委、廳局委辦局的各系統中,由各部委、廳局委辦局各自保管,通過設定特定部門、成立全資子公司來對外提供數據出口。
數據寶作為全國范圍不足20家機構企業中擁有大數據資產交易資質的公司,現在鏈接的政府數據包括覆蓋14億人口的公安部數據,覆蓋全國73億+的銀聯數據,覆蓋全網的近16億手機用戶數據、覆蓋全國上億企業的相關數據、覆蓋全國31個省2億臺車的高速卡口數據、覆蓋全國全量車輛及全量駕駛證群體的數據,覆蓋8億+的鐵路用戶出行數據等——人車企三種類型均有相對較全面的覆蓋。
以上部委數據可以通過單個部委或多個部委數據融合形成產品再為數字經濟賦能。如我們使用的各種APP注冊實名時需要用到公安部和運營商的數據實現信息真實性判斷,我們綁定各行銀行卡時需要銀聯的數據能力支持跨行綁卡信息真實性識別。
我們申請貸款時,個人貸款需要社保公積金數據,需要人社部門的數據支持;申請企業貸款時,需要央行征信及稅務局的數據支持;如果沒有這些政府數據的開放支持,很多業務都無法正常運作及對外服務,所以政府數據的開放程度及維度在一定程度上直接決定了企業能提高什么服務及提供服務的效率是高還是低。
三、政府數據與其他類型數據的區別
行業內的營銷部門、風控部門及渠道采購部門可能接觸較多的數據有企業數據、公開數據及個人數據。
1)企業數據:主要指企業在正常運營過程中,通過為客戶提供產品及服務,合規合理有度的采集到并留存下來的客戶自動提供或被動獲取的相關數據,及整個運營過程中各類產品及服務產生的其他相關數據。行業內的巨頭數據量級及維度都是領先,因此其在業務服務類型及能力上都遠超其他跟隨者,企業業務覆蓋人群越廣,能積累的數據也越多,形成良性循環;而體量不夠大的企業,只能做垂直細分場景。企業數據用的好的機構如阿里的借唄花唄、京東的白條產品等。
2)公開數據:簡單理解為我們從搜索引擎能搜索到的及各類網站上公開的信息,當然有一大部分公開數據屬于政府公開的數據;公開數據的數據積累的核心要點在于該企業掌握的爬蟲引擎能力的強弱,因此爬取公開數據經常需要與目標網站做技術對抗;雖說很多網站的數據都是公開的,但這些網站的數據搜集起來也是不容易的,他們也不希望辛苦積累的數據被其他公司輕易爬走。公開數據用的較好的機構如天眼查、企查查等。
3)個人數據:個人才有的或能夠在特定場合提供的信息數據,例如線下貸款填表填的一些信息。
而政府數據比較特殊,政府數據按照相應的整體方針的規劃,分三類,無條件開放-公開數據、有條件開放-脫敏授權、不允許開放-涉密數據。
政府數據的價值為什么大,最簡單的原因是,政府掌握大部分的企業經營數據、公開數據大部分是政府公開的數據、政府數據涵蓋了大部分的個人數據;政府數據沒覆蓋的是企業運作過程中比較隱秘的未公開數據、個人私有的獨特數據。
四、政府數據市場化核心三步走
政府數據是個寶藏,但至今還是在市場化開放的起跑線上,屬于初步階段。
原因是大部分的政府數據都是沒經過標準化處理的,還停留在信息化內部使用階段,能夠市場化的數據少之又少,同時政府部門也沒有專門的團隊去專門研究這個事情,因此政府數據到市場這個過程是有很大一塊工作需要處理的。
2020年新基建的大力發展,很多的政府機構都在積極響應,而各種智能城市大腦建設的大廠也在積極為政府數據做數據治理相關工作,打好數據基礎;但實際情況是,這些大廠能實現的其實是升級版的政府信息化,達不到政府數據市場化的要求,因為這不是個簡單的技術活,而是實打實的數據應用創新變現的活。
這里以數據寶為全國交通部數據從治理到應用變現的全生命周期過程總結的方法論來了解下政府數據市場化的核心三步走是個什么情況。
數據寶內部總結出來的政府數據市場化三步走叫做“商品化三級治理”,一級治理主要目的是實現基礎化治理,使各政府部門各類系統匯集的數據達到有序化;二級治理的主要目的是合規化治理,達到政府數據共享開放標準,并實現數據安全分級分類;包括行業的一些大廠在為政府提升數據治理時也只能做到二級治理,也就是建立各種數據資源目錄。
而數據寶掌握了特有的第三級治理,商品化治理,針對數據應用場景,實現政府數據資源商品化,達到市場可交易變現的標準。通過定目標、定角色、定任務、定機制、定流程及定考核來保障全流程。治理后的政府數據將獲得以下屬性:數據權屬清晰、標注充分、全面安全屬性、能跨網安全流轉及實現商品化應用——這也是政府數據市場化前必須實現的步驟。
五、政府數據市場化案例-交通部
交通部掌握了全國31個?。壳拔鞑睾秃D咸厥庠驘o有效數據),2億臺車(乘用車及運營車),覆蓋12000個高速出入口站點,25000多個ETC門架,數據量級達數百億級。
2020年的主要數據如車牌號都是通過攝像頭拍攝提取,各省站點建設之初,建設的攝像頭能力不一;同時由于各種現場環境因素如天氣、位置、燈光等導致采集數據會產生缺失或誤識別,這類原因導致的各種臟亂數據非常多,無法直接市場化。
因此需要三步走,先進行數據有序化治理,實現數據標準基礎化,然后各省間數據共享比對,進行數據有效優化;同時也能促進各省部門積極采集及共享數據,同時按照交通部的治理反饋優化內部采集流程提高區域數據采集質量;最后通過商品化產品打造流程,將數據維度按照場景需求進行拆分,結合各自模型能力實現相應的產品形態。
六、政府數據賦能產業潛在市場規模
國務院《促進大數據發展行動綱要》目標要求,大大加速了大數據行業的發展,2015年底我國大數據核心產業規模是696.7億元,2017年達到1335億元,到2020年爆發式增長到1萬億元;到2020年,我國大數據關聯產業產值將達到10萬億元,大數據融合產業產值將達到20萬億元。
金融科技僅是數字科技的一個提前發力的板塊,但不是全部。整個大數據產業分為核心產業、關聯產業、融合產業,每個細分產業都是10萬億以上的潛在規模;金融科技板塊的發展路徑,數據融合創新思路等方面的經驗均可以作為我們研究其他產業科技的發展路徑及數據融合創新應用思路的借鑒。
七、政府響應數據市場化開放具體表現
截至2019年,全國已有23個省份成立省級大數據管理機構,超過20個城市成立市級大數據管理機構。
當下各級政府正在如火如荼地推進的智慧城市建設,大數據無疑更是關鍵中的關鍵;然而,從各地智慧城市、數字政府建設的具體實踐來看,最大痛點和瓶頸也正是數據的匱乏;各地大數據匱乏的核心癥結在于各級部門未能充分認識到大數據的重要性,缺乏匯集大數據的意識和動力,而關鍵則是缺乏相應的大數據相關機構。
大數據管理局的成立表明,當地政府已充分認識到大數據的重要性,專職機構的設立也能真正敦促各級各部門更重視大數據建設;各級政府機構擁有海量的原始數據,如氣象、人口、環境、土地等公共數據,安全、海關、旅游等管理數據,教育、醫療、金融等服務數據,這些構成了社會發展與運行的基礎。
當數據在具體的政府單一部門時,產生不了任何價值,但如果將這些數據進行關聯分析,將產生巨大的社會價值和經濟效益,但是由于各級各部門從部門利益出發,寧愿讓數據爛在自己手中也不愿意共享數據;這一方面導致了一個個的“數據孤島”,難以實現數據的互聯互通。另一方面相互割裂的數據事實上根本不是大數據,只能被稱為“小數據”。
例如,工商數據在工商部門,金融數據在金融辦,醫療數據在醫療部門,房屋數據在房管部門,教育數據在教育部門;而通過新設立的大數據管理局,通過有效措施切實打破各部門之間的“數據孤島”,數據聯網之后則數據可以在各個部門之間同步交互、共享,一個市民在房管部門住房狀態的改變可以同步到公安部門,這樣不僅能夠提升效率,而且能夠幫助相關部門提升現代治理能力。
政府內部在打破“數據孤島”,這個過程會促進區域政府數據的匯集,區域政府數據的匯集最終流向部委。
八、政府數據市場化開放進程
政府數據的市場化在2001年就已經在初步嘗試了,但整體進展到了2020年還是相對較慢;而企業類、公開類數據的市場化路徑及進展非???,但主要也是得利于互聯網金融野蠻生長對數據的需求,用數據換時間,用時間換效率,用效率換規模,簡單點就是:數據=規模。
1. 公安部
應該算是最早的進行市場化政府部門了,2001年3月27日,中央機構編制委員會批準公安部成立“全國公民身份證號碼查詢服務中心”(以下簡稱“中心”),負責建設、管理和運營 “全國公民身份信息系統”,為政府部門、社會各界及人民群眾提供公民身份信息核查和統計分析服務,2003年才正式對外運行(該中心應該算是公安條線數據市場化初期出口了,但其實該系統類似公安部門的對外服務平臺,實際的數據總控權應該在公安一所)。
主要的推動力是:2000年4月1日起由國務院頒布施行的《個人存款賬戶實名制規定》確立了我國的儲蓄實名制。
按照個人儲蓄實名制的要求,凡居住在國內的中國公民,在金融機構開立個人存款賬戶或在原賬戶上辦理第一筆存款時,提供的實名證件包括居民身份證、戶口簿等;假身份證、假文憑等各種假冒證件制假技術簡直到以假亂真的地步,儲蓄網點一線的人員普遍沒有接受過證件真假的鑒定培訓,對儲戶提供的實名制規定的身份證、戶口簿等各類有效證件,是難以通過肉眼來辨別真偽的,公民身份信息核查服務將為存款實名制的有效落實提供保障?!拘袠I發展對政府部門的數據需求推動了政府數據市場化】
2. 銀聯
于2002年3月成立了中國的銀行卡聯合組織——中國銀聯,開啟了我國銀行卡產業聯合發展的新篇章。
2006年2月27日,中國銀聯總裁助理衛國在北京透露,雖然反對質疑之聲不絕于耳,但銀聯針對跨行查詢的收費計劃并沒有改變;中國銀聯對跨行查詢收費鐵定將在2006年上半年正式實施,每筆收費1角。
主要推動力:為了促進銀行卡的聯網聯合,1993年我國啟動了“金卡工程”,到2000年,陸續建立了18個城市銀行卡交換中心和一個總中心,部分實現了當地城市的同城跨行通用和部分城市之間的異地跨行通用。
隨著聯網通用的推進,社會接受銀行卡的程度越來越高,產業的發展需要更為強大的同心力和推動力;經國務院同意,在中國人民銀行的直接組織領導下,各商業銀行聯合起來,在合并全國銀行卡信息交換總中心和18個城市銀行卡中心的基礎上,由中國工商銀行、中國農業銀行、中國銀行、中國建設銀行、交通銀行等銀行卡發卡金融機構共同發起,于2002年3月成立了中國的銀行卡聯合組織——中國銀聯,開啟了我國銀行卡產業聯合發展的新篇章。
3. 央行征信
2004年4月,人民銀行成立銀行信貸征信服務中心;2004年12月15日,個人信用信息基礎數據庫實現15家國有和股份制商業銀行,8家城市商業銀行在重慶等7個城市的試運行。
2006年1月16日,人民銀行召開新聞通氣會,宣布個人信用信息基礎數據庫正式運行;2006年6月底,企業信用信息基礎數據庫實現了在所有中資、外資商業銀行和有條件的農村信用社全國聯網運行。
2010年9月9日,國家發展改革委員會以《國家發展改革委關于中國人民銀行征信中心服務收費試行標準等有關問題的復函》(發改委價格[2010]2071號)正式批復中國人民銀行征信中心自2010年10月1日起試行收費。
主要推動力:隨著經濟市場化程度的加深,加快企業和個人征信體系建設已成為社會共識。
2002年11月8日黨的十六大報告明確提出要“健全現代市場經濟的社會信用體系”,十六屆三中全會明確提出“按照完善法規、特許經營、商業運作、專業服務的方向,加快建設企業和個人信用服務體系?!睖丶覍毧偫砻鞔_指示,社會信用體系建設從信貸信用征信起步,多次強調要加快全國統一的企業和個人信用信息基礎數據庫建設,形成覆蓋全國的信用信息網絡。
2003年,國務院“三定方案”明確賦予人民銀行“管理信貸征信業,推動建立社會信用體系”的職責。
2007年召開的全國金融工作會議進一步提出,以信貸征信體系建設為重點,全面推進社會信用體系建設;2007年2月27日,國家質量監督檢驗檢疫總局與中國人民銀行宣布,國家質檢總局將向人民銀行、商業銀行等企業征信系統的使用者提供組織機構代碼信息的在線實時查詢服務。為進一步發揮人民銀行在社會信用體系建設作用,2008年,國務院將人民銀行職能調整為“管理征信業,推動建立社會信用體系”。
4. 企業組織信息
全國組織機構代碼網絡系統于2000年建成并投入使用,當時已經建立包含了我國1400萬組織機構信息的中央數據庫;質檢總局提供查詢的信息包括組織機構代碼標識及其相關的機構名稱、工商注冊碼、機構地址、法定代表人姓名、組織機構代碼證辦理機構名稱等共計33項信息。
2007年2月27日國家質量監督檢驗檢疫總局與中國人民銀行宣布,國家質檢總局將向人民銀行、商業銀行等企業征信系統的使用者提供組織機構代碼信息的在線實時查詢服務,這為核實“企業身份”和信息整合提供了必要的基礎。
主要推動力:組織機構代碼標識制度是一項重要的社會管理制度。它對我國每個依法成立的企業、事業單位、機關、社會團體及其他組織機構賦予一個唯一的、始終不變的代碼標識,并以此為基礎建立起了國家層面的組織機構全集信息庫。
與人民銀行打通原因,主要是因為組織機構代碼實時查詢有利于落實企業賬戶實名制,擴大信貸,打擊詐騙、洗錢等金融犯罪活動,并能夠更好地滿足中小企業和低收入人群的融資需求,加快社會信用體系建設。
5. 社保公積金
2013年度社會保險個人權益記錄單可登錄市人社網查詢和打印了。
主要推動力:《社會保險個人權益記錄管理辦法》已經人力資源和社會保障部第67次部務會審議通過,現予公布,自2011年7月1日起施行。
第四章第十四條社會保險經辦機構應當向參保人員及其用人單位開放社會保險個人權益記錄查詢程序,界定可供查詢的內容,通過社會保險經辦機構網點、自助終端或者電話、網站等方式提供查詢服務。
6. 企業信用信息
全國企業信用信息公示系統(國家企業信用信息公示系統)于2014年2月上線運行。公示的主要內容包括:市場主體的注冊登記、許可審批、年度報告、行政處罰、抽查結果、經營異常狀態等信息。
主要推動力:本系統信息公示依據《中華人民共和國政府信息公開條例》、國務院《注冊資本登記制度改革方案》?!吨腥A人民共和國政府信息公開條例》經2007年1月17日國務院第165次常務會議通過,于2007年4月5日成文,2008年03月28日發布,自2008年5月1日起施行。
7. 信用中國
2015年6月1日,“信用中國”網站正式上線運行,網站的開通對于貫徹落實黨中央、國務院關于加強社會信用體系建設的要求,推動各省級信用門戶網站互聯互通,歸集發布各地區、各部門可向社會公開的信用信息具有重要意義。
網站向社會公眾提供“一站式”的查詢服務,日益成為社會信用體系建設領域溝通社情民意、推進信用信息公開的“總窗口”;下一步將推進“信用中國”網站改版升級,進一步強化網站信用信息共享服務功能。
網站的建設采取政府與社會力量合作的創新模式,充分利用了百度公司最先進的大數據、云計算、搜索引擎等技術,面向全社會開放信用信息查詢功能,打造信用信息的“一站式”查詢平臺。
8. 運營商
2006年左右就開始嘗試推動電話用戶實名制。
2009年4月印發的《第三代移動通信服務規范(試行)》指出,電信業務經營者依照法律和有關規定對用戶資料負有保密義務,未經用戶同意,不得將用戶信息用于查詢服務或提供給第三方,不得泄露、刪除、篡改用戶信息。刑法也就類似問題給出懲罰措施,在一定程度解決了運營商層面的用戶信息安全問題,給提供實名信息的用戶吃了定心丸。
2010年手機實名制從討論開始走向操作。
2013年工信部下發了《電話用戶真實身份信息登記規定》對實名制進行了規定。
2016年實現100%實名制。
主要推動力:為了有效打擊電信詐騙犯罪,工信部發文要求各家運營商必須從嚴從快全面落實電話用戶實名制,必須在年底前實現100%的實名率;“各基礎電信企業要加快推進未實名老用戶補登記,在2016年底前實名率達到100%?!痹谝幎〞r間內未完成補登記的,一律予以停機。
對于新入網的電話,工信部要求運營商嚴格落實用戶身份證件核查責任,采取二代身份證識別設備、聯網核驗等措施驗證用戶身份信息,并現場拍攝和留存辦理用戶照片。通過網絡渠道發展新用戶時,要采取在線視頻實人認證等技術方式核驗用戶身份信息。
9. 交通部
路網中心的貨車北斗數據-中交興路車聯網科技有限公司于2009年承擔了交通運輸部“全國重點營運車輛聯網聯控系統”工程中的“省級重點營運車輛公共服務平臺”,為15個省級運輸管理機構提供重點營運車輛監管服務,同時為全國各省重點運輸企業提供營運車輛監控服務;目前,聯網車輛已超過500萬輛,成為我國首個跨地域、跨車廠、跨平臺、聯網車輛數量最大的車輛聯網應用與服務平臺,是全球最大的在營車聯網系統。
全國高速卡口數據2019年底左右才算正式對外提供服務,主要由貴州數據寶網絡科技有限公司為交通部提供31個省涵蓋全量貨車及乘用車高速卡口通行數據對外市場化服務。
主要推動力:路網中心的貨車北斗數據主要是中交興路承建了系統,針對兩客一危的監控需求,同時實現了對外市場化;而高速卡口的市場化,其中一個原因是2016年交通部為深入貫徹落實黨的十八大和十八屆三中、四中、五中全會精神,按照黨中央、國務院決策部署,遵循以目錄管理數據資產、以共享促進數據融合、以開放實現數據增值的總體思路,堅持需求導向和問題導向,加強統籌協調,激發市場活力,著力突破運輸大數據發展機制與技術障礙,提升行業數據資源開發利用價值。
在2016年通過了《關于推進交通運輸行業數據資源開放共享的實施意見》,期望在3-5年時間實現以下目標:
- 建立健全行業數據資源開放共享體制機制,基本建成協調聯動、高效運轉的行業數據資源管理體系。
- 完善行業數據資源開放共享技術體系,建立互聯互通的行業數據資源開放共享平臺。
- 圍繞科學決策、精準治理、便捷服務等重點需求,開展一批跨部門、跨地區、跨領域協同應用的試點示范。 【政府部門的數據市場化開放程度可以促進新型行業場景服務形態的創造】
九、政府數據產品化標準路徑
政府數據類型如此多,數據量級如此大,商業場景也各式各樣,如果將政府數據打造成市場愿意買單的產品服務,這個過程如何實現?
這里獵人總結了一套簡單的標準路徑-政府數據的產品化標準路徑,其經過市場驗證,最有效的方式是從市場需求反推產品形態。
首先確定客戶類型,數據產品的最終買單對象是企業還是政府機構,而服務這些客戶使用數據產品是為了滿足企業端業務,還是為了服務C端客戶或者服務政府企業。
確定好業務對象后,為了降低研發成本,提高研發效率及數據的利用程度,一般會將接觸到的各種業務場景的共性及個性需求提取出來,按照過往經驗或對業務理解,進行數據源類型及數據字段的篩選,這個篩選過程會對數據進行細化,權重調整,模型確認,出入參設計及響應參數同步,最后按照客戶希望的產品形態進行封裝,有API接口、模型評分、模型報告的簡單形態,也可以是SAAS平臺對外服務或者形成綜合解決方案。
政府數據產品的買單對象80%以上是企業客戶,調用量與企業互聯網業務量級正相關,金融行業調用量普遍高于其他行業。
一是因為金融行業機構有錢,也重視風控,這些場景需要大量的外部數據支撐業務,控制風險,其對應的數據應用團隊、技術團隊也更成熟,市場培育難度較小。
其次是保險行業,保險行業因為互聯網轉型的原因,很多業務都通過線上進行,同時業務量的增加,導致其對保險投保風控的要求也大大增加,數據需求也隨之增長;而其他行業如物流行業、汽車行業,甚至一些政府機構都在借鑒金融科技的那套邏輯,結合行業自身的轉型需求,對數據產品的需求也不斷增加。
而政府則更多的是在賦能企業,優化民生服務,提升服務體驗等,這些均需要內外部數據的多源融合才更有利于實現;要知道現在的各類政府都是區塊化網格化管理,政府部門間的數據共享也并不通暢,更別說對數據如何應用于相關的業務場景中了。
十、政府數據的大數據風控場景產品化思路
大數據風控是各行各業都需要的通用需求,用一句話來表示這個至少百億級的市場規模需求,通過運用大數據這個原材料,通過構建模型建設的技術方式,對某目標人群,放在借貸場景則為借款人,放在保險場景則為投保人及被保人,對這目標人群進行風險控制和風險提示。
大數據風控需要有場景承載需求,需要有技術支撐場景服務,但如果沒數據,最終還是無法形成服務閉環。所以數據從哪里來?
80%的數據在政府手中,如果以前使用了1%的政府數據及大部分企業數據就可以基本滿足場景業務需求;那現在如果使用的政府數據提升至甚至更多的政府數據,那這類公司的業務肯定是可以跑的更快的。
1. 個人金融風控場景應用需求及政府賦能產品形態
這里拿出很久之前梳理金融科技在個人金融風控場景的全流程圖,每個流程環節主要用到的數據類型都標注出來,忽略掉一些比較偏技術的內容,其實可以看得到圖上。
反欺詐環節:需要能夠識別用戶欺詐行為的數據,例如虛擬手機號,虛擬IP,虛擬設備等,有些情況也會疊加使用強區分數據如公安部才有的在逃、黃賭毒等用戶數據;當然由于這部分數據屬于非常敏感的數據,能用的場景及行業都是特定的。
用戶身份核驗環節:這類主要是對用戶身份證、綁定的銀行卡及提供的手機號,信息是否準確,是否是本人所有。為什么這塊數據只有也只能公安部、銀聯及運營商提供,因為他們分別掌握了最全的身份證數據、銀行卡數據及手機號數據;而專注通過緩存數據庫非合規服務機構,為相關企業服務時,由于身份證信息更改未更新,銀行卡號碼銷號無效未更新,手機號轉網或實名更換等潛在數據服務風險,無法為企業精確識別這類無效客戶,后續為這類客戶提供服務特別時金融服務時存在較大的資金損失風險。
用戶授權信息獲?。哼@塊一般需要用戶提供相關賬號及密碼信息,服務機構提供相關技術工具,使用用戶提供的賬號信息,繞過官方網站防御機制,從官方網站里獲取風控需要的相關數據,當然正常情況是能收集到的都會被收集;這種方式現在基本不允許再這么粗暴使用,所以現在基本要使用都需要經過官方數據資源方授權特定場景使用;銀行系多頭借貸數據從央行征信獲取,互聯網金融多頭借貸從百行征信或相關協會可以獲??;金融畫像一般指支付行為相關的數據,一般只有銀行和支付公司有。其它的按照字面意思,應該都不難猜到是什么部門的數據了。
基本上以上數據齊全后,就可以進行相關的建模,業內常見的就是申請評分卡、行為評分卡、授信模型及分層模型等,大體上就是為了更好的通過模型算法將用戶的各類數據進行交叉關聯分析及應證,得出用戶資質及潛在風險。
風險預警:風險預警其實主要通過用戶實質風險變動及行為風險體現實現,實質風險變動簡單理解為可以通過在公安部、央行征信、信用中國等地方用戶是否從“好”人變成了“壞”人,這個變化無法通過模型算法實現識別;而行為風險體現,可以從還款行為、異?;顒榆壽E及非常態行為變化等去進行預警。
2. 保險創新場景應用需求及政府賦能產品形態
這里再舉個保險行業細分場景-物流行業貨車保險產品創新場景。整個產品創新環節分五大部分,這里選擇性分享。
針對產品設計環節,可以通過企業針對內部數據透視挖掘潛在客戶需求,如貨車去程有貨物可以賺錢,但回程大概率是空載,回程高速費、油費等成本高,那針對這部分群體是否有針對回程空載減少損失的保險需求;針對這個設想則可以找到需要滿足這個需求的數據支持,如是否空載可以通過高速卡口的治超稱重系統記錄的貨車載重情況判斷。
保險創新除了這塊空載的判斷完畢后,在承保的認證場景可以用公安部、銀聯數據及運營商數據核驗貨車司機基礎的身份信息、投??ㄌ枩蚀_性及手機號是否本人實名;核保場景可以用交通部、公安部、物流信息中心數據綜合實現掛靠識別、非空載識別及投保資質識別;定價環節可以綜合使用交通部、氣象局及中保信等數據。
針對理賠環節:反欺詐及賠付同樣可以從交通部、氣象部及工信部等數據實現。
3. 疫情防控常態化場景應用(健康碼)的政府賦能邏輯
政府數據在政府賦能民生的場景,以新冠疫情期間必使用的健康碼應用產品為例,健康碼是多源政府數據融合的一個非常成功的防控產品,為我國疫情防控,人口安全流動提供了識別保障。
健康碼的使用,一般只要通過微信或支付寶的小程序就可以找到各城市的健康碼,人臉識別及身份認證即可得到健康碼顏色,顏色代表用戶當時的綜合數據計算得出的健康結果。
健康碼數據融合了個人基本身份信息、自動上傳的健康數據、最近就診數據、移動設備位置數據及鐵路航空等出行數據。這些數據分別在公安部、戶籍中心、衛健委及三大運營商里。
十一、政府數據全域賦能應用思路延展
接下來,我們通過大數據應用圖譜來了解包括政府數據在內的各類行業場景應用。
按照行業場景區分:
- 工業大數據應用包括:工業物聯網大數據應用、產品精準營銷大數據應用、工業企業供應鏈優化大數據應用、產品故障診斷及預測大數據應用等。
- 文化旅游大數據應用包括:景區大數據應用、酒店大數據應用、餐飲大數據應用等。
- 農業大數據應用包括:精準農業、農產品安全溯源大數據應用、農產品物流大數據應用、農村電商大數據應用。
- 交通大數據應用包括:出行大數據應用、LBS大數據應用、交通規劃大數據應用。
- 金融大數據應用包括:保險大數據應用、銀行大數據應用、風控大數據應用、企業融資大數據應用、互聯網保險大數據應用、證券大數據應用。
- 能源大數據應用包括:電力大數據應用、煤炭大數據應用、風熱大數據應用、光伏大數據應用、油氣大數據應用。
- 醫療大數據應用包括:醫療健康保險大數據應用、基因檢測大數據應用。
- 運營商大數據應用包括:流量運營精準化大數據應用、客戶服務大數據應用、運營商大數據資產運營大數據應用。
- 互聯網大數據應用包括:電商大數據應用、輿情大數據應用、競爭情報大數據應用、社交媒體大數據應用。
- 企業大數據應用包括:生產大數據應用、營銷大數據應用、運營決策大數據應用。
以上行業場景大數據應用除了需要理清及用好企業內部的數據,同時必須引入并融合政府數據,開啟“上帝視角”,通過政府數據實現行業巨頭數據壟斷的壓迫圈。
須知80%的數據掌握在政府手上,因此要論數據應用的普適性,沒哪類數據可以超越政府數據的應用范圍。
以下為按照政府性質及其運營過程獲得的數據進行應用區分,可以大概歸類為下列應用:檔案大數據、住建大數據、林業大數據、國防大數據、司法大數據、紀檢大數據、園林大數據、民防大數據、住房公積金大數據、反恐維穩大數據、智慧社區大數據、智慧景區大數據、社會信用大數據、城市管理大數據、節能減排大數據、多規合一大數據、精準招商大數據、市場監督大數據、綜合應急大數據、精準扶貧大數據、綜合治稅大數據、地理空間大數據、航運大數據、金融監管大數據、工商大數據、衛計大數據、旅游大數據等。
單個部委的數據可以延伸出單個或幾個有限的應用,而多個部委的數據可以按照一定的規則進行融合,融合產生的應用組合方式種類隨著部委及其擁有的數據維度量級提升呈網絡效應的爆發式增長,融合應用在單個場景的價值也因為政府數據的融合而遠超其他類型數據應用能力。
誰掌握了最多的穩定的可用的政府數據使用權,誰掌握了最多的政府數據變現應用場景,誰掌握了最多的政府數據應用邏輯及經驗,則將在政府數據市場化這個新賽道上遙遙領先;而搶先應用政府數據結合企業自身業務,打造以政府數據融合企業業務數據的新型產品服務應用,將是其可以PK巨頭服務能力的唯一出路,以在壟斷的市場中找到新的突破點,獲得更多的市場份額。
在大數據行業混,“數據+技術+場景”三位一體才能持續發展。
#專欄作家#
大數據獵人,微信公眾號:大數據獵人,人人都是產品經理專欄作家。多年金融科技行業相關戰略研究、行業分析、商業模式及產品體系研究經驗,擅長政府數據+企業數據+公開數據多源數據融合流通交易及應用
本文原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議
政府數據的采集,標準化是第一步,數據簡單的封裝是第二步,打造基于場景的應用是第三步,如何安全合法的數據能力是終極路線。隨著國家對于安全法的新規,現在很多場景,個人數據的輸出都需要個人強授權,拿不到授權,大數據的威力會下降很多,如何安全合規的輸出是終極問題。
專業,感謝分享
政府的數據都是有很大背景的公司才能挖掘
精彩,大有啟發!