隱私計算,新能源汽車“安全上路”的“救命稻草”?

1 評論 6668 瀏覽 8 收藏 23 分鐘

編輯導(dǎo)語:隨著移動生態(tài)的進一步成熟,車聯(lián)網(wǎng)的數(shù)據(jù)安全一事也被提上了日程,而未來若想在數(shù)據(jù)安全方面有所保證,隱私計算也許會成為移動生態(tài)發(fā)展的一個重要突破口。本篇文章里,作者就隱私計算一事做了分析,不妨來看一下。

韓愈《早春呈水部張十八員外》中“天街小雨潤如酥,草色遙看近卻無”一語道盡早春草色。小草一株怎能代表早春生機,綠意一片方顯春意盎然。恰如數(shù)據(jù)科學(xué)家維克托·邁爾·舍恩伯格所言,“大數(shù)據(jù)讓我們更清楚地看到了樣本無法揭示的細節(jié)信息”,從IT(信息科技)時代進入DT(數(shù)據(jù)技術(shù))時代,數(shù)據(jù)石油價值日益凸顯。

移動互聯(lián)網(wǎng)十年黃金時代已過,下一個移動生態(tài)很可能來自“四個輪子”,去年4月特斯拉宣稱其自動駕駛數(shù)據(jù)累計超過30億英里(約48.2億公里),遠遠超過微博創(chuàng)立10年的數(shù)據(jù)累積量。車聯(lián)網(wǎng)日漸成為車企競爭焦點,數(shù)據(jù)頻繁跨境、跨系統(tǒng)、跨生態(tài)圈交互,然而數(shù)據(jù)泄露,隱私不“隱”,數(shù)據(jù)孤島廣泛存在,衍生問題也橫亙在前。

如何保證車輪上這臺電腦能在瘋狂的數(shù)據(jù)世界保持思考、判斷并作出正確決定?

10月份發(fā)布的車聯(lián)網(wǎng)數(shù)據(jù)安全規(guī)范,極大地約束了車聯(lián)網(wǎng)數(shù)據(jù)的使用和保護方式。特斯拉的跨境、滴滴事件等同樣鞭打著車企數(shù)據(jù)合規(guī)問題。實現(xiàn)車企從“孤軍奮戰(zhàn)”走向“合作共贏”,確?!皵?shù)據(jù)不出車、數(shù)據(jù)不出國”同時實現(xiàn)數(shù)據(jù)共享、安全和隱私?應(yīng)該說隱私計算是目前助力新能源汽車“安全起飛”的“救命稻草”。

一、區(qū)塊鏈隱私保護兩大領(lǐng)域四大象限,各類隱私計算技術(shù)均有其更加適用的場景

隱私保護技術(shù)是區(qū)塊鏈一個重要的發(fā)展方向。在技術(shù)層面,既有利用加密存儲、去標識化、身份認證等“老辦法”嚴防數(shù)據(jù)泄露、篡改和不當使用,也有應(yīng)用多方安全計算、聯(lián)邦學(xué)習(xí)、聯(lián)盟鏈等“新方法”實現(xiàn)數(shù)據(jù)可用不可見(可對數(shù)據(jù)計算,不知道原始數(shù)據(jù))、可算不可識(可用數(shù)據(jù)計算,不能反推個人身份)。

隱私計算(Privacy Computing)并不是區(qū)塊鏈之后才有的,而是一個計算機領(lǐng)域,密碼學(xué)的一個重要分支,在不暴露原始數(shù)據(jù)的情況下完成虛擬的聯(lián)合計算。

隱私計算體系架構(gòu)

?投資觀察第15期:隱私計算,新能源汽車“安全上路”的“救命稻草”?

資料來源:《騰訊隱私計算白皮書 2021》

隱私計算可分為四個象限:數(shù)據(jù)流出、集中計算(數(shù)據(jù)脫敏、差分隱私、同態(tài)加密);數(shù)據(jù)流出、協(xié)同計算(安全多方計算);數(shù)據(jù)不流出、協(xié)同計算(聯(lián)邦學(xué)習(xí)平臺)和數(shù)據(jù)不流出、集中計算(可信執(zhí)行環(huán)境)。

四大象限又可歸為密碼學(xué)(軟件和算法)和可信執(zhí)行環(huán)境(硬件)兩大領(lǐng)域。密碼學(xué)技術(shù)以安全多方計算(Secure Multi-Party Computation, SMPC)為代表;可信硬件領(lǐng)域則主要指可信執(zhí)行環(huán)境(Trusted Execution Environment)。

上世紀80年代,我國第一位圖靈獎獲得者姚期智等人提出安全多方計算,包括隱私集合求交(Private Set Intersection, PSI)、隱私信息檢索(Privacy Preserving Information Retrieval, PIR)及隱私統(tǒng)計分析等。

核心思想是設(shè)計特殊的加密算法和協(xié)議,在無可信第三方的情況下,互不信任參與方在保護各自隱私信息前提下協(xié)同建模的機器學(xué)習(xí)框架,不能得到其他參與方的任何輸入信息,只能得到計算結(jié)果。有秘密共享(Secret Sharing, SS,秘密分割成多片由不同參與方管理)、混淆電路(Garbled Circuit, GC,姚氏電路,明文轉(zhuǎn)化成布爾電路后對每個門輸出的真值加密)、不經(jīng)意傳輸(Oblivious Transfer, OT,發(fā)送方同時發(fā)送多個消息但接收方僅獲取其中之一)等一些強大技術(shù)。

可信執(zhí)行環(huán)境通過硬件技術(shù)對數(shù)據(jù)進行隔離保護。核心思想是借助硬件CPU芯片,構(gòu)建獨立于操作系統(tǒng)的可信的、隔離的機密空間。通用性、易用性和性能比純軟件方案高。缺點是需要引入英特爾、AMD等芯片可信方。此外由于CPU相關(guān)實現(xiàn)屬于TCB,側(cè)信道攻擊也是不可忽視的攻擊向量。常用兩種方案:Intel 的 SGX、ARM 的 TrustZone,以及與兩者相關(guān)的商業(yè)化實現(xiàn)方案,如百度MesaTEE、華為 iTrustee 等。

以上兩種隱私計算路徑還衍生出后起之秀——聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)等技術(shù)。聯(lián)邦學(xué)習(xí)本質(zhì)是分布式的機器學(xué)習(xí),可以從技術(shù)上解決數(shù)據(jù)孤島問題,數(shù)據(jù)擁有方不出本地構(gòu)建共有模型,包括聯(lián)邦學(xué)習(xí)、共享學(xué)習(xí)、知識聯(lián)邦、聯(lián)邦智能等。根據(jù)數(shù)據(jù)集的不同類型,聯(lián)邦學(xué)習(xí)分為橫向聯(lián)邦學(xué)習(xí)(特征重合較多樣本重合較少的數(shù)據(jù)集)、縱向聯(lián)邦學(xué)習(xí)(樣本重合較多特征重合較少的數(shù)據(jù)集)與聯(lián)邦遷移學(xué)習(xí)(樣本和特征重合均較少的數(shù)據(jù)集)。

2012年就有學(xué)者發(fā)表了相關(guān)研究成果,2016年谷歌率先商用,2018年微眾銀行引入國內(nèi),很快得到互聯(lián)網(wǎng)大廠、科技巨頭、人工智能公司的重視。

零知識證明(交易匿名和金額隱藏)、差分隱私(Differential Privacy, DP,添加噪音去除個體特征以保護用戶隱私)等輔助性技術(shù)或應(yīng)用也非常有用。

由于技術(shù)路徑不同,各類隱私計算技術(shù)均有其更加適用的場景:多方安全計算不依賴硬件且安全性更高,但是僅支持相對簡單的運算邏輯,比如簡單的統(tǒng)計、查詢計算和簡單的邏輯回歸等機器學(xué)習(xí)模型??尚艌?zhí)行環(huán)境性能和算法適用性更好,但是需要依賴硬件;聯(lián)邦學(xué)習(xí)適合數(shù)據(jù)挖掘,可以解決復(fù)雜的算法建模問題,但是性能存在一定瓶頸。

二、四小龍領(lǐng)跑政策驅(qū)動、市場需求催生的新賽道,八大類參與方中初創(chuàng)中立平臺型企業(yè)或大有可為

區(qū)塊鏈、金融科技等風(fēng)口逐漸落下,數(shù)據(jù)經(jīng)濟似乎成了為數(shù)不多充滿想象力的創(chuàng)投賽道,數(shù)據(jù)隱私保護是解放數(shù)據(jù)經(jīng)濟,實現(xiàn)大規(guī)模商業(yè)化變現(xiàn)的關(guān)鍵一環(huán)。

隱私計算成為2021年重點深挖的9項技術(shù)之一。據(jù) Gartner 預(yù)測,2025年一半的大型機構(gòu)會使用隱私計算在不受信任的環(huán)境和多方數(shù)據(jù)分析中處理數(shù)據(jù)。KPMG 預(yù)計 2023 年國內(nèi)數(shù)據(jù)安全技術(shù)服務(wù)有望達100-200億人民幣,隨著 IT 架構(gòu)走向云化,將撬動千億級的數(shù)據(jù)安全 SaaS 運營收入。常春藤資本創(chuàng)始合伙人翁吉義直言隱私計算行業(yè)蘊含大機會,全球都是增量市場,有成長出多家獨角獸的可能。

隱私計算往往涉及四種參與角色,數(shù)據(jù)供應(yīng)方、數(shù)據(jù)需求方、監(jiān)管方、技術(shù)服務(wù)商。通常四種角色分離,但某些場景下機構(gòu)可能兼兩種角色。

國外隱私計算創(chuàng)新活躍,但商業(yè)化進展稍緩,各國際企業(yè)相對更關(guān)注基于可信執(zhí)行環(huán)境的隱私計算,谷歌(聯(lián)邦學(xué)習(xí)的引路人)、Intel(Intel的SGX和ARM的TrustZone壟斷TEE硬件)、微軟(多方安全計算)等國際領(lǐng)軍企業(yè)開創(chuàng)了隱私計算產(chǎn)業(yè)的時代潮流;Facebook、Zama、Enigma、Sharemind、Privitar等國外互聯(lián)網(wǎng)、AI、區(qū)塊鏈企業(yè)也加快布局。

隱私計算在我國是非常新的行業(yè),相比國外早在2008年便有企業(yè)布局,國內(nèi)直到2016年才出現(xiàn)獨立的隱私計算商業(yè)項目。2018年阿里、騰訊、百度等巨頭才相繼入局。2020年,公司數(shù)量才從最初的五家變成今天的上百家,形成互聯(lián)網(wǎng)大廠、云計算、人工智能、區(qū)塊鏈、大數(shù)據(jù)網(wǎng)絡(luò)安全公司、三大電信運營商、金融機構(gòu)和金融科技企業(yè)、隱私計算初創(chuàng)企業(yè)為代表的八大類市場主要參與者。

?投資觀察第15期:隱私計算,新能源汽車“安全上路”的“救命稻草”?

華控清交、螞蟻金服、微眾銀行、翼方健數(shù)被譽為領(lǐng)跑隱私計算賽道的“四小龍”,撐起“四超多強”的競爭格局。

從技術(shù)路線上看,多方安全計算復(fù)雜度高、開發(fā)難度大,以華控清交、富數(shù)科技、矩陣元等為代表的隱私計算初創(chuàng)企業(yè)和大數(shù)據(jù)區(qū)塊鏈企業(yè)為主;可信執(zhí)行環(huán)境較強依賴硬件及國外芯片,國內(nèi)產(chǎn)品相對較少,集中于百度、阿里巴巴等互聯(lián)網(wǎng)大廠和沖量在線、隔鏡科技等初創(chuàng)企業(yè);聯(lián)邦學(xué)習(xí),由于機器學(xué)習(xí)類應(yīng)用需求突出,且有較成熟的開源社區(qū)為基礎(chǔ)(PySyft、TF-Federated和FATE等),開發(fā)難度相對輕松,主要集中在運營商、微眾銀行等金融科技公司。

隨著我國第一部數(shù)據(jù)安全的專門法律——《中華人民共和國數(shù)據(jù)安全法》和第一家國際數(shù)據(jù)交易所(簡稱“北數(shù)所”)相繼宣布成立,隱私計算或迎互聯(lián)網(wǎng)大廠、垂直初創(chuàng)企業(yè)和相關(guān)安全領(lǐng)域企業(yè)硝煙四起的“三國大戰(zhàn)”。這場“大戰(zhàn)”不是“燒錢”的營銷競爭,而是技術(shù)創(chuàng)新的真正比拼,更離不開與商業(yè)模式的結(jié)合。

政策驅(qū)動、市場需求催生的新賽道,初創(chuàng)中立平臺型企業(yè)或大有可為

與社區(qū)團購、生物醫(yī)藥等大廠占據(jù)絕對優(yōu)勢的賽道不同,隱私計算初創(chuàng)企業(yè)的市場份額更大。由于技術(shù)復(fù)雜常常呈現(xiàn)“黑盒化”現(xiàn)象,且處理對象常涉及敏感數(shù)據(jù)資產(chǎn),隱私計算眾多技術(shù)仍處于前期驗證階段,提供方須首先建立信任,行業(yè)較長時間內(nèi)定制化需求較高,相較于傳統(tǒng)大廠,初創(chuàng)專精型企業(yè)天然帶有信任優(yōu)勢,中立廠商大有可為。

隱私計算廠商落地情況由此可見一斑,根據(jù)中國信通院,目前超過81%的隱私計算產(chǎn)品進入到試點部署或?qū)嵤╇A段,但是華為等知名企業(yè)均尚未公開落地案例,字節(jié)跳動等僅僅在集團內(nèi)部落地。

初創(chuàng)企業(yè)技術(shù)落地明顯優(yōu)于傳統(tǒng)大廠,除洞見科技外,星云Clustar、華控清交、翼方健數(shù)等大部分均已實現(xiàn)案例落地。專利數(shù)方面初創(chuàng)企業(yè)同樣表現(xiàn)不俗,專利數(shù)超過20個的10家中分別為螞蟻科技(429)、微眾銀行(316)、平安科技(62)、華控清交(49)、百度(33)、矩陣元(33)、騰訊(32)、華為(32)、星云Clustar(25)、趣鏈(24)。

富數(shù)科技、同盾科技、星環(huán)科技等大數(shù)據(jù)和網(wǎng)絡(luò)安全公司也缺乏落地項目。上市公司2019年靠區(qū)塊鏈概念在二級市場尋求回報增長,此次也難逃因為生存壓力炒作新熱點、新風(fēng)口之嫌,8家區(qū)塊鏈公司表示正在或即將開展隱私計算相關(guān)業(yè)務(wù),但大部分還處于初期階段。不過Real AI、醫(yī)渡科技等AI企業(yè)確有明確的落地場景,缺乏數(shù)據(jù)訓(xùn)練的AI注定只能停留在理論層面,隱私計算也被稱為“AI落地的最后一公里”。

隱私計算研究跨度門檻高,“隱形冠軍”價值更加凸顯。不可否認是隱私計算在挑選公司,而不是公司在挑選隱私計算,需要掌握數(shù)學(xué)、加密學(xué)、建模、工程化和業(yè)務(wù)場景等綜合能力,以及前期論文研究、底層算法、原型實現(xiàn)和工具化等高投入,國內(nèi)具有完全自主研發(fā)能力的公司屈指可數(shù)。軟件產(chǎn)品門檻低賣不動,硬件門檻高玩不起,隱私計算的商業(yè)模式仍需探索。

據(jù)KPMG《隱私計算行業(yè)研究報告》,技術(shù)服務(wù)商有銷售模式(一次性技術(shù)系統(tǒng)搭建每單數(shù)十萬數(shù)百萬不等)、服務(wù)模式(隱私計算年度系統(tǒng)維護和服務(wù)比一般軟件更新更快),調(diào)用模式(單次數(shù)據(jù)使用幾分到幾角不等,亦可先試用后收費)、分潤模式(與客戶聯(lián)合運營分潤)。

我們預(yù)計隱私計算商業(yè)路徑分“三步走”:初期以醫(yī)療、金融、政務(wù)等數(shù)據(jù)合規(guī)關(guān)鍵領(lǐng)域的軟件銷售模式為主,中期拓展到中小企業(yè)和科技公司的按量付費模式,未來平臺型的調(diào)用和分潤模式將解決不同廠家技術(shù)不同的問題,相比單純售賣軟硬件的方案,平臺不僅邊際成本更低,還將打開更大的隱私計算生態(tài)網(wǎng)絡(luò)。

平臺型機會往往誕生于雙邊主體分散、需求多元的行業(yè),網(wǎng)羅上游數(shù)據(jù)源和下游數(shù)據(jù)需求,方顯超大規(guī)模的隱私計算平臺價值。

華控清交首席科學(xué)家徐葳說過,應(yīng)用跑向數(shù)據(jù)會形成天然的“數(shù)據(jù)壟斷”。中立平臺型隱私計算公司像大禹治水一樣“開渠引水”,連接“河系、網(wǎng)道”,建立國家數(shù)據(jù)網(wǎng),讓數(shù)據(jù)跑向應(yīng)用,真正化解“數(shù)據(jù)壟斷”。

從投資機構(gòu)布局來看,紅杉中國、IDG資本、基石資本等不少VC、PE已入局。據(jù)天眼查,2020年至今,至少已有8家隱私計算企業(yè)獲得融資,大多集中在B輪及之前。榜首是B輪專攻政務(wù)的“清華姚班”華控清交,融資額高達5億人民幣,其次是專攻醫(yī)療B輪的翼方健數(shù)和專攻金融A+輪的星云Clustar。

沖量在線在2020年末完成IDG資本的天使輪投資,锘崴科技、數(shù)牘科技等也深受資本青睞。賽道玩家估值多在1~3億元區(qū)間,明星公司估值半年前已超6億元。公司成立時間都較短,除華控清交、翼方健數(shù)、星云Clustar成立超3年外,其他公司成立時間均不到兩年。

愿意高價入場的投資者多半相信“平臺的傳說”,但杠桿的另一半是隱私計算技術(shù)需要彼此結(jié)合使用才能滿足客戶的綜合需求,方案同質(zhì)化意味著市場發(fā)展到下一階段—企業(yè)價格戰(zhàn)。

而且,由于難以在二級市場找到直接對標的公司,很難預(yù)判是百億級的投資機會。隱私計算要突破商業(yè)化的規(guī)模瓶頸,仍需完善技術(shù)的成熟度與安全性,提供同質(zhì)化產(chǎn)品之外的附加價值,在一個或多個領(lǐng)域提供更深入的解決方案,搭建產(chǎn)業(yè)推廣的多方協(xié)同合作模式。

三、車聯(lián)網(wǎng)時代,隱私計算如何成為下一代移動生態(tài)的“基石”

隱私計算應(yīng)用場景不斷擴展,可以幫助機構(gòu)在不輸出原始數(shù)據(jù)的基礎(chǔ)上,共享整合多機構(gòu)間、多維度的數(shù)據(jù),構(gòu)建更立體的用戶畫像,比如,醫(yī)療、金融、電信運營商、互聯(lián)網(wǎng)企業(yè)獲客提升用戶體驗和政務(wù)領(lǐng)域社會福利最大化。

智能聯(lián)網(wǎng)汽車有望成為繼醫(yī)療、金融和政務(wù)之后另一大重點領(lǐng)域,隱私計算將作為數(shù)據(jù)經(jīng)濟的底座,開啟下一代移動互聯(lián)網(wǎng)紅利,為新能源汽車實現(xiàn)車內(nèi)、車與云平臺、車與車、車與路、車與人等全方位網(wǎng)絡(luò)鏈接與智能管理的車聯(lián)網(wǎng)技術(shù)體系保駕護航。

過去5年,黑客攻擊智能汽車的次數(shù)增長了20倍。一輛汽車每天至少收集10TB的數(shù)據(jù),一旦遭受侵害會泄露車上用戶甚至車外行人的信息。在行駛過程中涉及周圍交通情況等大量地理信息,事關(guān)國家重大安全。

智能網(wǎng)聯(lián)汽車“明星”品牌特斯拉就曾被找出大量安全漏洞,控制者利用Model S的漏洞遠程控制開鎖、鳴笛等操作。

車聯(lián)網(wǎng)信息安全分四個層面:系統(tǒng)安全、應(yīng)用安全、網(wǎng)絡(luò)安全,最大問題就是數(shù)據(jù)安全,也就是數(shù)據(jù)隱私保護和數(shù)據(jù)可靠性這對矛盾問題。

車聯(lián)網(wǎng)的隱私比移動互聯(lián)網(wǎng)的隱私問題更突出,很容易跟蹤車的行蹤、位置和用戶ID等。但是隱私保護下無法了解真實身份,就可能發(fā)布虛假信息,帶來數(shù)據(jù)可靠性問題。

隱私計算結(jié)合AI、區(qū)塊鏈、云計算、分布式存儲等技術(shù)為解決隱私和數(shù)據(jù)可靠性這個車聯(lián)網(wǎng)數(shù)據(jù)安全最大的矛盾問題提供了方向:

車聯(lián)網(wǎng)不可篡改的信息,比如交通事故、違章等信息通過區(qū)塊鏈實現(xiàn)證據(jù)固化,這是區(qū)塊鏈的不可篡改性。

云計算解決車聯(lián)網(wǎng)使用區(qū)塊鏈時的資源受限傳輸延遲等一系列挑戰(zhàn),極大提高算力資源利用率,租用計算資源避免重復(fù)購買的浪費,規(guī)模效應(yīng)降低單位成本。

分布式計算是云計算的高級形態(tài),車輛等設(shè)備通過分布式計算網(wǎng)絡(luò)重新被有效利用,防止云計算寡頭壟斷計算資源,提高價格獲取高額壟斷利潤,P2P下載可以節(jié)省近60%的帶寬。

AI是自動駕駛的首選技術(shù),汽車不僅僅是交通工具,更是智能設(shè)備。而缺乏數(shù)據(jù)訓(xùn)練的AI注定只能停留在理論層面上,隱私計算的出現(xiàn)為這一問題提供了解決的方向。

車聯(lián)網(wǎng)入網(wǎng)注冊需要保護隱私,隱私計算可以讓數(shù)據(jù)在分布式計算中保持加密狀態(tài),提高數(shù)據(jù)安全,也使隱私數(shù)據(jù)上鏈成為可能,同時通過區(qū)塊鏈確??沈炞C性。

四、結(jié)束語:螺旋上升的飛輪迎來下一代移動生態(tài)

分布式計算為車聯(lián)網(wǎng)提供存儲的土壤,數(shù)據(jù)直接從需求節(jié)點發(fā)送到不受信任的提供節(jié)點相比云計算面臨更大的數(shù)據(jù)安全挑戰(zhàn)。

隱私計算為無限擴容的分布式高性能算力互聯(lián)網(wǎng)提供信息安全保證,區(qū)塊鏈通過數(shù)據(jù)目錄、數(shù)據(jù)湖構(gòu)建數(shù)據(jù)流轉(zhuǎn),成為隱私計算的底座和樞紐。數(shù)據(jù)存儲在數(shù)據(jù)庫里不能直接產(chǎn)生價值,通過AI海量數(shù)據(jù)訓(xùn)練才能達到理想性能。隱私計算使數(shù)據(jù)“不出庫”就能實現(xiàn)身份認證、可追溯性、隱匿查詢、模型構(gòu)建等能力,將極大的豐富下一代移動生態(tài)的應(yīng)用天地。

 

本文由 @汪仔7815 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 隱私計算為無限擴容的分布式高性能算力互聯(lián)網(wǎng)提供信息安全保證,區(qū)塊鏈通過數(shù)據(jù)目錄、數(shù)據(jù)湖構(gòu)建數(shù)據(jù)流轉(zhuǎn),成為隱私計算的底座和樞紐,學(xué)到了

    來自云南 回復(fù)