灰色地帶中的隱私之墻,怎么攻?怎么守?

韓璐 6年前 (2019-05-13)

一場(chǎng)圍繞數據隱私的攻堅戰。

去年年初,網(wǎng)上流傳這樣一個(gè)段子,一位已婚男性用戶(hù)向支付寶發(fā)出“抱怨”,稱(chēng)后者發(fā)布的2017賬單暴露了他過(guò)去一年的開(kāi)房記錄,以致于家庭被迫走在毀滅的邊緣(圖片如下):

一時(shí)間,支付寶賬單被頂上了輿論的風(fēng)口浪尖,這一切的背后是用戶(hù)數據隱私的被采集和利用。

而一波未平一波又起,時(shí)隔不到兩個(gè)月,Facebook也因為同樣的理由遭遇了比支付寶更嚴重的考驗,即臭名昭著(zhù)的“劍橋分析”事件,數據泄露范圍高達8700萬(wàn)用戶(hù)。因為這一事件,小扎經(jīng)歷了長(cháng)達5個(gè)小時(shí)的國會(huì )聽(tīng)證,并針對用戶(hù)隱私政策和數據泄露事件接受了44位議員的質(zhì)詢(xún)。

在這之后,華住集團5億條數據遭泄露、平臺頻現“大數據殺熟”、騷擾電話(huà)接連不斷……可以說(shuō),自去年年初開(kāi)始,關(guān)于“數據隱私”的討論就一直很激烈。

技術(shù)面前,隱私不再“隱私”

“隱私”一詞第一次出現是在周朝初年,指代“衣服”,即把私處藏起來(lái)的東西。按照現在的說(shuō)法,所謂的“隱私”,即一種與公共利益、群體利益無(wú)關(guān),當事人不愿他人知道或他人不便知道的個(gè)人信息,當事人不愿他人干涉或他人不便干涉的個(gè)人私事,以及當事人不愿他人侵入或他人不便侵入的個(gè)人領(lǐng)域。

隱私的周?chē)蚨嗷蛏俣紩?huì )存在窺探者,出于不同的目的,他們往往能夠把隱私玩出許多花樣,并由此誕生了許多不同的職業(yè)和市場(chǎng),比如致力于圍繞個(gè)人或群體調查信息的私家偵探,又比如滿(mǎn)足人們對明星生活好奇心的娛樂(lè )記者……而隨著(zhù)互聯(lián)網(wǎng)時(shí)代,人們窺探隱私的手段也以可見(jiàn)的速度進(jìn)行升級換代,尤其是在用戶(hù)服務(wù)、市場(chǎng)營(yíng)銷(xiāo)等領(lǐng)域。

以市場(chǎng)營(yíng)銷(xiāo)為例,今年315晚會(huì )現場(chǎng)所揭露的數據灰色產(chǎn)業(yè)至今令人記憶猶新。通過(guò)一種“探針盒子”設備,設備持有人便能夠捕捉手機的局域網(wǎng)信號,繼而獲取MAC地址。只需要將這段地址數據與大數據系統進(jìn)行配合,包括性別、年齡、收入、婚姻狀況、教育程度、新老客屬性等在內的機主信息都將一覽無(wú)余。基于這些信息,服務(wù)商即可幫助商家勾勒出用戶(hù)精準畫(huà)像,進(jìn)而開(kāi)展廣告精準推送等等。

一套流程下來(lái),整個(gè)步驟就是如此的簡(jiǎn)單粗暴且有效。而在以往,這些信息的收集和用戶(hù)畫(huà)像的勾勒往往需要消耗大量人力和時(shí)間去進(jìn)行用戶(hù)調查、數據歸納整理等工作,且精準度也因為用戶(hù)的主觀(guān)意識而存在不確定性。

而在線(xiàn)上,在得到類(lèi)似效果的前提下,獲取用戶(hù)數據隱私的成本則更低。明面上,APP會(huì )要求用戶(hù)同意并授權諸如相機、麥克風(fēng)、位置信息等服務(wù),從而正大光明的采集各類(lèi)數據;暗地里,無(wú)需用戶(hù)同意或授權,平臺往往也能夠通過(guò)cookie等技術(shù)手段采集用戶(hù)數據,繼而勾勒畫(huà)像,提供個(gè)性化服務(wù)或精準營(yíng)銷(xiāo)。

令人氣憤或無(wú)奈的是,為了正常使用服務(wù),用戶(hù)往往不得不同意那些存在隱私泄露隱患的隱私政策,并授權平臺使用相機、麥克風(fēng)等。

可以說(shuō),在智能算法等技術(shù)面前,人們的隱私已經(jīng)不再私密,甚至比以往更易獲得。

選擇隱私與服務(wù),這道選擇題沒(méi)有絕對的答案

如何保護隱私?傳統做法是閉緊嘴巴、避開(kāi)他人耳目行事。直到1980年,“隱私權”這一概念才被提出,讓人們在法律層面找到了保衛隱私的武器。而隨著(zhù)互聯(lián)網(wǎng)時(shí)代、智能化時(shí)代的到來(lái),這一法律武器也“學(xué)會(huì )了”與時(shí)俱進(jìn)。

比如歐盟,其在2016年通過(guò)了被稱(chēng)為史上最嚴的《常規數據保護條例》(簡(jiǎn)稱(chēng)GDPR),要求數據控制者(收集歐盟公民數據的任何公司)嚴格執行條例所規定的數據處理規范,及時(shí)告知數據主體的使用情況。GDPR已經(jīng)于2018年5月份正式實(shí)施,彼時(shí)依舊身陷“劍橋分析”事件泥潭的Facebook剛好撞在槍口上。

可以注意到,GDPR所強調的是公司要將數據使用情況及時(shí)告知用戶(hù),而非要求公司停止收集數據。為什么?因為就現實(shí)情況而言,用戶(hù)數據在多數情況下是避無(wú)可避的。

比如那些正在使用APP的用戶(hù),他們難道不知道自己的數據正在被收集嗎?非也?,F實(shí)情況是,他們出于社交等目的不得不繼續使用這些APP,且能夠在不受到直接物質(zhì)傷害的前提下享受到一些有價(jià)值的服務(wù)。

當然,或許有人為了信息不被收集而拒絕使用那些APP,甚至不主動(dòng)使用任何聯(lián)網(wǎng)設備,但這樣就能夠避免數據隱私被采集嗎?不是的。

數據的收集主要依賴(lài)于各類(lèi)終端設備,據前瞻產(chǎn)業(yè)研究院發(fā)布的《2018-2023年中國物聯(lián)網(wǎng)行業(yè)細分市場(chǎng)需求與投資機會(huì )分析報告》初步估算,2020年物聯(lián)網(wǎng)設備數量將達到204億。

針對手機、電腦等自可控智能設備,用戶(hù)可以選擇斷網(wǎng)、遮擋攝像頭等物理操作來(lái)阻止它們收集并上傳數據,但在超市、商場(chǎng),甚至是大街等被充斥海量智能設備的不可控場(chǎng)景中,出于安全等多樣性的目的,被留下數據痕跡是不可避免的事情。

與此同時(shí),數據隱私的控制權也從用戶(hù)手中轉移到采集數據的公司手中。

還記得此前,針對數據隱私以及基于數據訓練算法而來(lái)的個(gè)性化服務(wù),李彥宏曾發(fā)表一番言論,在業(yè)內引發(fā)一場(chǎng)熱議。關(guān)于“中國用戶(hù)愿意拿數據隱私換取服務(wù)”的觀(guān)點(diǎn),這里不予置評,但他所提到的一個(gè)觀(guān)點(diǎn)說(shuō)的有幾分道理,他說(shuō)“我們也要遵循一些原則,如果這個(gè)數據能讓用戶(hù)受益,他們又愿意給我們用,我們就會(huì )去使用它的。我想這就是我們能做什么和不能做什么的基本標準。”

在網(wǎng)絡(luò )四通八達、處處充斥著(zhù)智能設備的當今,如果沒(méi)有花費心思進(jìn)行隱藏的話(huà),人們的一舉一動(dòng)都將近乎完全暴露。這時(shí)候,人們需要擔心的不是自己的數據是否被收集,而是這些數據是否被不正當利用。而除了正常的法律約束,技術(shù)支撐往往也是不可或缺的,尤其是在一切事物都被“數據化”的當下。

保護隱私,法律之外還需要“以毒攻毒”

上至國家、下至普羅大眾,”未來(lái)是AI時(shí)代“已經(jīng)成為了一個(gè)共識。經(jīng)過(guò)這幾年的發(fā)展,AI已經(jīng)走下神壇,從一個(gè)深奧的話(huà)題演變的更為貼近民生。與此同時(shí),人們也享受到了AI所帶來(lái)的便利。而這其中,最大的功臣之一就是數據。

有了數據,算法能夠在不斷的訓練中提升精準性;有了數據,算法才能針對性的面向用戶(hù)提供服務(wù),而不是成為一個(gè)雞肋;有了數據,人們所設想和期待的萬(wàn)物智聯(lián)才會(huì )成為現實(shí)……可以說(shuō),數據是智能化實(shí)現的動(dòng)力。

圍繞智能化趨勢所帶來(lái)的數據隱私安全以及是否被濫用問(wèn)題,諸多國家正在從法律層面進(jìn)行完善,除了前面提到的歐盟GDPR,我國也于去年5月份正式實(shí)施《信息安全技術(shù)個(gè)人信息安全規范》,要求平臺在收集個(gè)人敏感信息時(shí),平臺應征得用戶(hù)的明示同意,并區分核心功能和附加功能,以打破”一攬子授權“的難題……

理性的來(lái)說(shuō),健全的法律只是利用一種合法的手段為人們提供一個(gè)武器,對收集數據的公司起到一個(gè)震懾的作用,但并不能完全消除人們對于數據隱私被收集和利用的擔憂(yōu)。而基于這股擔憂(yōu),用戶(hù)也將在一定程度上”不信任“公司基于數據而提供的服務(wù),久而久之,用戶(hù)與公司之間必然將產(chǎn)生裂縫,這并不是后者所愿意見(jiàn)到的。

為了避免這種情況的發(fā)生,越來(lái)越多的公司開(kāi)始關(guān)注起”數據隱私“這一以往被忽略的問(wèn)題。比如谷歌,在日前舉辦的I/O大會(huì )上全程不忘提及他們在隱私保護上做出的努力。

目前,為了讓用戶(hù)對數據隱私放心,企業(yè)的解決方案分為兩大方向,一個(gè)側重于數據收集的源頭,另一個(gè)則將重點(diǎn)放在數據收集之后的保護:

· 數據脫敏

前面也提到,為了達到個(gè)性化服務(wù)、精準營(yíng)銷(xiāo)等服務(wù),數據被收集是一個(gè)必然的事實(shí),只是需要注意的是,并不是所有數據都要被收集。在這方面,部分企業(yè)選擇收集那些非敏感數據,即脫敏數據。

這一過(guò)程中,當涉及客戶(hù)安全數據或者一些商業(yè)性敏感數據的情況,在不違反系統規則條件下,企業(yè)會(huì )通過(guò)脫敏規則對數據進(jìn)行改造,剔除身份證、手機號、卡號、年齡、性別等個(gè)人敏感信息。

目前,“數據脫敏”這一方法被大多數企業(yè)所采用,區別只在于具體方式不一樣。經(jīng)過(guò)脫敏處理后,留下則是結構化數據,不存在過(guò)于敏感的隱私問(wèn)題。一般而言,基于脫敏數據而形成的用戶(hù)畫(huà)像是不完整的,做不到特別精準的個(gè)性化推薦、服務(wù),但是對于一些商業(yè)目的而言,這些已經(jīng)足夠。

與此同時(shí),從數據智能化的流程上講,收集脫敏數據意味著(zhù)用戶(hù)的敏感信息從最初就被剔除在外,相當于從源頭即開(kāi)始保護用戶(hù)的數據隱私,從而保證了數據隱私的安全性。

· 邊緣計算

自去年開(kāi)始,邊緣計算就一直被業(yè)界所推崇,而在探討其優(yōu)勢的時(shí)候,“提高數據的安全性與可靠性”這一點(diǎn)必定在列。

在邊緣計算被提出之前,終端設備在云計算模式下需要將所收集的用戶(hù)數據上傳至數據中心,也就是所謂的云端,某些時(shí)候常常造成數據擁堵的現場(chǎng),而更需要提高警惕的是,這些數據極有可能在上傳過(guò)程中,亦或是在終端服務(wù)器內遭到泄漏。

不同于云計算的操作模式,邊緣計算將包含用戶(hù)隱私的數據放在邊緣節點(diǎn),以進(jìn)行保存和處理分析,相對提高數據的安全性。

另外,因為是將數據放在邊緣節點(diǎn),邊緣計算的數據隱私避免了長(cháng)途跋涉的過(guò)程,在縮減數據上傳時(shí)間、躲開(kāi)數據擁堵的同時(shí),也提升了設備的響應速度。

· 聯(lián)邦學(xué)習

邊緣計算之后,近期出現了又一個(gè)針對數據隱私保護的新概念,即“聯(lián)邦學(xué)習”。

“聯(lián)邦學(xué)習就像一個(gè)安全的道路網(wǎng)絡(luò ),可以既滿(mǎn)足人工智能的訓練要求,又保障我們的個(gè)人隱私不被濫用,因為這個(gè)道路網(wǎng)絡(luò )上跑的是無(wú)法還原到原始數據的加密信息。”創(chuàng )新工場(chǎng)南京國際人工智能研究院執行院長(cháng)馮霽表示。

以學(xué)生的個(gè)性化教育為例,圍繞該學(xué)生的所有數據被分散化的,這并不利于最佳模型的訓練。同時(shí),若將數據在不進(jìn)行加密或不在安全標準下進(jìn)行跨地域、跨數據源的聚合和交換,企業(yè)也無(wú)法在所有不同數據源上訓練最能反應該學(xué)生學(xué)歷歷程的AI模型,也需要承擔極大的數據隱私風(fēng)險。

而借助聯(lián)邦學(xué)習,業(yè)界可以建立一個(gè)安全的共享機制,不需要交換原始隱私數據,企業(yè)只需要在加密的數據上進(jìn)行聚合訓練,就可以得出完整反映學(xué)生情況的AI模型,并基于該模型為學(xué)生針對性的定制學(xué)習計劃。

聯(lián)邦學(xué)習的這種做法,相當于在原始數據外圍增加了一把鎖頭,并進(jìn)行模糊化處理等二次加工。

在智能化時(shí)代,數據就是新的生產(chǎn)力,兩者之間相互扶持,一榮俱榮、一損俱損。沒(méi)有數據的支撐,智能化也只能停留在淺層表面,相比于它真正所能夠提供的價(jià)值,停留在表面的智能化只能算是碌碌一生。

若要得到數據的支撐,那么安全性則是一個(gè)始終都繞不開(kāi)的話(huà)題。只有安全性得到保障,用戶(hù)才會(huì )信任算法、信任服務(wù),繼而才會(huì )使用它,并向提供服務(wù)方進(jìn)行反饋,形成一個(gè)良性循環(huán)。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到