AI時(shí)代:匿名不等于隱私保護

鎂客 9年前 (2016-06-22)

蘋(píng)果在WWDC 2016的主題演講中,講到“差分隱私 (Differential Privacy)”這個(gè)密碼學(xué)專(zhuān)有名詞的時(shí)候,只有少數人意識到,蘋(píng)果又走在了時(shí)代前列。

蘋(píng)果獨辟蹊徑!“差分隱私”完爆匿名搜集數據

匿名電話(huà)、匿名信息、匿名用戶(hù)••••••“匿名”仿佛已經(jīng)成為隱私安全的防護欄。

然而在A(yíng)I時(shí)代,匿名真的能保護隱私安全嗎?來(lái)看看蘋(píng)果怎么說(shuō)!

在 WWDC 2016 的主題演講中,當蘋(píng)果講到“差分隱私 (Differential Privacy)”這個(gè)密碼學(xué)專(zhuān)有名詞的時(shí)候,只有少數人意識到,蘋(píng)果又走在了時(shí)代前列。

但是大部分中外觀(guān)察者都認為,蘋(píng)果為人工智能時(shí)代所做的努力不夠,它依然是一家以硬件設備為核心的公司,對于為更大規模的用戶(hù)提供服務(wù)不感興趣(例如 iMessage 等軟件均沒(méi)有 Android 版),所以當人工智能技術(shù)得以真正嶄露頭角的時(shí)候,很可能難以追趕 Google、Facebook、亞馬遜和微軟。

從這個(gè)方面來(lái)說(shuō),蘋(píng)果確實(shí)不如Google、Facebook等行業(yè)巨頭,但是蘋(píng)果在解決人工智能時(shí)代的隱私保護難題上,又似乎比其他科技巨頭走得更遠。

在發(fā)展的需求方面,人工智能依賴(lài)于機器學(xué)習(深度學(xué)習)算法,而機器學(xué)習又需要大規模的訓練數據,所以向用戶(hù)搜集數據比以往更加重要。這也是搜集數據的原始意圖?;ヂ?lián)網(wǎng)時(shí)代,搜集數據主要以匿名為擋箭牌,但AI時(shí)代,匿名還可靠嗎?

匿名VS差分隱私

有句話(huà)說(shuō)得好,“內行看門(mén)道,外行看熱鬧”?;ヂ?lián)網(wǎng)行業(yè)搜集信息的標準答案:一、收集用戶(hù)信息是必要的,這樣有助于改善產(chǎn)品或服務(wù)。二、我們是匿名收集用戶(hù)信息的,并不保存任何用戶(hù)的身份信息。有了這個(gè)擋箭牌,外行很容易被唬住,認為匿名就聯(lián)系不到用戶(hù)信息。

但是內行都應該清楚,匿名并不能完全保證用戶(hù)的隱私安全。最經(jīng)典的案例莫過(guò)于,Netflix 曾放出“經(jīng)過(guò)匿名處理的”上億條電影評分數據,“僅僅保留了每個(gè)用戶(hù)對電影的評分和評分的時(shí)間戳”,希望通過(guò)競賽的形式,找到更好的影片推薦算法。但是 2009年,德州大學(xué)的兩位研究人員,通過(guò)這些匿名數據與公開(kāi)的IMDB數據做對比,成功將匿名數據與具體的用戶(hù)對應了起來(lái)。Netflix 不得不取消了,這項原計劃每年舉行的競賽。

這樣的匿名還有的玩?必將壽終正寢??!

這不,拯救AI時(shí)代隱私保護的高手出場(chǎng),“差分隱私”通過(guò)蘋(píng)果高調亮相!其實(shí)差分隱私不是蘋(píng)果的首創(chuàng ),因為學(xué)者們已經(jīng)就這個(gè)概念進(jìn)行了多年的研究。但當蘋(píng)果將它隨著(zhù) iOS 10 一起發(fā)布后,差分隱私就將走進(jìn)人們的視野里,幫助公司收集和分析不同來(lái)源的用戶(hù)數據。

這項密碼學(xué)前沿技術(shù)的基本原理,就是向包含個(gè)體信息的大量數據集里注入噪音(或者說(shuō)擾動(dòng)),通過(guò)算法來(lái)打亂個(gè)體用戶(hù)數據,讓任何人都不能憑此追蹤到具體的某一名用戶(hù),但又可以允許機構成批分析數據以獲得大規模的整體趨勢。最終保證每個(gè)個(gè)體信息都無(wú)法泄露,同時(shí)這個(gè)數據集的統計學(xué)信息依然可以被外界分析。

這簡(jiǎn)直甩了“匿名”好幾條街??!蘋(píng)果此舉,可謂是不鳴則已,一鳴驚人。

差分隱私的未來(lái)前景如何?

差分隱私并不是某一項單獨的技術(shù),而是一種以避免在數據與特定個(gè)人之間建立聯(lián)系為前提的數據處理方案。它允許數據以聚合的形式被分析,但同時(shí)還要將干擾注入那些數據中,使得處理數據的過(guò)程中個(gè)人隱私不會(huì )被侵害。

但是強調安全性是有代價(jià)的,在加入這些干擾因素之后,獲取的信息就不會(huì )有那么清晰和準確了。在這個(gè)取舍之間,蘋(píng)果毫不讓人驚訝地選擇了注重隱私。很明顯,蘋(píng)果遵守了注重隱私的承諾,利用自己獨特的方式在A(yíng)I大戰中首次告捷!

蘋(píng)果將成為第一個(gè)真正大規模使用這項“差分隱私 (Differential Privacy)”算法的公司。即便有些學(xué)者認為這項技術(shù)前景可期,還沒(méi)有成熟到大規模商用的時(shí)候。但差分隱私的引入仍將會(huì )為我們帶來(lái)更好的體驗,讓更多的人擺脫匿名的“欺騙”。

最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!

鎂客網(wǎng)


科技 | 人文 | 行業(yè)

微信ID:im2maker
長(cháng)按識別二維碼關(guān)注

硬科技產(chǎn)業(yè)媒體

關(guān)注技術(shù)驅動(dòng)創(chuàng )新

分享到