你的隱私，大數據怎知道？我們又該如何自我保護？_文化

你的隱私，大數據怎知道？我們又該如何自我保護？

發布時間：2023-01-12 11:15:00來源：光明日報

　　在網絡上，每個(ge) 人都會(hui) 或多或少，或主動或被動地泄露某些碎片信息。這些信息被大數據挖掘，就存在隱私泄露的風險，引發信息安全問題。麵對洶湧而來的5G時代，大眾(zhong) 對自己的隱私保護感到越來越迷茫，甚至有點不知所措。那麽(me) ，你的隱私，大數據是怎麽(me) 知道的呢？大家又該如何自我保護呢？

　　1.“已知、未知”大數據都知道

　　大數據時代，每個(ge) 人都有可能成為(wei) 安徒生童話中那個(ge) “穿新衣”的皇帝。在大數據麵前，你說過什麽(me) 話，它知道；你做過什麽(me) 事，它知道；你有什麽(me) 愛好，它知道；你生過什麽(me) 病，它知道；你家住哪裏，它知道；你的親(qin) 朋好友都有誰，它也知道……總之，你自己知道的，它幾乎都知道，或者說它都能夠知道，至少可以說，它遲早會(hui) 知道！

　　甚至，連你自己都不知道的事情，大數據也可能知道。例如，它能夠發現你的許多潛意識習(xi) 慣：集體(ti) 照相時你喜歡站哪裏呀，跨門檻時喜歡先邁左腳還是右腳呀，你喜歡與(yu) 什麽(me) 樣的人打交道呀，你的性格特點都有什麽(me) 呀，哪位朋友與(yu) 你的觀點不相同呀……

　　再進一步說，今後將要發生的事情，大數據還是有可能知道。例如，根據你“飲食多、運動少”等信息，它就能夠推測出，你可能會(hui) “三高”。當你與(yu) 許多人都在獨立地購買(mai) 感冒藥時，大數據就知道：流感即將暴發了！其實，大數據已經成功地預測了包括世界杯比賽結果、股票的波動、物價(jia) 趨勢、用戶行為(wei) 、交通情況等。

　　當然，這裏的“你”並非僅(jin) 僅(jin) 指“你個(ge) 人”，包括但不限於(yu) ，你的家庭，你的單位，你的民族，甚至你的國家等。至於(yu) 這些你知道的、不知道的或今後才知道的隱私信息，將會(hui) 把你塑造成什麽(me) ，是英雄還是狗熊？這卻難以預知。

　　2.數據挖掘就像“垃圾處理”

　　什麽(me) 是大數據？形象地說，所謂大數據，就是由許多千奇百怪的數據，雜亂(luan) 無章地堆積在一起。例如，你在網上說的話、發的微信、收發的電子郵件等，都是大數據的組成部分。在不知道的情況下被采集的眾(zhong) 多信息，例如被馬路攝像頭獲取的視頻、手機定位係統留下的路線圖、駕車的導航信號等被動信息，也都是大數據的組成部分。還有，各種傳(chuan) 感器設備自動采集的有關(guan) 溫度、濕度、速度等萬(wan) 物信息，仍然是大數據的組成部分。總之，每個(ge) 人、每種通信和控製類設備，無論它是軟件還是硬件，其實都是大數據之源。

　　大數據利用了一種名叫“大數據挖掘”的技術，采用諸如神經網絡、遺傳(chuan) 算法、決(jue) 策樹、粗糙集、覆蓋正例排斥反例、統計分析、模糊集等方法挖掘信息。大數據挖掘的過程，可以分為(wei) 數據收集、數據集成、數據規約、數據清理、數據變換、挖掘分析、模式評估、知識表示等八大步驟。

　　不過，這些聽起來高大上的大數據產(chan) 業(ye) ，幾乎等同於(yu) 垃圾處理和廢品回收。

　　這並不是在開玩笑。廢品收購和垃圾收集，可算作“數據收集”；將廢品和垃圾送往集中處理場所，可算作“數據集成”；將廢品和垃圾初步分類，可算作“數據規約”；將廢品和垃圾適當清潔和整理，可算作“數據清理”；將破沙發拆成木、鐵、布等原料，可算作“數據變換”；認真分析如何將這些原料賣個(ge) 好價(jia) 錢，可算作“數據分析”；不斷總結經驗，選擇並固定上下遊賣家和買(mai) 家，可算作“模式評估”；最後，把這些技巧整理成口訣，可算作“知識表示”。

　　再看原料結構。大數據具有異構特性，就像垃圾一樣千奇百怪。如果非要在垃圾和大數據之間找出本質差別的話，那就在於(yu) 垃圾是有實體(ti) 的，再利用的次數有限；而大數據是虛擬的，可以反複處理，反複利用。例如，大數據專(zhuan) 家能將數據(廢品)中挖掘出的旅客出行規律交給航空公司，將某群體(ti) 的消費習(xi) 慣賣給百貨商店等。總之，大數據專(zhuan) 家完全可以“一菜多吃”，反複利用，而且時間越久，價(jia) 值越大。換句話說，大數據是很值錢的“垃圾”。

　　3.大數據挖掘永遠沒有盡頭

　　大數據挖掘，雖然能從(cong) 正麵創造價(jia) 值，但是也有其負麵影響，即存在泄露隱私的風險。隱私是如何被泄露的呢？這其實很簡單，我們(men) 先來分解一下“人肉搜索”是如何侵犯隱私的吧！

　　一大群網友，出於(yu) 某種目的，利用自己的一切資源渠道，盡可能多地收集當事人或物的所有信息；然後，將這些信息按照自己的目的提煉成新信息，反饋到網上與(yu) 別人分享。這就完成了第一次“人肉迭代”。

　　接著，大家又在第一次人肉迭代的基礎上，互相取經，再接再厲，交叉重複進行信息的收集、加工、整理等工作，於(yu) 是，便誕生了第二次“人肉迭代”。如此循環往複，經過多次不懈迭代後，當事人或物的畫像就躍然紙上了。如果構成“滿意畫像”的素材確實已經證實，至少主體(ti) 是事實，“人肉搜索”就成功了。

　　幾乎可以斷定，隻要參與(yu) “人肉搜索”的網友足夠多，時間足夠長，大家的毅力足夠強，那麽(me) 任何人都可能無處遁形。

　　其實，所謂的大數據挖掘，在某種意義(yi) 上說，就是由機器自動完成的特殊“人肉搜索”而已。隻不過，這種搜索的目的，不再限於(yu) 抹黑或頌揚某人，而是有更加廣泛的目的，例如，為(wei) 商品銷售者尋找最佳買(mai) 家、為(wei) 某類數據尋找規律、為(wei) 某些事物之間尋找關(guan) 聯等。總之，隻要目的明確，那麽(me) ，大數據挖掘就會(hui) 有用武之地。

　　如果將“人肉搜索”與(yu) 大數據挖掘相比，網友被電腦所替代；網友們(men) 收集的信息，被數據庫中的海量異構數據所替代；網友尋找各種人物關(guan) 聯的技巧，被相應的智能算法替代；網友們(men) 相互借鑒、彼此啟發的做法，被各種同步運算所替代。

　　各次迭代過程仍然照例進行，隻不過機器的迭代次數更多，速度更快，每次迭代其實就是機器的一次“學習(xi) ”過程。網友們(men) 的最終“滿意畫像”，被暫時的挖掘結果所替代。之所以說是暫時，那是因為(wei) 對大數據挖掘來說，永遠沒有盡頭，結果會(hui) 越來越精準，智慧程度會(hui) 越來越高，用戶隻需根據自己的標準，隨時選擇滿意的結果就行了。

　　當然，除了相似性外，“人肉搜索”與(yu) “大數據挖掘”肯定也有許多重大的區別。例如，機器不會(hui) 累，它們(men) 收集的數據會(hui) 更多、更快，數據的渠道來源會(hui) 更廣泛。總之，網友的“人肉搜索”，最終將輸給機器的“大數據挖掘”。

　　4.隱私保護與(yu) 數據挖掘“危”“機”並存

　　必須承認，就當前的現實情況來說，大數據隱私挖掘的“殺傷(shang) 力”，已經遠遠超過了大數據隱私保護的能力；換句話說，在大數據挖掘麵前，當前人類有點不知所措。這確實是一種意外。自互聯網誕生以後，在過去幾十年，人們(men) 都不遺餘(yu) 力地將碎片信息永遠留在網上。其中的每個(ge) 碎片雖然都完全無害，可誰也不曾意識到，至少沒有刻意去關(guan) 注，當眾(zhong) 多無害碎片融合起來，竟然後患無窮！

　　不過，大家也沒必要過於(yu) 擔心。在人類曆史上，類似的被動局麵已經出現過不止一次了。從(cong) 以往的經驗來看，隱私保護與(yu) 數據挖掘之間總是像“走馬燈”一樣輪換的——人類通過對隱私的“挖掘”，獲得空前好處，產(chan) 生了更多需要保護的“隱私”，於(yu) 是，不得不再回過頭來，認真研究如何保護這些隱私。當隱私積累得越來越多時，“挖掘”它們(men) 就會(hui) 變得越來越有利可圖，於(yu) 是，新一輪的“挖掘”又開始了。曆史地來看，人類在自身隱私保護方麵，整體(ti) 處於(yu) 優(you) 勢地位，在網絡大數據挖掘之前，“隱私泄露”並不是一個(ge) 突出的問題。

　　但是，現在人類需要麵對一個(ge) 棘手的問題——對過去遺留在網上的海量碎片信息，如何進行隱私保護呢？單靠技術，顯然不行，甚至還會(hui) 越“保護”，就越“泄露隱私”。

　　因此，必須多管齊下。例如從(cong) 法律上，禁止以“人肉搜索”為(wei) 目的的大數據挖掘行為(wei) ；從(cong) 管理角度，發現惡意的大數據搜索行為(wei) ，對其進行必要的監督和管控。另外，在必要的時候，還需要重塑“隱私”概念，畢竟“隱私”本身就是一個(ge) 與(yu) 時間、地點、民族、文化等有關(guan) 的約定俗成的概念。

　　對於(yu) 個(ge) 人的網絡行為(wei) 而言，在大數據時代，應該如何保護隱私呢？或者說，至少不要把過多包含個(ge) 人隱私的碎片信息遺留在網上呢？答案隻有兩(liang) 個(ge) 字：匿名！隻要做好匿名工作，就能在一定程度上，保護好隱私了。也就是說，在大數據技術出現之前，隱私就是把“私”藏起來，個(ge) 人身份可公開，而大數據時代，隱私保護則是把“私”公開(實際上是沒法不公開)，而把個(ge) 人身份隱藏起來，即匿名。

　　(作者：楊義(yi) 先、鈕心忻，均為(wei) 北京郵電大學教授)

（責編：常邦麗）

你的隱私，大數據怎知道？我們又該如何自我保護？

相關閱讀

專題推薦

微觀

賞閱

資料雲

即時新聞