《大數據》:巨量資料預測未來,挑戰世界互動方式

大數據

by 薛怡青

試讀連結

有一天下午坐在我旁邊的同事突然問我,你正在聽周杰倫的歌,對嗎?我嚇了一跳,差點從椅子上跳起來。我耳機音量調得很小,聲音並未從耳機流露出來,電腦畫面也沒顯示我在聽誰的歌,怎麼坐在我隔壁的同事會知道?他神秘的笑笑說:「Facebook告訴我的。」

這時我才驚覺,原來我不知不覺在各種系統的應用裡,不斷的將我的使用習慣、個人喜好、甚至我思我見透露出去。在Facebook上、在twitter上,在這個以分享為概念的Web2.0時代,讓資訊變得更加大量製造。

就像牛津大學網路研究所教授麥爾荀伯格(Viktor Mayer-Schonberger)所寫的《大數據》(Big Data)這本書中提到:「網路的出現,讓追蹤我們、監視我們變得更容易,就如Amazon會監視我們的購物喜好,Google會監視我們的瀏覽習慣、Twitter會知道我們在想什麼。至於Facebook除了上述資訊之外,甚至監視我們的社交關係。電信公司不但知道我們和誰講話,還知道有誰在我們附近。」

作者麥爾荀伯格是研究「巨量資料」領域的權威,他在本書中闡述「巨量資料」如何挑戰人類的生活方式,以及世界互動的方式。例如, 2009年全美正面臨防疫H1N1的緊急情況,幾位Google的工程師只是突發奇想的將美國民眾在Google搜尋的關鍵字與美國疾病管制局的資料相互比對,居然意外的發現,只要掌握關鍵字搜尋幾乎可以同步掌握流感疫情的傳播情況。

這樣驚人的同步掌控疫情,只是工程師透過一些演算法進行比對,並不需要親自跑去醫院搜集病情資料或檢體。

作者更舉出「巨量資料」甚至讓我們拋下因果關係,只需簡單的相信「相關性」。例如,電子商務網站總是希望將更多的商品加入消費者的購物車,因此推薦系統變得非常重要。以亞馬遜網站舊有的推薦系統來看,當你買了一本嬰兒書,舊系統只會推薦你更多的嬰兒書,他們一直覺得這樣的推薦購物清單是很愚蠢的。於是亞馬遜網站其後研發出「品項對品項」的協同篩選技術,當你下次買了一本嬰兒書,系統會自動推薦你買奶瓶、尿布、甚至嬰兒車。作者提到,透過善用「相關性」,不用將資料一一抽絲剝繭,只要找到重要的指標便能讓資料說話、預測未來。

這讓我想起湯姆克魯斯「關鑑報告」的那部電影,警方在嫌疑犯會犯下罪行之前就先逮補他們。當時我看這部電影時,覺得相當荒謬,因為那個被稱之為「犯人」的人,其實什麼都沒做,就必需要被抓起來,只因為系統根據一些線索分析後,預測他接下來可能會犯案。作者提到,這樣的「預測系統」已應用在美國的假釋委員會裡,將資料分析的結果作為某個囚犯是否能夠假釋的參考資料。甚至在美國有越來越多城市,採用預測治安系統,根據犯罪的頻率、團體、人種、社經地位等去分析哪些路段是否要特別加強巡邏,以防治犯罪。

其實,每次看到科技應用與人性對峙的狀況時,不禁都讓我感到寒顫。正如作者也在書中指出,這是一條危險的道路,如果巨量資料能夠預測未來誰可能犯罪,光是預防可能還是有人會覺得不夠,甚至會想要先去懲罰那些可能會犯罪的人。

作者站在客觀的立場提出,「巨量資料出現的確讓量變引發質變,如果以負責任的態度使用巨量資料,會是一個理性協助決策的工具,但如果使用得不夠明智,就會成為強權的工具造成壓迫──輕則有可能是讓客戶和員工感到委屈,重則可能使得公民受害。」

例如,網路提唱「匿名化」,然而在網路上我們所曝露的資料越來越多,其實要「反匿名化」倒不是件太難的事。書中就舉出,AOL某次公布一些舊有的搜尋資料編號,原本只是想從這些資料裡分析出一些有趣的資訊,AOL也已刪除重要的用戶名稱、IP位址等資訊,但是《紐約時報》還是能在短短幾天用一些關鍵字,找到某編號的人,並登門訪問。這事就好像我們常在新聞裡看到的「人肉搜索」,網路幾乎無所不能,只要幾項關鍵資訊,網友就能在短時間內把真實人物糾出來。

因此在這本書最後,作者也提出了反思,他說:「如果這個世界都是由資料來告訴我們,該如何做決定,那麼人活著、或者你我的直覺,又還有什麼意義呢?」作者認為,巨量資料是一項資源、工具,它的目的是通知,而不是解釋。最終希望當我們在使用這項工具時,必須要懷有更多的謙卑,以及許多的人性。

也許,巨量資料並不可怕,可怕的是運用資料的心態。不久的將來,如果有某個不認識的人能對你瞭若指掌,或許也不必感到太驚訝!