The following two tabs change content below.

文/賽斯.史蒂芬斯—大衛德維茲;譯/陳琇玲

在歐巴馬第一次總統大選勝選之夜,大多數評論都專注於讚美歐巴馬和承認歐巴馬此次選舉的歷史意義。這時,包含「歐巴馬」一詞的 Google 搜尋,每一百則裡就有一則也包括「kkk」或「黑鬼」等字眼。也許這個比例聽起來不是很高,但想想看,人們有成千上萬的非種族主義理由,在 Google 上對這個有迷人家庭、大爆冷門勝選、即將接管世上最有權勢職務的年輕人進行搜尋。在選舉之夜,人們對於「風暴前線」(Stormfront)這個在美國很受歡迎的白人民族主義網站的搜尋次數和註冊人數,8比平常高出十倍以上。在某些州,「黑鬼總統」的搜尋次數超過「首位黑人總統」的搜尋次數。9

由此可知,這股邪惡與敵意暗暗隱藏在傳統資訊來源裡,但在人們進行的搜尋中,這股邪惡與敵意卻相當明顯。

那些搜尋顯示出的社會現況,跟認為種族主義只占一小部分的社會,有著極大的出入。在二○一二年時,我聽說過唐納德.川普這號人物,主要因為他是商人和實境節目主持人,我跟大家一樣完全沒想到四年後他會成為舉足輕重的總統候選人。但是這些醜陋的搜尋倒也說明了,川普這位操弄選民劣根性,以憤怒和憎恨抨擊移民的候選人為何會勝選。

Google 搜尋也告訴我們,我們對於哪些地方種族主義較為嚴重的看法其實是錯誤的。一般調查顯示和人們普遍認為,現代種族主義主要聚集在南方,而且有這些想法者大多是共和黨人。但事實上,種族主義搜尋率最高的地方包括紐約州北部、賓州西部、俄亥俄州東部、密西根州工業區和伊利諾州務農地區,以及維吉尼亞州西部、路易斯安那州南部和密西西比州。Google 搜尋數據顯示,真正的分歧不是南方與北方,東岸與西岸。你不會在密西西比州西部找到這種數據,而且種族主義並不侷限於共和黨人。事實上,跟民主黨人所占比例很高的地區相比,共和黨人比例很高的地區,針對種族主義所做的搜尋並沒有比較高。換句話說,Google 搜尋有助於為美國種族主義畫出一張新的地圖,而這張地圖可能跟你所推測的截然不同。南方的共和黨人或許更有可能承認自己有種族主義,但北方有許多民主黨人也有類似的態度。

四年後,這張地圖就彰顯了它「足以說明川普為何贏得總統大選」的重要性。

二○一二年時,我使用以 Google 搜尋設計的這張種族主義地圖,重新評估歐巴馬的種族背景能發揮何種作用。數據清楚顯示,在美國針對種族主義進行大量搜尋的地區,歐巴馬的得票率大幅輸給四年前民主黨白人總統候選人約翰.凱利(John Kerry)。跟這些地區有關的任何其他因素,包括教育水準、年齡、教會出席率或槍枝擁有權,都無法解釋這項關係。種族主義的搜尋並未預測民主黨其他候選人的低得票率,唯獨歐巴馬例外。

這項結果意味著一個巨大的影響。單就種族主義這個因素,大概就讓歐巴馬的全國得票率少掉四個百分點,這項數字遠高於依據任何調查所做的預測。歐巴馬當選及連任總統,當然要歸功於一些情勢對民主黨相當有利,但歐巴馬必須克服的事,遠比依靠傳統數據來源者(幾乎大家都是這樣)的認知要多得多。在對民主黨不太有利的年度來說,種族主義者的人數已經多到,足以協助贏得初選或決定大選。

起初,我的這項研究遭到五家學術期刊的拒絕。10許多同儕審查者都表示,要去相信美國有那麼多人懷有種族主義這種敵意,實在是太不合情理了。這根本不符合人們長久以來的認知。而且,Google 搜尋似乎是一個異於尋常的數據集。

現在,我們目睹了川普的總統就職典禮,我的發現似乎更為可信了。

我研究得愈多,就愈了解 Google 有許多資訊有助於理解選舉和許多其他主題,但民調機構卻沒有發現這些資訊。

舉例來說,Google 搜尋就有誰最後會去投票的相關資訊。沒去投票的選民中,有半數以上在選前接受民調時表示,他們打算去投票,因此讓預估投票率出現偏差。然而,選舉前幾週 Google 上針對「如何投票」或「去哪裡投票」的搜尋,就能準確預測美國哪些地方會有高投票率。

Google 搜尋甚至可能找出人們會投票給誰的相關資訊。我們真的可以只憑人們搜尋了什麼,就能預測出人們會投票給哪位候選人嗎?顯然,我們不能只是研究哪些候選人最常被搜尋。許多人因為喜歡某位候選人,而搜尋那位候選人;但是,因為討厭那位候選人而加以搜尋的次數也不相上下。話雖這麼說,我跟加州大學洛杉磯分校(University of California, Los Angeles)財務金融系教授斯圖亞特.加布利爾(Stuart Gabriel)發現一個跟人們打算如何投票有關的驚人線索。

跟選舉相關的搜尋有極大的比例包含兩位候選人的姓名。在川普和希拉蕊.柯林頓(Hillary Clinton)爭取二○一六年總統寶座選舉期間,有些人搜尋「川普 柯林頓 民調」,有些人則從「柯林頓 川普 辯論」中尋找重點。事實上,人們在搜尋「川普」時,其中有一二%的搜尋也包括「柯林頓」一詞,而對「柯林頓」所做的搜尋中,有超過四分之一的比例也包括「川普」一詞。

我們發現這些看似中立的搜尋,其實可以提供我們一些線索,了解個人究竟支持哪位候選人。

怎麼做到的呢?關鍵就是候選人出現的順序。我們的研究顯示,在進行包括兩位候選人姓氏在內的搜尋時,人們更可能將自己支持的候選人放在前面。

在前三次選舉中,比較常出現在搜尋順位最前面的候選人獲得最多選票。更有趣的是,候選人的搜尋順序也能預測特定州別可能由民主黨或共和黨勝出。

候選人的搜尋順序似乎也包含民調可能忽略的資訊。歐巴馬跟共和黨候選人米特.羅姆尼(Mitt Romney)在二○一二年大選爭取總統寶座時,知名統計學家暨記者奈特.席佛(Nate Silver)準確預測出五十州的投票結果。然而我們發現,在搜尋中,羅姆尼較常列於搜尋順位前面的那些州,羅姆尼的得票率其實比席佛的預測來得高;反之,歐巴馬較常列於搜尋順位前面的那些州,歐巴馬的得票率確實比席佛的預期更好。

這個指標可能包含民調忽視的資訊,因為選民可能對自己說謊,或是不願向民調人員透露他們真正的偏好。也許如果選民聲稱還沒決定二○一二年大選要投給誰,但是一直在搜尋「羅姆尼 歐巴馬 民調」、「羅姆尼 歐巴馬 辯論」和「羅姆尼 歐巴馬 大選」,那麼他們就打算投票支持羅姆尼。

那麼,Google 預測出川普會當選嗎?這個嘛,我們還有很多研究要做,而且我需要更多研究人員加入,才能知道怎樣充分利用 Google 數據來預測選舉結果。這是一門新科學,況且我們只有幾次選舉的數據可用。我當然不是說我們現在或日後,可以完全不把民意調查當成預測選舉的輔助工具。

但是在網路上,在許多時間點絕對有跡象顯示,川普的得票數可能超出民調預測。
在共和黨大選期間,有線索指出選民可能支持川普。非裔美國人接受民調時表示,他們會用選票展現對川普的不支持。但 Google 搜尋有關非裔美國人密集地區投票的資訊顯示,會去投票的非裔美國人並不多。在選舉當天,希拉蕊就因為非裔美國人投票率低,而流失不少選票。

註釋

8 作者對Google搜尋趨勢的數據所做的分析。我也擷取風暴前線所有會員的數據,這部分討論詳見Seth Stephens-Davidowitz, “The Data of Hate,” New York Times, July 13, 2014, SR4。相關資料可於作者官網下載,詳見sethsd.com,點選Research/Data,標題為「Stormfront」的資料區。

9 作者對Google搜尋趨勢的數據所做的分析。肯塔基州、路易斯安那州、亞歷桑納州和北卡羅來納州都有此狀況。

10 這篇論文後來終於發表了,詳見Seth Stephens-Davidowitz, “The Cost of Racial Animus on a Black Candidate: Evidence Using Google Search Data,” Journal of Public Economics 118 (2014)。關於這項研究的更多細節可參考這篇論文,相關數據亦可於作者官網sethsd.com,以「Racism」為標題的資料區中找到。

※ 本文摘自《數據、謊言與真相:Google資料分析師用大數據揭露人們的真面目》前言,原篇名為〈川普勝選讓你跌破眼鏡?那是你沒看懂數據 ——歐巴馬勝選代表種族歧視已經好轉?看看「黑鬼」的搜尋次數好嗎?〉,立即前往試讀►►►

  • 用Line傳送