《二十一世紀資本論》大賣超過一千五百萬冊,但讀者可能只讀了⋯⋯2.4%!?
Photo Credit: Unsplash

《二十一世紀資本論》大賣超過一千五百萬冊,但讀者可能只讀了⋯⋯2.4%!?

編譯/暮琳

如果說紙本書的寶貴之處在於紙的觸感、書的氣味、收藏價值或幫助記憶的實體感,電子閱讀則為讀者與出版業者帶來其他禮物:近乎無限的收納空間、攜帶便利性、搜尋功能以及最重要的——統計數據。當全世界都試著用數字來獲取資訊,電子化的書本除了服務讀者、為讀者提供內容,同時也替作者與出版業者提供了了解讀者的新管道。「霍金指數」(Hawking Index)便是其中一個有趣的例子。

2014年,數學家喬登.艾倫堡(Jordan Ellenberg)發明了霍金指數,專門用來「測量」讀者決定放下一本書前通常會讀到故事的哪裡。然而「測量」一詞不完全正確。霍金指數的原理其實非常單純。簡單來說,亞馬遜(Amazon)會蒐集讀者在Kindle閱讀器上的筆記,並統計一本書中哪五句話最常被讀者畫線。艾倫堡只是整理了亞馬遜的計算結果,並觀察這五句話分布在書中哪些部份。如果讀者做的記號平均分散在各章節,便大膽推測讀者看完了這本書;相反的,如果一本書中受喜愛的句子只集中在前幾章節,就能猜想讀者對這本書或許沒有太多耐性。透過這些訊息,艾倫堡整理出了一張名單,羅列出Kindle上哪幾本書雖然容易被讀者相中卻似乎不容易跟讀者走到最後。

結果顯示,希拉蕊.柯林頓(Hillary Clinton)在一年內賣出超過三十四萬冊的從政回憶錄:《Hard Choices》尷尬成為第一名——讀者喜愛的句子全集中在書本前三十三頁。托馬.皮凱提(Thomas Piketty)的《二十一世紀資本論》(Capital in the Twenty-First Century)討論了資本主義社會中財富不均的問題。這本書不但受到多位諾貝爾經濟學得主推薦,也創下銷售量超過一千五百萬冊的驚人成績。然而Kindle給出的數據卻顯示最常讓讀者動手標記的句子只出現在本書前2.4%的部分。

暢銷小說《飢餓遊戲》第二部:《星火燎原》(Catching Fire)也出現稍微讓人意外的結果。「飢餓遊戲」系列以緊張的生存戰、性格鮮明的角色和殘酷的反烏托邦設定吸引了全球數以萬計的粉絲,改編電影也獲得廣大迴響。不過霍金指數卻指出,二部曲中讀者喜歡的句子只出現在故事前43.4%的篇幅中,表示看完這本書的人也許沒有想像中這麼多。

而「霍金指數」這個名稱也許早讓敏銳的讀者好奇起物理學家史蒂芬.霍金(Stephen Hawking)和這整件事有沒有關係。艾倫堡表示,他在取名時想到的便是霍金的《時間簡史》(A Brief History Of Time)。出版於1988年的《時間簡史》在這幾十年間被翻成三十五種語言,售出達千萬本,絕對可以算是二十一世紀最知名的科學著作之一。霍金更在2005年出版了《新時間簡史》(A Briefer History of Time),加入最新研究並重新整理舊版本中讀者感興趣卻難以掌握的部分,足見這本書受歡迎的程度及其影響力。然而《時間簡史》,卻同時是知名的「買了卻看不完的書」。艾倫堡也在統計結果中證實,讀者最常標記的句子大概只出現在這本書前6.6%的頁數中。

想當然,「霍金指數」的統計方式有許多明顯缺失。比方說沒有電子書的作品完全被排除在外、有些讀者可能沒有邊讀邊做記號的習慣、讀者喜歡標記直接陳述資訊的文字,而這些句子可能集中在書中某一章節⋯⋯只看讀者最常畫線的五句話來判斷一本書有沒有被讀完並不公平。但,儘管方法稱不上嚴謹,「霍金指數」卻仍多多少少的,替出版方指出一個觀察讀者反應的方向。

艾倫堡提到,他投入這項研究的動機便是因為自己出版了《How Not To Be Wrong: The Power Of Mathematical Thinking》一書,並急切的想知道讀者的想法。艾倫堡坦承,當他發現讀者喜歡的句子竟然全集中在前三章節時的確有點沮喪。然而,艾倫堡的書最後還是登上了紐約時報暢銷書榜。再次應證了,一本書是否受歡迎和讀者是否從頭到尾都有認真畫線也許真的是兩回事吧。

「霍金指數」只是資訊與閱讀文化結合的其中一項應用。除了讓作者觀察讀者,讀者也同樣能用類似的手法回頭剖析作者:「暢銷作家最愛用的字」、「經典作品的開頭與結尾有沒有共同點」、「標點符號與書本銷售量的關係」等等大家可能好奇過的問題也在文字普遍電子化的趨勢下成為許多愛書又愛數字的人們研究的題目。甚至,市面上還出現了《文學大數據》(Nabokov’s Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing)與《暢銷書密碼》(The Bestseller Code)等專門以統計學與資訊科學角度解讀文學作品的書。雖然說文學中的語言美感、情緒、節奏與氣氛能不能簡單的化約成數據是個問題,但有機會從如此不同的角度觀察自己心愛的作品,多少也算是二十一世紀讀者的某項特權吧。

資料來源:

BookriotnprReadmoo

該買的和該讀的:

  1. 你已經忘記的那本暢銷書,未來可能被譽為經典
  2. 我的眼睛業障重啊!以編輯、時運,加上文字探勘技術,尋找《暢銷書密碼》
  3. 暢銷書是可以預測的?──未經包裝的書稿見真章

延伸閱讀: