文/黃彥霖

我們都知道不該「以貌取人」,當然,我們也不該只因封面設計就以為自己明白書籍的內容。

話雖如此,但還是有人嘗試這麼做──而且還是嚴肅的科學研究機構!

根據麻省理工學院(MIT)自家的新聞平台報導,麻省理工媒體實驗室(MIT Media Lab)最近和喬治亞理工學院(Georgia Tech)合作,發展出一種計算機成像(Computational photography)攝影機,能夠在不翻開書的狀態下就偵測到書中內容,完全做到以貌取人,呃,以封面取書的「表面工夫」!

這項研究論文發表在最新一期的《Nature Communications》雜誌上,它運用輻射及光譜分析透視紙張,先以介於微波和紅外線之間的兆赫茲(terahertz)輻射測量書頁間的距離,再透過書頁反射回來的輻射數值判斷每個面積單位中的油墨狀態,最後用字跡辨識演算技術將這些狀態碎片像拼圖一樣,拼湊成字。

話說回來,科學機構做這種研究要幹嘛?

雖然兆赫茲射線仍是一種很年輕的技術,但MIT的測量法已經可以辨識九層寫有單一字母的紙張了。並且,由於兆赫茲射線的能量比其他電磁波低,比較不會對測量目標造成損傷,是用於測量容易損壞物品的強大工具。舉例而言,以往最常用來透視的X光只能觀測到關於每張紙的狀況,而無法提供我們書本的內容;但MIT的兆赫茲測量技術,能讓研究者在不碰觸到書本的狀態下辨識出每一頁上的文字,降低研究過程本身對古籍和珍本書可能造成的破壞,並獲得解析度較佳的測量結果

該篇論文的通訊作者海胥瑪(Barmak Heshmat)表示,紐約大都會藝術博物館(The Metropolitan Museum of Art)對這項技術未來的發展很有興趣,打算將它應用在一些可能因為年代已久而完全禁不起觸碰的古書上

這套觀測技術利用兆赫茲射線的部份之外,還要加上喬治亞理工學院開發出的字跡辨識演算法才能真正組合出可閱讀的文字內容。但是,想像一下數十甚至數百個字母重疊後的雜亂痕跡,真有辦法將它們一個一個分離開來嗎?事實上,根據海胥瑪表示,這套字跡演算法的準確度甚至足以通過目前大多數網站用來分辨真人和機器程式的驗證碼測試(CAPTCHA)。

想像一下這樣的畫面:也許,當MIT的技術發展成熟,能夠從任何厚度的書中提取清楚的內容文稿和畫面,未來的我們就能在VR或AR的環境中,毫無顧慮地讀著《死海古卷》、初版《坎特伯雷故事集》或是喬治R.R.馬汀的《群鴉盛宴》手稿。

而且我們只要盯著封面就好

參考資料

PopsciScienmagMIT

那些關於古書的故事:

  1. 【故事‧說書】書本的故事,就是愈來愈多人能參與閱讀與書寫的故事:《書的演化史》
  2. 英國珍古書店意外發現托爾金親手註釋中土大陸地圖,號稱20年來最完好!
  3. 馬奎斯《百年孤寂》首版珍本失而復得 主人卻大方捐給圖書館:「這本書屬於我們所有人!」

延伸閱讀:

  • 用Line傳送