
BiB V記事二:以標準化開創新世界/董福興
文/董福興
今年的Books in Browsers有一個重要的標準化組織贊助,就是進行HTML、CSS等網頁技術標準制定的W3C(WorldWide Web Consortium)。「標準化」這個議題在BiB中一向佔相當重要的地位,前幾年正值EPUB 3制定,IDPF每年都有參與這場會議;但在EPUB 3制定完成後,IDPF與W3C兩個組織開始密切交流合作,今年BiB V上,等於正式宣佈電子書標準化組織的未來走向。
標準化和我們有關係嗎?
大多數的人一聽到「標準化」,直接的感覺就是:這件事和我沒有關係。但事實上,各式各樣的標準構成了我們的生活。
在整場會議的一開頭,先安排了哈佛大學的Matthrw Battles,他早些年任職於圖書館,作品《圖書館的故事》有中譯本,現在擔任跨學科單位metaLAB的Director。他舉了三個歷史上的標準化案例。第一個是畫布(Canvas),畫布隨著文藝復興時代而誕生,當年威尼斯因為航海業而有著最佳的畫布製造技術,加上是義大利創作者的中心,畫布的尺寸、製法就由當時行會(Guild)組織制定。第二個是度量衡的公制,在啟蒙時代由法國在大革命前後先整合,並且融入政府的科層組織,接著逐漸普及至全歐洲。第三個是電報編碼(Baudor Code),文字編碼系統經過一連串的傳承,最後形成電腦編碼系統,進而延伸出各式各樣的新技術。
而這些標準化的過程並非一人所為,而是在制定的過程中集體合作而產生出創新。Matthew認為,標準化就是:
- 標準化是一種統治(governance)的形式;
- 標準化就是文化;
- 標準化是創造世界。
儘管如此,但標準化也是相當政治的。例如國際標準化組織ISO、國際電信聯盟ITU等台灣因為不是會員「國」,所以無法參與(ISO/IEC JTC1 SC2 WG2 IRG這個常態性的漢字工作組除外,但以台北電腦公會身份參加)。不過像W3C與IDPF等組織就沒有限制,這部分後述。
W3C與IDPF聯手的下一步:EPUBWEB
在提EPUBWEB之前,我先說明近幾年IDPF與W3C之間的合作關係。各位所知道的EPUB 3格式,其實是個容器(Container)格式,將數位化的書籍內容,以格式規定的方法打包,透過提供的資料進行閱讀、導覽。而這容器內裝的內容,則是採用Web技術的HTML5與CSS3來呈現。但Web技術是由W3C所制定,為了讓這格式更為完整,兩個組織在2012年起進行合作。於2013年中在紐約、巴黎、東京開了三場工作坊蒐集出版商需求後,於W3C成立數位出版興趣小組,去年十月首次面對面會議後開始運作。
但EPUB是個「可攜式文件」,主要供離線閱讀,多半需要透過EPUB閱讀程式開啟。和Web線上以瀏覽器閱讀有著區隔。經過一年的工作後,W3C數位出版興趣小組決定以「EPUBWEB」專案來消除兩者間的區隔。
W3C數位出版興趣小組的主席,是由IDPF技術長Markus Gylling所擔任,他同時也是DAISY Consortium的技術長。Ivan Herman則是該小組的聯絡人。
EPUBWEB這個計畫,希望讓供離線閱讀的EPUB能夠直接線上透過瀏覽器開啟;同時讓線上發表的內容(如網頁文章)能夠簡單地轉成可攜式文件,兩者之間可以無縫轉換,也就是說:不需轉檔。同時確保兩方的同一性,像是書籤、註記、授權等也能整合。這個計畫可以處理一些領域長期以來的問題:
- 學術出版:
例如一篇Paper在線上發表,但不少讀者會希望能離線閱讀,而最好格式可以適應載具(就是不要PDF!) - 企業文件:
例如企業內部的文件會經常需要修改,同時線上與離線版內容需要一致,像是飛機維修手冊,要確保維修人員手上是最新版,而他們應該早不用紙本了。 - 典藏與教育:
例如Internet Archive典藏全世界的網頁,有時候網頁上的素材會有缺漏,就會需要離線格式來協助儲存;而教科書在現在的情境下,連線比離線的需求更大。
EPUBWEB就是為了滿足這些需求而制定。雖然有一些電子書店已經能做到這樣的事情,但卻是基於各自的服務,EPUBWEB則是希望能夠透過標準化來實現,作為技術的基礎。
但在技術上,還有許多需要解決的事情。例如:
- EPUB採用ZIP作為包裝格式,但在Web的世界裡壓縮打包不是好辦法;
- EPUB有著所有資源的列表,但網站內容沒有;同時網站經常使用複雜的技術呈現,需要簡化;
- EPUB有著唯一識別碼(ISBN),但到Web時,沒有相同的對應資訊。同時書中的位置如何對應到網頁內容也需要定義。
不過EPUBWEB這個計畫才剛啟動,還在意見蒐集階段。依照W3C的規格制定程序,可能會花上好幾年來達成。但至少過去幾年來在Books in Browsers中的各項討論,總算透過這項計畫有了明確的發展,也能確實改變現階段「電子書」不屬於「Web」;「Web內容」不能稱為「書」的問題。
從捲動轉向分頁時,WEB技術還需要些什麼?
「分頁(Pagination)」對於許多Web技術的制定者來說,一直是心中待完成的夢想。這裏所說的分頁,不是像現在內容網站一般手動把長文章分成碎片化來賺取Pageview的做法,而是透過一套機制,自動將長文章在瀏覽器上分成頁面,提供如書般翻頁的閱讀體驗。
這項技術如果成熟,不僅能消除Web與電子書的界線,甚至可以應用在印刷領域上,讓原稿透過CSS排版,直接送印。CSS之父Håkon Wium Lie從二十年前發明CSS時就在想這件事,現在依然在推動。
但要做到,Web技術就需要支援更廣泛書籍排版的各種規則。
Dave Cramer是Hachette Livre(就是與Amazon打價格仗的出版社)的技術人員,去年開始參與W3C活動,他就正在推動這方面的標準化。例如找出現階段拉丁語系文字在排版上的不足,提出需求,並且逐步加入新的CSS規範中。
他在演講上舉了個案例,例如書籍排版常用的首字放大(Dropcap,對岸稱首字下沉),雖然可以透過CSS Pseudo element p:first-letter來達成,但卻需要複雜的CSS來輔助,於是他在CSS Inline Layout中提出更好的處理方式。同時也需要更多語言的範例,例如我所提供的中文範例:
當然,你會覺得像這種排版處理,現在Word、InDesign都能輕易做得到,何必大費周章寫成標準化文件、還要處理語言差異這種麻煩事呢?最重要的是能透過標準化實踐在瀏覽器與規範上,讓作者能簡單地指定內容呈現,並且在任何平台上都能如實呈現。這就是標準化的最重要目的。
還有什麼我們沒注意到的?
W3C國際化小組連絡人Richard Ishida在每次簡報時都有句相同的結語:「Web不是專為拉丁語系所設計,而屬於全世界。」國際化小組(Internationalization, i18n)會檢查各項規範是否符合各語言文字的需求。同時還有另外一個近用性小組(Accessibility, A11y)專為這些規範加入輔助性,讓各種障礙者也能取用這些內容。
Tzviya Siegman任職於美國大型教科書出版社Wiley,不僅活躍於IDPF,現在也是W3C數位出版興趣小組的共同主席。她就提及了近用性標準化的重要與規範作法。
對於大多數正常人來說,對於(電子書)內容的要求不外於「看起來好看」就好。光是處理這些需求就耗費了大半的時間,再加上近用性需求就更長了。所以近用性的處理,盡量採用既有的規範來進行。並且從一開始就牢記在心,將這些規範製作成文件來實踐。他也提到一些案例,例如在電子書中製作表格時,許多人會將其壓成圖片來呈現得「好看」,不過,以HTML寫成的表格無論如何都能提供近用性,但圖片不行。
近用性在台灣是經常被忽略的一點。在BiB後的W3C年會,同時舉辦了W3C成立二十週年的紀念酒會,美國聯邦通訊委員會的Jessica Rosenworcel就提及:如果Web有自己的大憲章,那麼Accessibility與障礙者權利必須列於其中。
在過往,視覺障礙者若想讀一本書,通常是透過第三方團體以數位工具以提供福利的方式給予,但在數位的世界,若近用性作為標準並且被執行,就能如一般人一樣閱讀(透過輔具與各種功能)。這就讓「施—受」關係翻轉,得以站在相同的平面上取得相同的內容。
結語:為什麼我們要在意標準化?
標準化既是統治,也同時與利益息息相關。讓我舉W3C Web&TV興趣小組的案例,每年年會時,這個興趣小組便會聚集來自SAMSUNG、SONY、Panasonic等電視製造商的技術人員,探討各種各種視訊串流的規格。當他們在制定規範時,就能夠同時實作,就算因為彼此角力而有變化,也能取得第一手資料。在創新的戰場上就能取得先機。
除此之外,標準化也是文化。例如與電子書相關的直排實作,主要參考的是日文的排版方法,若透過標準化普及,中文的獨有特色就不能呈現,於是在文化上就慢慢地往積極的那一端靠攏。這已經發生過了一次,例如Word、InDesign等工具的避頭點,隨著工具普及,現在也成為一項中文排版的準則。
標準化的進行曠日費時,包括需求徵集、尋求共識、撰寫規範以及測試檢驗等等。像日文排版需求書這份參考文件前後就花了五年寫成,不妨認為標準化是持續進行的活動。一般標準化在開發中國家由政府擔當,之後由利益相關的企業接手。在台灣兩方都不慎積極,就算參與也是專案,執行完畢後即切斷關係。這是相當可惜的事。
你能做些什麼?
我目前是W3C i18n工作小組的邀請專家( Invited Expert),負責中文排版需求的文件撰寫。你可以透過訂閱EPUB製作課程每月定額贊助。若你是排版專家或者出版社專業編輯,歡迎提供任何排版上的需求與規則。若你願意長期參與,也能成為這份文件的共同編輯。
- YouTube「Matthew Battles, Bearing the Standards: Histories of Cooperative Innovation」
- YouTube「Tzviya Siegman, The Inadvertent Accessible Content Architect」
- Slide「Markus Gylling & Ivan Herman, Bridging the Web and Digital Publishing」