多看電子書製作的流程是什麼?

有很多電子書客戶端,多看、豆瓣等等吧,他們是怎麼把一本書轉換成電子書的呢,有沒有版權問題呢,有沒有排版問題,他們是不是把書上的字一個一個敲下來的呢!


前幾天正好也想寫點這方面的東西,希望能夠讓更多的人了解到多看書城的一本電子書是如何製作的。

任何一本圖書如果商務上確定引入多看書城,那麼首先需要版權方提供數據源,各家提供的數據源千奇百怪,質量也千差萬別,雖然我們做了很多努力,但實際上很多版權方提供的數據源都不符合我們的要求,而且我們一般還需要跑一次文字校對,不符合標準的數據源是不能進行下一步的,比如某家版權方的後台會顯示:

數據源審查是第一道關口,如果通過了數據源審查,那麼就進入了正式的製作流程,我們會根據圖書的內容分為封面設計、內文圖設計、排版製作、文案編輯等若干個部分,如果是特別重點或者版式要求高的圖書或雜誌,可能還需要單獨討論設計風格,比如《信息簡史》、《字體故事》、《環球科學》等。

多看書城的圖書很多是圖文混排的,因此圖片設計變得非常重要,版權方提供的數據源很多時候圖片質量是很糟糕的,比如《上帝擲骰子嗎:量子物理史話》這本書,我們遲遲無法上線的原因就是版權方居然無法提供圖片,提供的數據連盜版都不如!而且這本書的實體書版本印刷質量極差,最後這本書的圖片其實是我們自己通過網路途徑收集並加上實體書掃描加工這樣搞出來的,可想而知這中間的代價有多大了。還有一些書,可能版權方自己也沒有保存高清的原圖,我們想盡辦法最後從這本書已經離職的編輯手上拿到了原始的圖片數據,所以你可能會看到,同樣的一本書,我們的圖片清晰度有時可能會遠遠高於其他平台的效果,比如《辭職,去旅行!》這本書,前面是多看的,後面是Kindle的:

計算機的圖書也是多看書城的特色,因為往往裡面有很多代碼塊,很多平台就直接貼張圖完事,很不清晰,也無法搜索,整體效果和實體書相比很差,我們為此專門擴展了交互代碼塊的定義,所有計算機類的圖書都不能直接使用代碼圖片,而必須全部是等寬字體排的代碼文本,並且所有的代碼我們的開發工程師都會利用業餘時間進行審校,以確保代碼的正確性,可以說,計算機的不少圖書,排版效果應該是優於實體圖書的:

排版完成後,我們還有一個團隊專門負責審核,以確保整體效果和內容儘可能的少出錯,對於特別重要的圖書,可能還需要逐字審讀,當然,這個花費的代價就比較大了。

通過審核之後,這本書就可以進入上線隊列準備上線了,對於已經上線的圖書,多看書城還有一個糾錯和更新系統在運行,用戶在多看閱讀的客戶端中,可以通過糾錯功能實時的反饋錯誤信息,系統會每天定時收集所有的反饋並提交到數據加工系統中,內容團隊會定期整理所有的問題並安排更新,更新完畢後再提交到線上系統,這時用戶就可以收到更新通知,並可以查看圖書的更新歷史記錄,這相比實體書來說優勢實在是很明顯,下面是《極簡歐洲史》這本書的修訂歷史記錄,在圖書的詳細信息頁面可以看到:


最近換了新MacBook,今天倒騰移動硬碟翻出了多年前的文檔,一時間往事湧上心頭。如今也不是什麼秘密,就分享一下吧。

從這張圖上可以看出,我們當年真的是在以愚公移山的精神 + 工業時代的思想 + 信息時代的技術+ 一顆"修合無人見,存心有天知"的匠心在做電子書,一口氣打造了5萬本精品電子書。

這張圖其實是BookForge的工作流。BookForge是多看的電子書製作流水線平台,商務、設計、編輯、審校、運營等團隊都在這個平台上協同工作,完成電子書的加工製作流程。BookForge直譯過來的意思就是「電子書的熔爐」(現在還是頗得意自己的這個命名),因為每一本多看電子書都要經過數據源審核、設計、封面製作、排版、文案、審校、審讀、上傳、發布等十幾道工序才能最終呈現到用戶面前,可謂百鍊成金,凝聚了多看各個團隊的辛勤汗水。

另外,多看編輯最熟悉的還有Dobby,多看的電子書排版系統。每天多看的編輯同學都會用它製作出一本本精美的多看電子書。那麼,Dobby這個名字是怎麼來的呢?當時正痴迷《哈利·波特》,如果你看過就一定記得哈利身邊那個忠誠、可愛的小精靈,他的名字就叫Dobby。當時的想法很簡單,就是希望Dobby像對哈利波特一樣,好好地幫助我們做出最棒的電子書。Dobby的開發過程也是相當不容易,完全是摸著石頭過河,時間緊、任務急,卻也留下了一段值得懷念的瘋狂coding的日子。


電子書的製作流程

(1)數據採集:使用高速掃描儀將原件掃描成TIF文件。
(不是普通的掃描儀,有高掃機,把書拆成一頁一頁的,直接像放a4紙近印表機一樣丟進去,就會自動開始掃描了。)

(2)OCR識別:通過對比校對和邏輯校對得到高質量的電子文檔。不能識別的採取雙錄對比和錄入校對的方式完成。
(然後掃出的圖片會通過ocr識別軟體,會自動識別成文字,可以複製粘貼近word那種。軟體不是100%正確,所以這時候可能有某些字因為比較複雜或者字形太過相似未能識別出或者識別錯誤,那麼就要有人用肉眼去查。一般要求的錯誤率好像是千分之五左右。)

(3)版面復原:圖片文件識別校對後生成PDF格式文件,並保持版式的原式原樣。(方正神馬的有這樣的軟體)

(4)電子圖書:根據客戶要求生成不同格式,不同要求的電子圖書。

(5)交付:將文件刻盤交付後,刪除過程文件。(盤還給客戶,當初交給製作公司的東西要全部刪掉,以保護版權,製作合同里也會寫清楚這些)

這就算完整的流程了。
然後版權之類的問題:噹噹之類的,他們應該是不直接買版權的,他們只是對電子書進行銷售或者叫代銷。一本書的版權分很多種,數字出版的版權會單賣個某個做數字出版的公司,然後這個公司會找電子書的製作公司來製作電子書,,然後通過噹噹之類的銷售,噹噹可以得到提成或者是對方出上架費。


推薦閱讀:

多看閱讀被小米收購以後變得怎樣了?
Kindle 3 不安裝多看,看 PDF 的中文書會不會有問題?
雷軍投資多看的目的是什麼?
Kindle 入華後,亞馬遜將如何應對多看閱讀?

TAG:互聯網 | 電子書 | 多看閱讀 |