首頁 | 網路雲 | 紙記憶 | 貓眼看世界

[推特小抄] 電子書轉換成本問題

2010年1月19日星期二 | 3 個迴響
現在台灣電子書實務上的根本問題是檔案轉換成本,而檔案轉換成本為何是問題,則是因為作者、譯者、編輯都還在用Big-5碼的文書處理器。Big-5碼無法輸入罕用字,編輯以為這件事無解,所以最後都推到美編去造字。這樣印刷沒問題,但EPUB則會轉出一堆亂碼。

(要追蹤更多我的推特情報,請 follow 我的推特帳號 @octw

3 個迴響 to "[推特小抄] 電子書轉換成本問題"

  1. djboy 提到... 星期二, 一月 19, 2010

    就算使用Unicode,仍然會有「難字」的問題。像是政府的全字庫有8萬個字,但是仍然會有造字的需求。
    另外一個方法,就是像大陸現今的規定,只要電腦打不出來字,就不準民眾取這個名字。

    電子書未來一定會遇到"字碼"這個大問題。各種語言的同碼不同字,至今仍然沒有一個最完整的解決方案。可能要有一個國際機構,去把所有語言統一起來,好好的編個長長的list吧。

  2. 何岳峰 hoamon 提到... 星期三, 四月 21, 2010

    > 電子書未來一定會遇到"字碼"這個大問題。各種語言的同碼不同字,至今仍然沒有一個最完整的解決方案。可能要有一個國際機構,去把所有語言統一起來,好好的編個長長的list吧。

    這個組織就是 Unicode(www.unicode.org) 呀! 它只是還沒把古今中外的所有文字搜齊而已。而事實上,它的中文字部份是有賴台灣及中國提供的,要不然這世上還有那些國家比我們更懂漢字呢!

  3. HerbLin 提到... 星期三, 六月 09, 2010

    電子書遲早要走向圖文並存的大型檔案,不久的將來電子書格式會有一翻大革命,更強的排版格式,更強的多媒體內嵌,更平滑的圖形模擬罕用字。目前則是卡在已量產的電子書硬體尚無法提供高解析度印刷圖形等大流量的運算能力與儲存空間(桌上型的運算能力倒是夠了,可惜商機不夠大,沒人要做),雖說高速運算能力電子書的技術現在已不是問題,但是造價可能數十萬,目前萬元以內的機種運算處理能力都很陽春。而Big5與Unocode的對應,還有罕用字的處理,只要硬體的圖形運算能力夠強,軟體的搭配也不會是問題(有商機就會有人去寫)。最簡單的方法就是將罕用字直接擷取為圖形,嵌在電子書檔案中,只要硬體的圖形運算能力越強,閱讀就越美觀。缺點則是,無法對此罕用字做文字檢索搜尋,因為輸入法打不出來 XD
    我有處理過幾件大型資料庫的內碼轉換專案,通常罕用字都會出現在姓名,處理起來雖然時間冗長,但是只要資料的格式抓到且抓得準確,轉換程式寫一遍就可以一直延用。關鍵技術在於罕用字的圖形如何對應到文字之間,還有排版的定位準確度。複雜的運算需要夠強的硬體。

張貼意見

竭誠歡迎迴響,但:
一、請針對主題;
二、請保持網路禮節;
三、請勿讓人感覺像是 Spam;
四、請注意:匿名回應可能會被刪除。回應時至少請選擇「名稱/網址」身份,只需填寫名稱即可(網址留白無妨)。感謝。