メモ@inudaisho

君見ずや出版 / 興味次第の調べ物置き場

Koboのストアにある英語のパブリックドメイン

 ちょっと前に kobo glo HD を買ったがどうも使い勝手がわるくてあんまり使っていなかったのだが、YotaPhone2 を読書端末として活用しだしてeInkもなかなかよいということがわかって来た。そういうことで kobo glo HD が使えたらよほど便利だろうとおもいだして取りだしたのだが、とりあえず無料タイトルとなると青空文庫をそのままKobo化したものがでてくる。青空文庫は内容が偏っていて発掘し甲斐がないので、青空文庫を探るくらいなら中国の歴史・古典系共有サイトを探した方がよほどおもしろいものがでてくる。(何かにつけて青空文庫をdisるスタイル) それならとりあえずKoboストアの英語はどうだろうととりあえずアフガニスタンで検索してみると出るわ出るわ続々と古いタイトルがでてきた。なかなかいい感じなので自分が読みかけて放置してた19世紀の本をためしに数冊落としてみて内容をみると、表紙・タイトルページなどはスキャン画像そのままだが、本文の方はほとんどテキスト化されているようだ。お、これは使えるか? と読みすすめてみると実際のところはまったく校正されていないOCRテキストであった。その出所も Archive.org で、機械的OCRしてそのまま放置されてるものをそのままKoboで読めるようにしたものだった。英語のテキストであっても19世紀の古い本だとOCRの結果がおかしいのできちんと校正しないと読めないのだが、ジャンルがマイナーすぎて誰も校正しない。それがそのままKoboにもってきているわけで、そんな中途半端なもん出すくらいなら画像のままのファイルでやってほしいところだ。
 とはいいつつも、国会図書館の画像のように見開きそのままの画像のものをみるときは大変みづらいので結局またお蔵入りとなる。なんとかならんのかな。Kindleにはそういう見開きの画像を半分にしてくれる機能あるんだろうか。要は eBookDroid みたいなのが動けばいいだけなんだが、まぁつまりその要求をみたすものは中国の電子ペーパー端末しかなく。