メモ@inudaisho

君見ずや出版 / 興味次第の調べ物置き場

国会図書館デジタルコレクションのうすぐらい画像

 国会図書館デジタルコレクションの画像は

白黒→グレースケール→カラー

 と進化をとげているがグレースケールになったとき、なぜか画像が全体に薄暗くなっているものがある。
 たとえばこれ。
国立国会図書館デジタルコレクション - 野戦騎兵小隊長必携
 この薄暗さはたとえば画像編集ツールで色の分布をみるとその偏りが明瞭になる。

 左側にある入力レベルの欄をみると真ん中に山があるのがみえる。左端が黒、右端が白でその間の256階調のどこが多いかを図示したものだが、普通は黒から白まで256階調全部つかっているものだが、この画像は中間までしか使っていない。こういう場合、中間までしかつかっていないデータを端の白まで使うよう引きのばしてやればみやすくなる。このソフト(GIMP)では入力レベル欄の直下にある三角を手でいじって直感的に黒端と白端を操作できる。動かした黒端の左側と白端の右側は切りおとされ、その間が白から黒の256階調に引きのばされる。

 こんな感じにすると人間の目にみやすくなるのだが、これはいうまでもなく情報量を減らしているだけだ。山の右端くらいに白端の三角をあわせると、標準的な白黒写真的画像になるが、インクの裏移りとか紙のシミとかの情報も入るので、こうやって山の左側に合わせて情報量を減らし白黒を強調すると、かえってよくみえるようになる。これが写真だとそうは行かない。黒から白の間は256段階しかないのに、さらにその半分程度しかつかわないように制限されているので写真の情報がそれだけ劣化してデジタル化されているのである。目にみやすいように調整しても欠落した情報は元にもどらない。

 ところでこの本がデジタル化されたのは

デジタル化日(W3CDTF形式) (dateDigitized:W3CDTF)
2010-09-30

 であり、大規模デジタル化のときにおこなわれたものだということがわかる。


国立国会図書館 電子化 業務 (大量電子化プロジェクト)
平成22〜23年 NDL 大規模デジタル化プロジェクト

 つまりこれ↑だ。(株)国際マイクロ写真工業社だ。こういう大量生産状態のときにはそりゃ雑なバイトとかにやらせているだろうからおかしなこともおこるだろう。たとえばピントがボケぎみだったり本が動いてブレている場合はバイトが適当にやったからだろう。
 が、この「情報量が半分しかつかわれていないから薄暗い」問題はバイトが雑とかいう問題ではなくてもうすこし上の問題になる。要は国際マイクロ写真工業社がこういう情報量が半分になった薄暗いデータを大量生産してなんともおもっていないということだ。

 どうも人間の目はグレースケールの場合、128階調(7ビット)程度しか認識できないという制限があるらしい。それで128階調にしたというのならそれはそれでわかるのだが、256階調の中の128階調ならやはりその半分でしかないのはおなじだ。そもそも薄暗いのをなんともおもわないのがおかしい。