メモ@inudaisho

君見ずや出版 / 興味次第の調べ物置き場

国文研古典籍データセット

国文研古典籍データセットの公開 | 国文学研究資料館

 CC by SA で公開するとのことでこれは使えるな。画本虫撰を落としてみたらちゃんとカラーだった。昔このサイトで公開してたマイクロフィルムのデータはみづらい白黒だったがこの中にも白黒のデータまじってるんだろうか。それともあれは他機関がマイクロフィルム化したものを電子化したからだろうか。
 気になるのはファイル名で、NIJL0000.zip という具合で四桁の数字しかつけていない。

約30万点の古典籍を画像化した「日本語の歴史的典籍データベース」の構築を目指しています。

 とあるからには30万点に対応できるようなファイル名のつけかたをしないといけないはずで少なくとも6桁必要のはず。実は一万点を越えるファイルを公開するつもりはないという意思表示だろうか。それとも一万点を越えたらケタを増やすとかそんなんだろうか。もしくは windows3.1 とか DOS を内部で使ってるのでファイル名に8文字以上使えないとか。