メモ@inudaisho

君見ずや出版 / 興味次第の調べ物置き場

青空文庫の校正支援

 青空文庫では1万強の「作品」が公開されているがそのうち多いのはなにか。csvで公開未公開ふくめて各テキストの現状データが置いてあるのでそれをsqliteにつっこんで抽出してみた。

1169 宮本 百合子
637 岸田 国士
444 坂口 安吾
374 芥川 竜之介
355 豊島 与志雄
342 牧野 信一
298 小川 未明
288 寺田 寅彦
275 宮沢 賢治
272 太宰 治

 なるほど。メジャーな売れっ子作家の間にマイナーな人がまじっている構成。青空文庫は無償奉仕の入力によるテキストが奉納されたところだから、つまりそこまでしてやるだけの信心がないと進まない。メジャーな作家は読者が多い分信者も多いだろう。しかしマイナーな人でも熱心な布教者がいればテキスト化も進むということだろう。
 特に断トツでトップの宮本百合子、この人は日本共産党の戦後の指導者宮本某の嫁でしかも早くに死んだということで日本共産党信者の崇拝を受けている(もしくは日本共産党が読み物として推奨する)人だ。新日本出版社というまっかっかな出版社が信者向けに今でも全集を出している。どういう人がテキスト化したのかというと、柴田卓治なる人物がたった一人で入力したらしい。底本はもちろんその新日本出版社のものだ。たった一人で入力した可能性も否定できないが、代表者かもしれない。これだけからだと、青空文庫宮本百合子のために存在するようにもみえる。

 ところで青空文庫の特色として「校正者」がいることが上げられる。それによってテキストの質が上がるのだが、校正が済まないと公開されない。しかも入力者と校正者は別であることが要求されるので、奉納されたテキストも公開されないまま放置されることがある。
 データの中には奉納されるまえの「入力中」「入力予約」「入力取り消し」「翻訳中」や「非公開」なんてのもまじっているのでそれを除き、テキストは奉納されたけど公開されてないもののランキングを選ぶとこうなる。

525 小川 未明
432 野村 胡堂
195 田山 花袋
195 田山 録弥 (※田山花袋のこと)
114 伊藤 野枝
81 福沢 諭吉
79 徳田 秋声
79 中原 中也
79 折口 信夫
75 大町 桂月

 ついでに2010年より前から放置されているのを探すとこうなる。

79 折口 信夫
73 福沢 諭吉
52 長谷川 時雨
50 田山 花袋
50 大町 桂月
50 田山 録弥
27 国枝 史郎
26 佐藤 垢石
23 宮本 百合子
23 喜田 貞吉

 数があまり変わっていないのは福沢諭吉折口信夫あたりで、だれもやりたがらないらしい。田山花袋などはせっせせっせとテキスト化する人がいるらしいがだれも校正しないようだ。

 ちなみに宮本百合子を校正した人をみるとこうなる。

453 磐余彦 (※磐余彦イワレヒコは神武天皇の名前)
445 米田進
132 土屋隆

 100以下は割愛した。実に900近くを二人だけで校正している。特にトップのイワレヒコは宮本百合子専門で、放置したままには置けないなにかがあったのだろう。今は一人が校正するのは100以下に抑えることとなっているので、ここまで露骨な偏りはできないようだ。

 ところで入力よりも校正に無償奉仕の奴隷があつまりにくいということで有償で校正する校正支援なる仕組が青空文庫に2011年以降できたらしい。具体的にどういう手続なのかしらないが、どういうものが校正支援されたのか抽出してみると、こうなる。

著者 タイトル 入力者 校正者 公開日
戸坂 潤 現代日本の思想対立 矢野正人 青空文庫(校正支援) 2011-12-16
戸坂 潤 現代唯物論講話 矢野正人 青空文庫(校正支援) 2012-05-24
戸坂 潤 思想としての文学 矢野正人 青空文庫(校正支援) 2012-10-02
戸坂 潤 文芸評論の方法について 矢野正人 青空文庫(校正支援) 2012-10-06
戸坂 潤 所謂批評の「科学性」についての考察 矢野正人 青空文庫(校正支援) 2012-10-10
戸坂 潤 認識論としての文芸学 矢野正人 青空文庫(校正支援) 2012-10-14
戸坂 潤 日本の民衆と「日本的なるもの 矢野正人 青空文庫(校正支援) 2012-10-18
宮本 百合子 日記 03 一九一六年(大正五年) 柴田卓治 青空文庫(校正支援) 2012-12-04
宮本 百合子 日記 04 一九一七年(大正六年) 柴田卓治 青空文庫(校正支援) 2013-03-16
宮本 百合子 日記 05 一九一九年(大正八年) 柴田卓治 青空文庫(校正支援) 2013-03-23
宮本 百合子 日記 06 一九二〇年(大正九年 柴田卓治 青空文庫(校正支援) 2013-10-02
宮本 百合子 日記 08 一九二二年(大正十一年) 柴田卓治 青空文庫(校正支援) 2013-10-10
宮本 百合子 日記 07 一九二一年(大正十年) 柴田卓治 青空文庫(校正支援) 2014-02-02
宮本 百合子 日記 10 一九二四年(大正十三年) 柴田卓治 青空文庫(校正支援) 2014-04-30
宮本 百合子 日記 11 一九二五年(大正十四年) 柴田卓治 青空文庫(校正支援) 2014-08-10
宮本 百合子 日記 12 一九二六年(大正十五年・昭和元年) 柴田卓治 青空文庫(校正支援) 2014-10-02
宮本 百合子 日記 13 一九二七年(昭和二年) 柴田卓治 青空文庫(校正支援) 2015-03-13

 へぇー。なるほどねぇ。。。たいした支援だね。

 ついでに2005年より前から放置されているランキングをみるとこうなる。

23 宮本 百合子
2 范 曄
2 笠置 一郎
2 石光 真清
2 石光 真人
1 押川 春浪
1 堺 利彦
1 ゴーゴリ ニコライ
1 平井 肇
1 井沢 衣水

 ほぅ。なるほど。つまり宮本百合子青空文庫のかなり早い段階で一気にテキスト化され残っていた最後の山ということか。校正支援が適用されたのはむしろ不人気だったからか。

 このように青空文庫を布教宣伝の道具に使えるなら、布教に熱心なキリスト教とかも置いてあるのかとおもったが聖書は校正待ち(点検前)で、テキストが奉納されたままらしい。あんな膨大なもの誰も校正したがらないだろう。親鸞日蓮で探してみたがなかったので日本の仏教は布教の活力を失っているようだ。やはりアクティブな活動家がいないと話は進まないということらしい。