メモ@inudaisho

君見ずや出版 / 興味次第の調べ物置き場

stardictの辞書のつくりかた

付属文書のまとめ

1.辞書ファイルの構成

xxx.ifo //情報ファイル
xxx.idx or xxx.idx.gz (gzip -9 圧縮するとクエリがはやくなるとか) //単語ファイル
xxx.dict ot xxx.dict.dz (付属のdictzip で圧縮/gunzipで解凍できる) //定義ファイル
xxxは統一すること。
以上が基本の三ファイル
3.0.0以上はxxx.synでシノニムとか定義できるらしい。

2 .ifo 情報ファイルのなかみ

StarDict's dict ifo file //第一行はこれ
version=2.4.2 //必須 ここの値は3.0.0か2.4.2のどっちか固定
bookname=xxx //必須 
wordcount= //必須 .idx単語ファイルの単語数
synwordcount= //xxx.synがあるとき必須
idxfilesize= //必須 .idxのサイズ .idx.gzのときでも.idxのサイズを記入 (ls -l xxx.idx)
idxoffsetbits= //3.0.0で新規 64か32
author=
email=
website=
description= //説明。ここに記述するとき、<br>で改行できる
sometypesequence= //超重要。定義の形式を英文字で指定(m:UTF-8テキスト/h:html/x:xdxf辞書形式/w:wikipedia/W:音声つき/P:画像つきなど 詳細は付属文書をよめ)
dicttype=  //wordnetプラグインでつかう。いらん。

3 辞書のつくりかた

xxx.tab

語1タブ文字(\t)定義1(\をいれたいときは\\)改行(\n)
語2タブ文字(\t)定義2(\をいれたいときは\\)改行(\n)

仕様では定義のなかの複数の改行は許容されているようだが、実装では改行されるとそこでデータが終りとみなされ、表示されない。(追記: \\nでいいらしいよ)
改行をbrですましてファイル形式をhtmlにしとくと見やすい。
tabfile dict.tab で、基本の辞書ファイル三つが生成される。
その後適宜、ifoファイルを編集。完成。

(tabfile は、ubuntu なら /usr/lib/stardict-tools/にある)

babylon形式もつかえる。

apple|apples
りんご たべたらうまい

2dimensional|2dimensionale|2dimensionaler|2dimensionalem
二次元<br>「三次元よりも二次元」

これを付属のbabylonでコンパイルする。