By YKM この投稿を引用
はじめまして。現在、英語版WikipediaのEPWING化を試みています。2Gの壁があるので、2つに分けて(分冊)して辞書を作成しようとしています。「fpwmake catalogs」あるいは、「fpwmake package」を実行する前に、catalogs.txtをどのように記述すればよいのかが、今ひとつわかりません。お手数ですが、ご教授願います。現在、以下のような書き方を考えております。■ 1冊目作成時のcatalogs.txt[Catalog]FileName = catalogs1Type = EPWING1Books = 1[Book]Title = "Wikipedia_A-M"BookType = 5001Directory = "WIKIP_EN1"■ 2冊目作成時のcatalogs.txt[Catalog]FileName = catalogs2Type = EPWING1Books = 1[Book]Title = "Wikipedia_N-Z"BookType = 5001Directory = "WIKIP_EN2"
No.102 2008/10/24 13:49:25
By kazuhiro このコメントを引用
どのようにして分冊を作成しようとしているのかが分からないので、wikipedia-fpwのソースを展開後、分冊ごとに設定を書換えてfpwmake packageでパッケージを作成し、そのパッケージを任意のディレクトリに展開して使用すると仮定します。catalogs.txtで変更すべき部分はTitle = "ウィキペディア日本語版"Directory = "WIKIP"の2行です。Directory名は分冊毎に異なる名前で、8文字以内にしてください。Titleの部分は全角文字で記述してください。続いてMakefileのDIR = WIKIPの部分をcatalogs.txtのDirectory名に合わせてください。それから、MakefileのPACKAGE = wikipedia-fpw-20080616の部分でパッケージ名が決まるので、分冊毎に重ならない名前に変更してください。ただし、私自身は分冊の作成をしたことがないので、以上の内容でうまくいくかどうかは不明です。書式等の詳細はFreePWINGのドキュメントを参照してください。また、ブログの方に書きましたが、単一ファイルとして作成した場合でhonmonファイルのサイズが15GB弱だったので分冊の数は2では足りないと思います。
No.103 2008/10/25 09:08:57
By YKM このコメントを引用
kazuhiro 様、たいへん役に立ちました。ありがとうございました。> どのようにして分冊を作成しようとしているのかが分からないので、以前このBBSで議論されていた方法で行いました。つまり、wikipedia-fpw.conf の skip_headings の正規表現の箇所を変更しました。 > ただし、私自身は分冊の作成をしたことがないので、> 以上の内容でうまくいくかどうかは不明です。> 書式等の詳細はFreePWINGのドキュメントを参照してください。了解いたしました。うまくいきましたら、ご報告いたします。> また、ブログの方に書きましたが、単一ファイルとして作成した場合で> honmonファイルのサイズが15GB弱だったので> 分冊の数は2では足りないと思います。ご指摘の通りでした。タイトルの1文字目が「a-mA-M」とそれ以外とで2分冊を考えていましたが、「a-mA-M」の部分だけで約9GBありました。もっと分冊数を大きくします。
No.104 2008/10/27 10:08:15