[ 掲示板に戻る ]

記事No.102に関するスレッドです

分冊時のcatalogs.txtの書き方について

By YKM この投稿を引用

はじめまして。
現在、英語版WikipediaのEPWING化を試みています。
2Gの壁があるので、2つに分けて(分冊)して辞書を作成しようとしています。
「fpwmake catalogs」あるいは、「fpwmake package」を実行する前に、catalogs.txtをどのように記述すればよいのかが、今ひとつわかりません。
お手数ですが、ご教授願います。

現在、以下のような書き方を考えております。

■ 1冊目作成時のcatalogs.txt
[Catalog]
FileName = catalogs1
Type = EPWING1
Books = 1

[Book]
Title = "Wikipedia_A-M"
BookType = 5001
Directory = "WIKIP_EN1"


■ 2冊目作成時のcatalogs.txt
[Catalog]
FileName = catalogs2
Type = EPWING1
Books = 1

[Book]
Title = "Wikipedia_N-Z"
BookType = 5001
Directory = "WIKIP_EN2"

No.102 2008/10/24 13:49:25

Re: 分冊時のcatalogs.txtの書き方について

By kazuhiro URL このコメントを引用

どのようにして分冊を作成しようとしているのかが分からないので、
wikipedia-fpwのソースを展開後、分冊ごとに設定を書換えて
fpwmake package
でパッケージを作成し、
そのパッケージを任意のディレクトリに展開して使用すると仮定します。

catalogs.txtで変更すべき部分は
Title = "ウィキペディア日本語版"
Directory = "WIKIP"
の2行です。
Directory名は分冊毎に異なる名前で、8文字以内にしてください。
Titleの部分は全角文字で記述してください。

続いてMakefileの
DIR = WIKIP
の部分をcatalogs.txtのDirectory名に合わせてください。
それから、Makefileの
PACKAGE = wikipedia-fpw-20080616
の部分でパッケージ名が決まるので、分冊毎に重ならない名前に
変更してください。

ただし、私自身は分冊の作成をしたことがないので、
以上の内容でうまくいくかどうかは不明です。
書式等の詳細はFreePWINGのドキュメントを参照してください。

また、ブログの方に書きましたが、単一ファイルとして作成した場合で
honmonファイルのサイズが15GB弱だったので
分冊の数は2では足りないと思います。

No.103 2008/10/25 09:08:57

Re: 分冊時のcatalogs.txtの書き方について

By YKM このコメントを引用

kazuhiro 様、
たいへん役に立ちました。ありがとうございました。

> どのようにして分冊を作成しようとしているのかが分からないので、

以前このBBSで議論されていた方法で行いました。
つまり、wikipedia-fpw.conf の skip_headings の正規表現の箇所を変更しました。

> ただし、私自身は分冊の作成をしたことがないので、
> 以上の内容でうまくいくかどうかは不明です。
> 書式等の詳細はFreePWINGのドキュメントを参照してください。

了解いたしました。
うまくいきましたら、ご報告いたします。

> また、ブログの方に書きましたが、単一ファイルとして作成した場合で
> honmonファイルのサイズが15GB弱だったので
> 分冊の数は2では足りないと思います。

ご指摘の通りでした。
タイトルの1文字目が「a-mA-M」とそれ以外とで2分冊を考えていましたが、「a-mA-M」の部分だけで約9GBありました。もっと分冊数を大きくします。

No.104 2008/10/27 10:08:15


- HOME - お知らせ(3/8) - 記事検索 - 携帯用URL - フィード - ヘルプ - メール - 環境設定 -

Rocket Board Type-X (Free) Rocket BBS