Kazuhiro's BBS

http://green.ribbon.to/~ikazuhiro/にて提供しているソフトウェア及びパッチに関する質問、要望等あれば御記入下さい。

書き込み一覧

oald7-fpw 辞書タイトルの変更

By mutochan この投稿を引用

oald7-fpwのおかげで、OALD7の辞書を辞書ソフトで便利に使わせていただいております。
個人的に1点だけカスタマイズしたいところがありまして、辞書のタイトルが
現在、Cultural Guide、Wordfinderとなっているのを
OALD7CG、OALD7WFなどのように変更して使いたいと考えております。
そこでOALD7CG、OALD7WFディレクトリのcatalogs.txtのTitle欄を上記のように
書き換えてみたのですが、fpwmake packageを実行する際にエラーが出てしまいます。

Makefile:35: warning: overriding commands for target `catalogs.txt'
fpwutils.mk:433: warning: ignoring old commands for target `catalogs.txt'
rm -rf OALD_7
rm -f oald7-fpw-20071029.zip
/usr/bin/gnumake INSTALLDIR="." DIR="OALD_7" install
Makefile:35: warning: overriding commands for target `catalogs.txt'
fpwutils.mk:433: warning: ignoring old commands for target `catalogs.txt'
for subdir in OALD7 OALD7CG OALD7WF ; do \
/usr/bin/gnumake -C $subdir link ; \
done
gnumake[2]: Nothing to be done for `link'.
gnumake[2]: Nothing to be done for `link'.
gnumake[2]: Nothing to be done for `link'.
rm -f catalogs.txt
echo "[Catalog]" > catalogs.txt
echo "FileName = catalogs" >> catalogs.txt
echo "Type = EPWING1" >> catalogs.txt
/usr/local/libexec/freepwing/perl.sh -e 'printf "Books\t\t= %d\n", scalar(@ARGV)' OALD7 OALD7CG OALD7WF >> catalogs.txt
for subdir in OALD7 OALD7CG OALD7WF ; do \
echo "[Book]" >> catalogs.txt ; \
sed -n -e '/^Title[ ]*=/p' $subdir/catalogs.txt >> catalogs.txt ; \
sed -n -e '/^BookType[ ]*=/p' $subdir/catalogs.txt >> catalogs.txt ; \
sed -n -e '/^HanGaiji[ ]*=/p' $subdir/catalogs.txt >> catalogs.txt ; \
sed -n -e '/^ZenGaiji[ ]*=/p' $subdir/catalogs.txt >> catalogs.txt ; \
echo "Directory = \"$subdir\"" >> catalogs.txt ; \
done
rm -f catalogs
/usr/local/libexec/freepwing/catdump -u catalogs.txt catalogs
ERR: line 11: ??????????("?n?`?k?c?b?f")
ERR: line 16: ??????????("?n?`?k?c?v?e")
gnumake[1]: *** [catalogs] Error 1
gnumake: *** [package] Error 2

catalogs.txtのTitle欄を書き換えなければ、パッケージの生成はもちろんうまくいきます。
対処方法をご存じでしたらおしえていただけないでしょうか。よろしくお願いいたします。

No.51 2007/12/26 13:44:52

Re: oald7-fpw 辞書タイトルの変更

By kazuhiro URL このコメントを引用

編集したcatalogs.txtがEUC-JP以外の文字コードで保存されている
可能性が高いように思います。一度確認してみてください。
解決しない場合は、まずcatdumpのエラーメッセージの内容を
確認してください。
(標準エラー出力にEUC-JPで出力されています。)

No.52 2007/12/26 14:44:49

Re: oald7-fpw 辞書タイトルの変更

By mutochan このコメントを引用

さっそくのお返事感謝します。

> 編集したcatalogs.txtがEUC-JP以外の文字コードで保存されている
> 可能性が高いように思います。一度確認してみてください。

おっしゃるとおり、文字コードがShift JISになっていたようです。
EUC-JPで保存し直したら、うまく通りました。ありがとうございました。

No.53 2007/12/27 05:31:44

Re: oald7-fpw 辞書タイトルの変更

By kyo このコメントを引用

もっと簡単にタイトルを変える方法があります。
EBStudio で適当なファイルを変換します。そのときに辞書ファイル名をOALD7CGなどの好きなタイトルに設定して、できたEPWINGのファイルからcatalogファイルをとり、変更したいEPWINGの方に上書きすれば辞書のタイトルが変わります。

No.54 2007/12/30 13:56:20

英語版

By うぃき この投稿を引用

英語版wikipediaをepwingかするプログラムはありませんか? あったら便利だと思うんで。

No.42 2007/12/05 17:24:18

Re: 英語版

By kazuhiro URL このコメントを引用

容量の問題を除けばwikipedia-fpwで英語版のダンプデータを処理する事は
それほどは困難ではないように思います。
フランス語版で試みた方もいらっしゃるようですし、
私自身は英語版のWiktionaryを変換してみたことはあります。

No.43 2007/12/06 11:16:29

Re: 英語版

By a このコメントを引用

英語版のWiktionaryはどこからダウンロードできますか?

No.44 2007/12/06 15:53:55

Re: 英語版

By kazuhiro URL このコメントを引用

英語版のWiktionaryのダンプデータは
http://download.wikimedia.org/enwiktionary/
以下にあります。

No.45 2007/12/06 18:11:57

Re: 英語版

By a このコメントを引用

上手くいきました。ありがとうございます。

No.46 2007/12/07 06:26:10

Re: 英語版

By b このコメントを引用

変換成功したのは、enwiktionary-20071120-pages-articles.xml.bz2 でしょうか?

1週間ほど前から、英語wiki変換しようと四苦八苦・・
enwiki-20071018-pages-articles.xml.bz2 を落としたのですが、
3GBもあって解凍したら13GBになりました(涙)

No.47 2007/12/10 01:32:31

Re: 英語版

By kazuhiro URL このコメントを引用

変換した方は多分見ていないと思いますので一応補足しておきます。
変換したファイルはおそらく enwiktionary-20071120-pages-articles.xml.bz2
であろうと思います。
それから、英語版Wikipediaはそのままではまず変換できません。
http://www3.rocketbbs.com/602/bbs.cgi?id=kzhr&mode=pickup&no=4
を参照してください。

No.48 2007/12/11 21:46:29

Re: 英語版

By a このコメントを引用

僕が変換できたのは英語版wikitianaryのほうで英語版wikipedia ではありません。

No.49 2007/12/12 15:48:34

Re: 英語版

By b このコメントを引用

お返事ありがとうございます
なるほど、2Gの壁ですか それはいたし方ないですね

分割すると相互参照が効かないのも痛いですね
うーん、難しい問題ですね
コンピュータ系用語のエントリー、しかもオープン
ソース系がたんまり書かれているので、その部分だけ
でも抜き出したいですね

ちょっと悩んでみます・・

No.50 2007/12/12 23:03:22

Wikipediaの数式について

By Jun この投稿を引用

最近wikipedia-fpwを知りまして、とても便利に使わせていただいております。本当にありがとうございます。
一つお伺いしたいのですが、数式のオミットは仕様とのことですが、これはFreePWINGの機能上の制限などによるものでしょうか?

No.40 2007/12/05 03:16:46

Re: Wikipediaの数式について

By kazuhiro URL このコメントを引用

文字情報のまま収録できるのは、ウィキペディアのサイトでも
文字のまま表示されるような上付き・下付き文字程度までです。
ウィキペディアのサイトで画像として表示されるような複雑な数式は、
FreePWINGでも画像にする必要があります。

wikipedia-fpwでは上付き・下付き文字にも対応していませんが、これは、
私が常用しているビューアが対応していないのでやる気がないのが
一番大きな理由です。
また、数式から画像を自動的に生成して取り込むような事は頑張れば
できるかもしれませんが、私にとっては需要が低いので
私がするつもりはありません。

No.41 2007/12/05 11:22:19

WIKI1121

By ATX この投稿を引用

最新版の日本語Wikipediaのダンプデータである
jawiki-20071121-pages-articles.xml.bz2をcygwinでEPWINGに変換すると、
Tagのリンクエラーで失敗します。
相互参照をOFFにすれば変換に成功します。
なんとか改善できないでしょうか?

No.32 2007/11/28 20:57:10

Re: WIKI1121

By kazuhiro URL このコメントを引用

どの項目で止まりますか?

No.33 2007/11/28 22:20:19

Re: WIKI1121

By ATX このコメントを引用

再度Cygwinをインストールして行ったところ、
Entry82829でPerlが落ちました。Cygwin+TeraTermPro+Windows Vistaで行いました。
開始から1時間半、@Core2Duo T7200です。
今回のダンプデータは2.567GBほどありますが、これが原因なのですか?
EPWINGは2GBを超えるとき分割する必要があると聞いたことがあるような…
Tagのリンクエラーは他の人でもおこったようで、
以下引用↓
■ jawiki-20071121-pages-articles.xml.bz2 with cygwin のビルドメモ

cygwin は、parl や GNU make系の開発環境を整備する事

freepwing-1.4.4.tar.gz + freepwing-1.4.4+20070216.patch.gz
(GNU patch は ttp://www.vector.co.jp/soft/win95/prog/se015025.html 流用)

まず、相互参照modeでリンク
(wikipedia-fpw.conf) で'enable_reference' => 1,
タグのリンクエラー発生 ( ̄□ ̄;)!!  
/usr/local/libexec/freepwing の if (!$link->close()) を
die ではなく print に変更 ( ̄へ  ̄ 凸      
ビルドは成功するも、DDwin で読めず(ノД`)・゜・    

悔しくも相互参照を 'enable_reference' => 0, にする・・
$fpwmake clean
$fpwmake
$fpwmake package ビルド成功 DDwin で動作確認( ̄ ̄ー ̄ ̄)

DicCompressorJで 1 で圧縮
iDic-2007-10-24.zip で検索確認 (o^-')b 

だそうです。

No.34 2007/11/29 18:48:52

Re: WIKI1121

By kazuhiro URL このコメントを引用

容量制限は変換後のデータサイズに依存します。
ダンプデータのサイズは直接には無関係です。

当該項目を確認しましたが、cygwinのperlで落ちる
「別名を持つリンクの閉じ括弧がない」パターンが含まれていました。

別件で変更中の為、すぐに更新版のリリースというわけにはいきませんので
とりあえず当該箇所では落ちないことを確認したものを

http://green.ribbon.to/~ikazuhiro/dic/files/tmp/fpwwikipedia

に置いておきますので差し替えてみてください。

No.35 2007/11/30 10:30:02

Re: WIKI1121

By ATX このコメントを引用

素早い対応ありがとうございます。早速変換を実行してみました。
すると Entry: 276150; でPerlが落ちました。
Wikiは42万件ほどあるので、また見つかりそうですね。
今後も期待しています。開発をがんばってください。
追記ですが、Fedoraでは成功している人がいるようです。

No.36 2007/11/30 20:19:45

Re: WIKI1121

By kazuhiro URL このコメントを引用

何度もすみませんが、先程のファイルに加えて

http://green.ribbon.to/~ikazuhiro/dic/files/tmp/wikipedia-fpw.conf

こちらのファイルも差し替えてみてください。
手元のcygwinな環境ではfpwwikipediaが正常に終了するところまで
確認したので今度こそ大丈夫だと思います。

ちなみに、11月21日のダンプデータでは書籍に収録される項目数は
約69万になっています。

No.37 2007/12/01 07:00:14

Re: WIKI1121

By ATX このコメントを引用

本当に素早い対応ありがとうございます。
今回はきちんと変換できました。3時間10分+パッケージ時間 ほどかかりました。
EBWin,iPod touch(iDic)にてEBShrink L1圧縮のファイルを動作確認できました。
最新版のポケットに入るWikipediaが手に入って嬉しいです。
それにしても、いつの間にか69万に増えていたなんて、驚きですね。
今回はお世話になりました。また何かあったら宜しくお願いします。

No.38 2007/12/01 22:15:18

Re: WIKI1121

By kazuhiro URL このコメントを引用

すみません、数えるところを間違えました。
contentの数は約44万です。69万はリダイレクトも含めてでした。

それから、先程の差し替え用のファイルを使用した20071202版を公開しました。
書籍を新たに作りなおす必要はないと思います。
ご報告ありがとうございました。

No.39 2007/12/02 11:16:50

LDOCE4v2

By mutochan この投稿を引用

はじめまして。
OALD7を変換するツールを出されていたことを初めて知りました。
IDM形式を変換できるものは初めてなのではないでしょうか。
私は知識がないのでまだ何もできないのですが
LDOCE4v2 (LONGMAN Dictionary of Contemporary English UPDATED EDITION)
をEPWINGで使えるようになれば、とてもすばらしいことだと思います。
機会がありましたら、ご検討いただけたら幸いです。

No.29 2007/11/25 11:10:08

Re: LDOCE4v2

By kazuhiro URL このコメントを引用

LDOCE4v2を含め、他のいわゆるidm形式の辞書を購入する予定はありません。
従って、私自身がLDOCE4v2等の変換ツールを公開する可能性は極めて低いと思います。

http://ikazuhiro.s206.xrea.com/article.php/oald7_compress

に、OALD7で使用されている圧縮形式のついてのメモがありますので興味がおありでしたらご参照ください。
ただし、LDOCE4v2とどの程度共通しているかは不明です。

http://space.geocities.jp/pss2007x/

の様なツールもあるのでまるっきり違うということは無いと思いますが。

No.30 2007/11/26 10:30:49

Re: LDOCE4v2

By mutochan このコメントを引用

お返事ありがとうございます。
知識はまったくのゼロですが、少しずつでも勉強してみますね。

No.31 2007/11/27 19:12:47

フランス語版 Wikipedia

By matsugorou この投稿を引用

さっそくのご返答、ありがとうございます。

1.辞書タイトルはご指摘の方法で解決しました。

2.フランス語特殊文字が日本語の文字コード (JIS X 0208)で?に文字化けしてしまう課題。
   ご指摘の『tablesファイルのutf2euc_tableを編集して文字を追加すれば、』はまだ文字化けの???のままです。
   
   %utf2euc_table =
(
# (FULLWIDTH TILDE, U+FF5E) -> (WAVE DASH, U+301C)
"\xEF\xBD\x9E" => "\xE3\x80\x9C",
# (FULLWIDTH HYPHEN-MINUS, U+FF0D) -> (MINUS SIGN, U+2212)
"\xEF\xBC\x8D" => "\xE2\x88\x92",
'aacute' => 'a'',
'Aacute' => 'A'',
'eacute' => 'e'',
'Eacute' => 'E'',
'iacute' => 'i'',
'Iacute' => 'I'',
'oacute' => 'o'',
'Oacute' => 'O'',
'uacute' => 'u'',
中略
'Uuml' => 'U"',
'yuml' => 'y"',
'Yuml' => 'Y"',
'aelig' => 'ae',
'AElig' => 'AE',
'oelig' => 'oe',
'OElig' => 'oe',

"\xc2\xb2" => '^2',
);

$utf2euc_regexp = '(';
foreach $_ (keys(%utf2euc_table)) {
$utf2euc_regexp .= "$_|";
}
$utf2euc_regexp =~ s/\|$/\)/;

  以上のように書き加えて編集し、上書き保存したうえでWiki-fpw を1000件で2回、実験したところ。
DDwinでみると、以前とおなじように文字化けで???になります。


  外字を使うことで解決するようにおもわれるのですが。

  『FreePWINGのドキュメント』で説明されている、外字の生成、本文への外字の書き込み方法をhishida氏の配布されたLatin1(フランス語特殊文字あり)入りのGaijiMap.xmlとGaiji.xmlに応用するしかたが解りません。
  
もう少しで、、、完全なのですが、知識不足です。

  それでも、ザウルスで伏字つきでもWikipediaが読めることはすばらしいです。感謝しています。

  それと今回はkazuhiroさんにお教えいただいて、Linux,Perleは自分にはまったく関係のないものだったのが、暗号をといていくような楽しみを少し味わうことができました。

  Linuxの入門書をよんでいます。

ありがとうございました。

No.27 2007/11/12 02:37:05

Re: フランス語版 Wikipedia

By kazuhiro URL このコメントを引用

utf2euc_tableは、例えば
'æ' => 'ae',
の様に、ハッシュテーブルの要素は変換元の文字そのものを記述します。

また、Perlの一般的な事項ですが、アポストロフィ(')で囲まれた
文字列リテラル内でアポストロフィを使用する場合はエスケープしてください。
'á' => 'a\'',

No.28 2007/11/12 10:20:57

フランス語版 Wikipedia

By matsugorou この投稿を引用

Bonjour.

教えていただいたように、分冊にすることによって仏語版WikipediaのEPWING化変換になんとか成功しました。

ありがとうございます。
 
1.なんどやっても止まってしまう、Entry49729 Modèleはskip-headings に '^[Entry49729 Modele]', と書き込むことで通り抜けました。
   workarounds で対処すべきことなのでしょうか?

 2.フランス語特殊文字が日本語の文字コード (JIS X 0208)で?に文字化けしてしまう課題。
   ご指摘の『tablesファイルのutf2euc_tableを編集して文字を追加すれば、』で今日から解決策を探したいと思います。
   BSTudio のBSTudioのGaiji.Map.xmlおよびGaiji.xmlでは「Latin1」がすでに設定してあるとのことを知りました。どういうふうに具体的にいかせるかはまだまったくわからないのですが。研究したいと思います。

3.辞書タイトル、日本語版ウィキィペディアという記述は、EPWing変換後のファイル名をかえても残るのですが、変更可能でしょうか?

 ザウルスに変換した日本語版とフランス語版のWikipediaをいれて毎日使っています。
 ありがとうございました。

No.25 2007/11/10 18:45:07

Re: フランス語版 Wikipedia

By kazuhiro URL このコメントを引用

> 1.なんどやっても止まってしまう、Entry49729 Modèleはskip-headings に
> '^[Entry49729 Modele]', と書き込むことで通り抜けました。
>    workarounds で対処すべきことなのでしょうか?

具体的に何が原因で止まっているのか分からないのでなんとも言えません。
特定の項目だけスキップしたい場合は
'^Modèle$',
等のようにskip_headingsに追加してください。

> 3.辞書タイトル、日本語版ウィキィペディアという記述は、EPWing変換後のファイル名を
> かえても残るのですが、変更可能でしょうか?

catalogs.txtを編集してください。

No.26 2007/11/11 17:38:33

以下のフォームに記事No.と投稿時のパスワードを入力すれば、 投稿後に記事の編集や削除が行えます。

70/200件 [ ページ : << 1 2 3 4 5 6 7 8 9 10 >> ]

- HOME - お知らせ(3/8) - 記事検索 - 携帯用URL - フィード - ヘルプ - 環境設定 -

Rocket Board Type-X (Free) Rocket BBS