Blog Hacksを購入以来、ちょこちょこ実験をしているが、LWPを使って戻ってきたデータの日本語処理にちょー困ってた。大量のページに対し、同じ処理を実行する場合、個々のページのエンコーディングをいちいちチェックする必要があるから。日本語処理関係は、ウェブを見てもそれほど豊富とは言えないし、さてさて本屋をさまようことに。。。
なーんと、答えは近くにありました!その名も、Spidering Hacks!!あのー、Safariじゃ英語版しか見れなくて、まさかこんなところに答えがあるとは。。。
しっかし、この本凄い。村上さんと言う方は、アーロンヒレガスのCocoaプログラミング本でも、楽しく&うまく訳すなーと思っていたけど、それだけじゃなくって、おもいっきりハッカー!!楽しみながら翻訳されてる感じが伝わってくる。Unicodeに対応したPerl 5.8での日本語処理のまとまった説明だけでも、この本は価値があるでしょー。すごい、この本!!!
Perlって翻訳者にも恵まれてる。これって、日本でPerlが強い理由のひとつだと思う。香港や中国ではPerlってほとんど誰も使ってない。メール送信なんかで導入されてたりするけど、ほとんど対応できる人がいなくって、まさにPerl Cookbookを見ながらの格闘。さっぱり理解しちゃいない。これってありがちな光景?
余談ですが、オライリーのServlet本を翻訳している、中田さんも好きです!うまい!