現在、wordpress(2.5.1)をEUC-JPで使っており、UTF-8に移行しようと考えております。
本当ですか?? 現在 WordPress 日本語化チームが配布している WordPress バージョンはすべて UTF-8 用しかなく、EUC-JP 用なんて存在しません。バージョン 2.5.1 も UTF-8 専用です。WordPress Japan が配布していたものでは、EUC-JP が使えるバージョンは、WordPress ME 2.1.3 が最後です。まず、WordPress のバージョンをよく確かめてみてください。
ひょっとすると、どこかで配布しているカスタム版なら、WordPress 2.5.1 の EUC-JP 版があるかもしれませんが、それはかなり怪しいニセモノでしょう 😉 もし、本当に「2.5.1 の EUC-JP 版」があるなら、入手先を教えてください。
・サクラエディタ
・秀丸
・TeraPad
この中では、EUC-JP → UTF-8 の変換に使えそうなのは「秀丸」ぐらいしかありません。また、波ダッシュ「〜」を使っていたなら、おそらく U+301C の波ダッシュ「〜」に変換されますが、それは Winsows でよく使われる全角チルダ「~」とは別物になります。検索等で不具合が出るかもしれませんが、それは「そういうもの」と思ってあきらめてください。
ただEUCがきちんとエクスポートされないのか、エクスポートしたXMLファイルを以下のエディタで開いても、本文、及び、作者名が、文字化けしてしまいます。
どういうタイプの文字化けかが分からないので何とも言えませんが、MySQL 4.1 以降で必要な SET NAMES ujis を発行しない状態での DB アクセスと、した状態での DB アクセスにおける文字化けの可能性があります。ますます WordPress のバージョン確認が必要ですね。
ついでに、MySQL と PHP のバージョンも確認してください。
lilyfan様
さっそくの返信ありがとうございます。感謝です。
1. 実は、WordPress ME 2.1.3(EUC-JP)を使っていたのですが、これに上書き>upgrade.phpして、WordPress 2.5.1にしました。2.5.1で設定をUTF-8にしたら管理画面及びブログそのものが文字化けしたので、EUC-JPに戻すと、管理画面が英語表記ながらも使えていたので、そのまま使い続けてしまいました。
2. 文字化けの中身はこんな具合です。(categoryの例になります。)
<![CDATA[・捉袖坦]]>
<![CDATA[・造・測・・]]>
3. バージョンは以下の通りです。
MySQL Version
5.0.45
PHP Version
4.4.7
1. 実は、WordPress ME 2.1.3(EUC-JP)を使っていたのですが、これに上書きupgrade.phpして、WordPress 2.5.1にしました。2.5.1で設定をUTF-8にしたら管理画面及びブログそのものが文字化けしたので、EUC-JPに戻すと、管理画面が英語表記ながらも使えていたので、そのまま使い続けてしまいました。
ありゃりゃ。それはかなり大胆なアップグレード方法ですね。それだとたぶん正常に動いていないと思います (一見うまく動いているように見えても、どこか不具合がある)。本当はデータベースの文字コード変更が必要なのですが、それをやってないわけで、それは文字化けして当然です。
WordPress Japan が公開していた EUC-JP → UTF-8 の文字コード変更手順書を ME 2.0.x 引き継ぎプロジェクトに移設する予定ですが、手順を見直していまして、まだ準備できていません。適当に検索すると、有志の方が (違う方法の) 手順書を公開していますので、それを試してみてもいいかもしれません。
基本的には、phpMyAdmin で開いてみて、「UTF-8 に変更してエクスポート」してから、文字コードを utf8_generic_ci に変更したテーブルにインポートします。ただし、MySQL 5.0 で、かつ、ME 2.1.3 だとすると、wp-db.php で SET NAMES ujis してない可能性があり、その場合は phpMyAdmin で開くと文字化けした状態になってしまいます。wp-db.php を改造して SET NAMES ujis を入れていれば、phpMyAdmin でのエクスポートは問題なく可能です。
そうでない場合は、wp-db-backup を使ってエクスポートする手があります。この場合は EUC-JP になっているので、テキストエディターで UTF-8 に変えてみてください。
あ、EUC-JP から UTF-8 であれば、サクラエディタやTeraPad でも大丈夫かもしれません。丸数字や (株) などの「機種依存文字」を使っていなければ正しく変換できると思います。