April 8, 2006 [ Web ]
手始めに郵政省からダウンロードした郵便番藹??-菴?所データをMySQLデータベースへ藹??り込む必要があった。しかしその際に特藹??の文字が化けてしまって臀??手縺?いかない。"十"という文字は確実に化けしまうのだ。ソース縺?CSV縺?SJISに設定されており、データベースもSJISに設定されていて臀??見問題が無いように鐔??える。
い縺?つか下のような方觸??も試してみたが同じく上手縺?いかない。
- ソー繧?CSVをEUCに臀??存し直しアップロード時縺?SJISへ藹??觸??する
- ソー繧?CSVをUTF8に臀??存し直してアップロード時縺?SJISへ藹??觸??する
よ縺?よく調べると、これはさ縺?らインターネットのサーバで、phpMyAdminを通し縺?LOAD DATA LOCALコマンドを使繧?ないといけないから発生する問題と分かった。おそら縺?直でコマンドを打てる環藹??であれば問題がないと思繧?れる。
以前からよ縺?あるSJIS-EUCなどのサーバサイドプログラムでの文字コードの藹??り扱いの問題だ。特藹??の文字にメタ文字(特觸??文字)の「\」を表す'5c'が2バイト目に含まれている事が藹??因で、「\」はエスケープ記号と解釈され抜けてしまう。その「\」を補うため「\」を文字化けする以臀??の文字の末尾に臀??け足すことで修正する。十、表、ソ、申、貼、能、暴、予、圭、噂、曾な縺?40種ほどある。
縺?繧?し縺?は、
http://www.psl.ne.jp/perl/pdojo00c.html http://www.kent-web.com/pubc/jcode/
このエスケープ記号のつけたCSVをダウンロードできるようにした。
郵便番藹??-菴?所全国デー繧?(2006.4.1分)
郵便データベースで文字化けに困ったときに藹??考になれば。
=================
さ縺?らメールボックスの容驥?メンテ
不譏?なメールが溜まるがどうメンテするか?藹??信できな縺?なるの縺?
1)ウェブメールで選択し削除する 50通ずつ縺?らいしか削除できない
2)FTPでメールディレクトリ内のファイルを削除する(事前バックアップしてもいい)
/home/your_dir/MailBoox/postmaster/maildir/cur
/home/your_dir/MailBoox/postmaster/maildir/.span/cur
cur2に藹??名し、curディレクトリを切り直してもいい
大驥?にメールがある縺?FTPではタイムアウトして無理
3)コンソールでメールボックスを削除してから同名で臀??成しなおす
postmasterは削除できない
4)postmaster等の大驥?メールフォルダ縺?curを変名しcurを作成しなおす
変名したcur2がFTPではタイムアウトして削除できない場合、
さ縺?らの蝠?い合繧?せフォームにてディレクトリの削除臀??頼をする
Posted by funa : 05:39 AM