2008/7/4 金曜日

mb_encode_mimeheaderの検証

Filed under: 文字コード, メール — ne-zu @ 23:26:04 このエントリをはてなブックマークに追加

mb_encode_mimeheaderの都市伝説を検証する - CPA-LABテクニカル
mb_encode_mimeheaderを詳しく検証し、正しいバッドノウハウ(^_^;) を解明されています。
素晴らしくわかりやすい記事ですね。参考になります!

2008/6/10 火曜日

文字コード変換(EUC-JP→UTF-8)にはまる

Filed under: 文字コード — ne-zu @ 23:17:04 このエントリをはてなブックマークに追加

WEBプログラミング NOW!: PHPで、いわゆる機種依存文字の文字コード変換(EUC-JP→UTF-8)にはまる

UTF-8 -> CP51932 を SJIS-win 経由で変換する場合は、SJIS-win に変換した後、IBM拡張文字をNEC選定IBM拡張文字に置換してから EUC-JP に変換する必要があると思われますのでご注意ください。

なるほど。できるのかな。要チェック。

2008/6/7 土曜日

フォーム送信で文字化けの罠

Filed under: 文字コード — ne-zu @ 23:09:57 このエントリをはてなブックマークに追加

フォーム送信で文字化けの罠 - ホームページ制作日誌

「encoding_translation」をOffにできるのなら間違いなく思ったとおりのデータを受け取る事ができるが、そうでない場合、送信データを自動変換されてしまうので注意が必要。

基本的には、内部エンコードに変換される事となるが、ここに罠が潜む。

「mb_internal_encoding」を利用して、内部エンコードを変換した場合、「encoding_translation」は、その文字コードには変換しない。php.iniで設定されている内部エンコードに変更する。おいおい。。

これは引っかかりそうな罠ですね。。気をつけます!

2008/6/5 木曜日

日本語文字列の「バイト数」取得

Filed under: 文字コード, 基本 — ne-zu @ 23:05:50 このエントリをはてなブックマークに追加

日本語文字列のバイト数取得にstrlenだけではダメな理由-PHP - CPA-LABテクニカル
日本語文字列のバイト数取得する方法が、strlenだけではダメなんだよ、という記事です。
参考になります。

2008/2/20 水曜日

「ああああああああああああ」という文字列をstrlenで取得すると 24と出てほしいのに、36と表示されてしまいます。 なぜでしょうか??

Filed under: 文字コード, 基本 — ne-zu @ 23:28:04 このエントリをはてなブックマークに追加

PHPで質問です。 「ああああああああああああ」という文字列をstrlenで取得すると 24と出てほしいのに、36と表示されてしまいます。 なぜでしょうか?? ※なぜか、mb_strl.. - 人力検索はてな

文字コードが UTF-8 だからじゃないでしょうか。

ということで、UTF-8は3byteの文字もあります。

2007/11/2 金曜日

UTF-8からShift_JISやEUC-JPへ変換できない依存文字をどうにかする。

Filed under: 文字コード — ne-zu @ 2:38:03 このエントリをはてなブックマークに追加

㈱とかⅡ(←ローマ数字)とかの特殊な記号はUTF8からShift_JISやEUC-JPに直接変換できません。メールで送る場合、特に携帯が絡んでくると、Shift_JISやEUC-JPにどうしても変換したい場合がありますので、何とか上手く記号を橋渡し出来ないかと色々調べてみましたが、出来ないようです。
というわけで別のアプローチとして、特殊記号を普通の文字に『ひらいて』から変換しようというスクリプトたちがこちらです。

私は三番目の機種依存文字の変換を使用させていただいてます。

Powered by PHP-SeeD and WordPress ME