mieki256's diary



2003/04/11(金) [n年前の日記]

#1 [prog] 漢字コード

日記の過去ログをhnfに変換するPerlスクリプトを記述中。タイトルをつけていなかった頃の過去ログなので、本文の最初のあたりをsubstrで一部切り出して仮タイトルにしようとしたが問題発生。漢字1文字が2byteで扱われる為、1byteだけ切り出してしまい文字化けする箇所が多々見受けられる。

UTF8 :

UTF-8で処理すれば漢字1文字も正しく1文字として処理できるとの話なのだが、jcode.pmを利用して、sjis→utf8→substrで切り出し→eucにしてみても結果は同じ。うーん。現在使ってるActivePerlは5.6.1。 _ここ を見る限り、5.6.1と5.8.0ではUnicode関係の処理が大きく異なっているらしい。もしかするとそれも関係しているだろうか。

jfold :

結局、jcode.pmのjfoldを利用してsubstrの代わりにした。UTF8は使わずEUCのみで処理。

以上です。

過去ログ表示

Prev - 2003/04 - Next
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30

カテゴリで表示

検索機能は Namazu for hns で提供されています。(詳細指定/ヘルプ


注意: 現在使用の日記自動生成システムは Version 2.19.6 です。
公開されている日記自動生成システムは Version 2.19.5 です。

Powered by hns-2.19.6, HyperNikkiSystem Project