2003/04/11(金) [n年前の日記]
#1 [prog] 漢字コード
日記の過去ログをhnfに変換するPerlスクリプトを記述中。タイトルをつけていなかった頃の過去ログなので、本文の最初のあたりをsubstrで一部切り出して仮タイトルにしようとしたが問題発生。漢字1文字が2byteで扱われる為、1byteだけ切り出してしまい文字化けする箇所が多々見受けられる。
◎ UTF8 :
UTF-8で処理すれば漢字1文字も正しく1文字として処理できるとの話なのだが、jcode.pmを利用して、sjis→utf8→substrで切り出し→eucにしてみても結果は同じ。うーん。現在使ってるActivePerlは5.6.1。
_ここ
を見る限り、5.6.1と5.8.0ではUnicode関係の処理が大きく異なっているらしい。もしかするとそれも関係しているだろうか。
◎ jfold :
結局、jcode.pmのjfoldを利用してsubstrの代わりにした。UTF8は使わずEUCのみで処理。
[ ツッコむ ]
#2 [xyzzy] hnf-modeのキーワードファイル
xyzzyの色付けキーワードファイルで、大文字・小文字・文字列位置は指定できないのだろうか。本文中にcatとか入るとそこも色が変わってしまう。/^CAT/ だけに反応して欲しいのだけど。
◎ 正規表現キーワード :
を使ったらある程度上手くいった。こうなると、キーワードファイルによる色付けはhnfフォーマット的に無理があるので該当部分をhnf-modeから削除。
◎ 色彩センス :
色付けが出来たのはいいが目がチカチカする。keyword指定のみでは無理がある。#ccffaaといった細かい色指定ができると嬉しいのだけど。いや、それではユーザが自由に色を変更できなくなりそうだし、やはり現在のように番号を与えて指定するほうがいいのかもしれない。
[ ツッコむ ]
#3 [prog][pc] Windows用のcat
はどこにあるのだろう。Cygwinを使えばいいのだろうけど、ウチの環境ではしばらく動作させてるうちにWindowsの挙動がおかしくなってキー入力すらできなくなるのであまり使いたくなかったり。
◎ UNIX like tools :
というのがVectorにあった。Vectorで公開されているのは uxtl412c だが他を探したら uxtl412f というのもあった。違いはなんだろう。ひとまず後者をDLしてcat.exeを使わせてもらった。
◎ ついうっかりして :
cat *.hnf > temp.hnf としたら「共有違反」云々のエラーが出てしまっておかしいなと思ったが考えてみれば当たり前。
[ ツッコむ ]
以上、1 日分です。