mieki256's diary



2006/06/02(金) [n年前の日記]

#5 [prog] _Q. マッチングに「ー」を使うと以下のようなエラーが出る.間違っていないと思うのですが...

Q. マッチングに「ー」を使うと以下のようなエラーが出る.間違っていないと思うのですが...

Unmatched [ in regex; marked by <-- HERE in m/ー <-- HERE / at ****.pl line ***

A. 使用することができない(使用しにくい)文字です.
コンピュータでは各文字に,その文字を表す数値を対応づけて処理します. この文字と数値の対応表のことを「文字コード」といいます. この文字コードは通常複数の種類があり,日本語を扱う場合,主に 「Shift-jis(sjis)」,「EUC-japan」とユニコードのどれかが使用されます. 今回,授業では sjis を用いていますが,「ー」という文字は,sjis という文字コードでは, 81 5C という数値に対応しています.ところがこの「5C」という数値は「\」という特殊な 文字に対応しています.この部分が悪さをしてプログラムが上手く動きません.

基礎プログラミング(FAQ) より

これが出てしまった。

sjis → utf8 に変換してから処理をしないといかん、ということだろうな…。
use Encode;

$utf8_str = decode("shiftjis", $sjis_str); # sjis -> utf8
$sjis_str = encode("shiftjis", $utf8_str); # utf8 -> sjis
とかそんな感じにしてみたり。

以上です。

過去ログ表示

Prev - 2006/06 - Next
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30

カテゴリで表示

検索機能は Namazu for hns で提供されています。(詳細指定/ヘルプ


注意: 現在使用の日記自動生成システムは Version 2.19.6 です。
公開されている日記自動生成システムは Version 2.19.5 です。

Powered by hns-2.19.6, HyperNikkiSystem Project