2019/04/30(火) [n年前の日記]
#1 [python] 1バイトの半角カナは今時どういう扱いになっているのだろう
Python を使って、MZ-700時代のファイルを読み取ってヘッダ情報を表示するツールを書いているのだけど。1バイトのカタカナを読み取って表示するあたりで悩んだり。そもそも今時、1バイトで表せるカタカナのコードって、どういう扱いになっているのだろう…。
調べてみた感じでは、そもそも、MZ-80K のカタカナと、SJISの半角カタカナは、位置が合ってないようで…。
_Enri's Home PAGE (mz-80K)
_文字コード表 シフトJIS(Shift_JIS)
MZ-80K は 0x81 からカタカナが始まっているけれど、SJIS は 0xa1 からカタカナが始まっているように見える。これでは変換のしようがないよな…。
辞書だかハッシュだかで変換してしまおうか。でも、カタカナ表示にも対応すると、英語圏で使われた場合にカタカナが表示されなかったりもするのだろうし。カタカナは全部「?」表示にしてしまったほうがいいのだろうか。
調べてみた感じでは、そもそも、MZ-80K のカタカナと、SJISの半角カタカナは、位置が合ってないようで…。
_Enri's Home PAGE (mz-80K)
_文字コード表 シフトJIS(Shift_JIS)
MZ-80K は 0x81 からカタカナが始まっているけれど、SJIS は 0xa1 からカタカナが始まっているように見える。これでは変換のしようがないよな…。
辞書だかハッシュだかで変換してしまおうか。でも、カタカナ表示にも対応すると、英語圏で使われた場合にカタカナが表示されなかったりもするのだろうし。カタカナは全部「?」表示にしてしまったほうがいいのだろうか。
[ ツッコむ ]
以上です。