next up previous contents
Next: ファイルを管理する Up: 日本語を使う Previous: より快適な変換システムへ

3.1.4.5.漢字コード変換

ネットワーク経由で日本語のファイルを持ってきたとき、場合によっては自分 の計算機の使う漢字コードと違うコードで書かれている場合があります。現在 ワークステーションで使われている漢字コードにはEUC(ujis)、シフト jis(sjis)、7ビットjis(jis)、DEC漢字などがあります。電子メールなどはネッ トワークを経由するとき自動的に7ビットjisコードに変換され相手計算機でそ の計算機標準のコードに変換されるので気にすることはありません。そうでな い方法でバイナリーファイルとして送られて来た場合などコード変換をしてや らないとうまく表示されない場合があります。そのためのコマンドは計算機毎 に違っていますが、概念的には同じようなものがあるはずです。例えばSUNで はEUCが標準ですが、

        euctojis                EUCからjisへの変換。
        jistoeuc                jisからEUCへの変換。
        euctosj         EUCからシフトjisへ。
        sjtoeuc         シフトjisからEUCへ。
        jistosj         jisからシフトjisへ。
        sjtojis         シフトjisからjisへ。

が用意されています。DECではdec_jis、dec_sjis、dec_ujis、jis_dec、 sjis_dec、ujis_ decなどが、HPではstoj、jtos、utoj、jtou、stou、utosな どがあります。コマンド名から想像がつくでしょう。これらはフィルターコマ ンドとして使えます。

nkfというコマンドがインストールされた機械も多いと思います。このコマン ドの優れているところは入力側の漢字コードを自動判定してくれることです。 ですから出力コードとして何を選ぶかだけ考えればよいわけです。nkf -eで出 力はEUCに、nkf -sでシフトjisに、オプション無しでjisに変換します。



next up previous contents
Next: ファイルを管理する Up: 日本語を使う Previous: より快適な変換システムへ



Kinya Hibino
Wed Apr 26 21:42:06 JST 1995