ネットワーク経由で日本語のファイルを持ってきたとき、場合によっては自分 の計算機の使う漢字コードと違うコードで書かれている場合があります。現在 ワークステーションで使われている漢字コードにはEUC(ujis)、シフト jis(sjis)、7ビットjis(jis)、DEC漢字などがあります。電子メールなどはネッ トワークを経由するとき自動的に7ビットjisコードに変換され相手計算機でそ の計算機標準のコードに変換されるので気にすることはありません。そうでな い方法でバイナリーファイルとして送られて来た場合などコード変換をしてや らないとうまく表示されない場合があります。そのためのコマンドは計算機毎 に違っていますが、概念的には同じようなものがあるはずです。例えばSUNで はEUCが標準ですが、
euctojis EUCからjisへの変換。 jistoeuc jisからEUCへの変換。 euctosj EUCからシフトjisへ。 sjtoeuc シフトjisからEUCへ。 jistosj jisからシフトjisへ。 sjtojis シフトjisからjisへ。
が用意されています。DECではdec_jis、dec_sjis、dec_ujis、jis_dec、 sjis_dec、ujis_ decなどが、HPではstoj、jtos、utoj、jtou、stou、utosな どがあります。コマンド名から想像がつくでしょう。これらはフィルターコマ ンドとして使えます。
nkfというコマンドがインストールされた機械も多いと思います。このコマン ドの優れているところは入力側の漢字コードを自動判定してくれることです。 ですから出力コードとして何を選ぶかだけ考えればよいわけです。nkf -eで出 力はEUCに、nkf -sでシフトjisに、オプション無しでjisに変換します。