日本語入力についてふわっとまとめてみる

日本語入力とは

私は現在20代なので、PCで日本語が入力できるのは当たり前という感覚の世代なのですが、昔はそうではなかったんですよね。もともとPCは日本語の入力を想定されていません。こいつはアメリカ生まれなのでアルファベット想定で作られました。

なので、昔は自分で日本語入力システムなんかを準備する必要があったそうです。今はそんなことせずとも日本語が入力できるのですから、いい時代ですね。

現在の言語設定を確認する

日本語システムの準備は、今のPCではほぼ不要なので、現在適用されている言語だけでも調べてみます。

echo $LANG

すると私の環境では以下のような出力がされました。

ja_JP.UTF-8

日本語(ja_JP)で、文字コードは(UTF-8)ですね。

文字コードとは

Wikipediaから引用しますと、

コンピュータ上で文字(キャラクタ (コンピュータ))を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係(文字コード体系)のことを指して「文字コード」と呼ぶことも多い

とのことです。

日本語の文字コードといえば、Shift_JISUTF-8EUC-JPが有名っぽい漢字です。

文字コードが異なると、文字化けの原因となります。たとえば、「あ」をShift_JISで表現すると「ab」でも、UTF-8で表現すると「abc」になってしまうと、正しく表示されません。これが文字化けの原因です。

ちなみに私はUTF-8をよく使用しています。Shift_JISよりも言語のサポートが多いので。iOSだとShift_JISが文字化けしていたような...うろ覚えですが。

もっと詳細が気になる場合はGoogle先生に聞いてみましょう。