文字コードとは何か？文字とコンピュータの共通言語

はじめに

「あれ？文字化けしてる！」――誰もが一度は目にしたことがあるこの現象の原因が、「文字コード」です。
私たちが普段使っている文字をコンピュータがどう理解し、保存・表示しているのか？
本記事では文字コードの基本から仕組み、主要な種類までをわかりやすく解説します。

文字コードとは、「文字」と「数値（バイト列）」の対応関係を定めたルールのことです。
コンピュータは文字そのものを扱えないため、1つ1つの文字に数値を割り当てて処理します。

主な用途：

項目	内容
ASCII	英数字や記号のみを扱う7ビット文字コード（基本）
Shift_JIS	日本語向けの2バイト文字コード
UTF-8	Unicodeの1つ。可変長で、多言語対応に優れ世界標準
Unicode	世界中の文字を一元的に扱うための共通コード体系

文字コードは、文字を数値として扱うための基盤技術です。
エンジニアにとって「当たり前に動く」前提の仕組みですが、エンコード・デコードのミスは深刻なバグにつながります。
UTF-8の理解を中心に、文字コードの扱いに強くなることで、より堅牢で国際対応なソフトウェア開発が可能になります。