Unicode を学ぶ
インタラクティブなガイド。各記事から Unicode Viewer ツールに連携して、実際に手を動かしながら学べます。
基礎
🔤
「1文字」は嘘: 書記素クラスタを理解する
string.length が嘘をつく理由、書記素クラスタの正体、そして Intl.Segmenter による解決。
📦
UTF-8 バイト解剖: 文字がバイトになるまで
UTF-8 エンコーディングのバイトレベル解説。コードポイントが1〜4バイトにマップされる仕組み。
🔄
Unicode正規化完全ガイド: NFC/NFD/NFKC/NFKD の違い
同じに見えるテキストがなぜ異なるバイト列になるのか。4つの正規化形式の使い分けを視覚的に解説。
🧩
サロゲートペア: なぜJavaScriptは絵文字で壊れるのか
UTF-16 サロゲートペアの仕組み。JavaScript/Java/C# で問題になる理由と正しい対処法。
エンコーディング
CJK
🇺🇳
Han Unification: Unicodeが10万字の漢字を統合した方法
日中台韓の漢字がどのように統合されたか。IRGソースフラグで各文字の出自を確認。
✍️
IVS 完全解説: 同じ漢字の47通りの字形を表示する
異体字セレクタ(IVS/SVS)の仕組み。登録された全バリアントをフォントで実際に表示。
🎨
なぜフォント1つでは足りないのか: CJK異体字とフォント対応の不揃い
CJK フォントごとに対応する IVD コレクションが異なる仕組み、単一フォントで全異体字を表示できない理由、本サイトが 3 つのフォントを組み合わせて全 IVS を正しく描画している舞台裏。
📊
JIS水準と区点コード: 日本の文字分類体系を読み解く
JIS X 0208/0213 に基づく第一〜第四水準の分類と区点コードの読み方。