てがみ: qatacri at protonmail.com | 統計 | 2023

202332501

そういえば最近、日本語のフォントと中国語のフォントが混じって、でこぼこに表示される機会が減った。これには次のような事情があったらしい。

まず前提として、 Unicode の CJK 統合漢字では由来と字形の両方が一致するものに同じコードポイントを割り当てている。たとえば簡体字と繁体字が統合されているわけではない。とはいえ各言語/地域で使われている字体には細かな差異があり、言語/地域ごとに別のフォントを使う必要がある。

「源ノ角ゴシック」バージョン 2.000 の技術的な特長について

以前は各言語/地域で使われる漢字のみが収録されたフォントが主流だった。このとき、たとえば lang=ja で中国語のテキストを表示すると、日本の漢字と統合されている文字のみが日本語フォントで表示され、残りはフォールバックして中国語フォントで表示される。これがでこぼこ表示になる状態。

やがて Noto フォントのような、世界中の文字を統一デザインでサポートするフォントが登場した。前述のように、たとえ統一デザインであろうと言語/地域ごとにフォントの切りかえは必要である。どうなっているかというと、言語/地域ごとにフォントを用意しつつ、各フォントはその言語/地域で使われない漢字も含んでいる。

つまり実は多くの場合、複数フォントからのグリフ (用語自信なし) が混在していないだけで、各言語/地域に適切なフォントが選ばれているわけではない。