メインメニューをとばして、このページの本文エリアへ

文字

文字@デジタル

28と29のあいだ

比留間 直和

 前回、「Windows XP + Internet Explorer 6」の環境では、「」や「」が中黒(・)に見えてしまうこと、そのためこのコーナーなどではこれらの字はフォントで表示させるのでなく画像を使っていることを紹介しました。

 「」と「」はいずれも、1978年にJIS第1・第2水準(JIS X0208。当時はJIS C6226)が制定された時点ではこの伝統的な字体だったのですが、83年の改正で略字体の「蝉」や「騨」に変更されました。それ以来、ワープロなどでは「」「」の字体を使いたくても略字の「蝉」や「騨」を使うほかなかったのですが、2000年に制定されたJIS X0213(第1~第4水準)で第3水準に「」「」が“復活”したおかげで、Vista以降のMSフォント(MS明朝、MSゴシック)ではこの字体も使えるようになりました。

 「83年のJIS改正で略字に変わったものといえば、『鷗』もそうだよね」
 「そうです。『鷗』から略字の『鴎』になりました」
 「でも『鷗』は、『』や『』と違って僕の古いXPでもちゃんと見えるんだけど、どうして?」

 そこが紛らわしいところなんです。今回はそのへんの経緯を補足しておきます。

 

■78JIS字体の「復活」

 

 83年のJIS改正は、大幅な字体変更が行われたことで知られています。

 現行のJIS X0208(97年版)規格票の「解説」によれば、83年改正では「300文字の漢字の字形の変更」が行われました。多くは、第1水準の表外漢字を常用漢字の新字体(略字体)に準じた形にするもので、「鷗→鴎」「→蝉」「→騨」もそれに含まれます。

 「でも昔の新聞記事で、『鴎など29字の略字体』と出てた気がするんだけど」
 「そんなことよく覚えていますね。さすがベテラン校閲者」
 「この29って数字は何なの?」

 83年に「300文字の字形変更」をしたとはいっても、JIS漢字が示すのはあくまで例示字体。実際の製品を全く同じ形で作らなければならないわけではありません。たいていの文字コード規格は、細かい形の差は区別せずに「同じ字」とみなし、一つのコードで表すことにしています。これを「包摂」といいます。

 ただ、JIS漢字が具体的にどんな字体差を包摂するのか、78年版、83年版、90年版の規格票には、網羅的には示されていませんでした。そこで97年のJIS改正にあたった委員会は、78年の制定当時の資料を調べるなどして検討を重ね、「包摂規準」を規格に明示したのでした。

 途中の改正で字形を変えたものについては、基本的に以前の形を包摂する(つまりどちらでもかまわない)としたのですが、83年に字形を変更した300字のうち、「鷗→鴎」など29字が「規格内部の字体認識と矛盾する甚だしい変更」(97JIS規格票「解説」)と認定されました。本来は包摂できない字体差ということです。しかし、包摂することにしておかないと78JISの字体を使っている製品が規格に適合しないことになってしまうため、29字については通常の包摂ではなく「互換性維持のための包摂」という扱いをすることになりました。

 この「29字」という数は、97年改正のときに洗い出されたもので、83年改正の時点で意識されていた数字ではありません。

 しかし97年改正ののち、JISが83年に簡略化した文字の代表として「29字」が何かと引き合いに出されました。表外漢字字体表の試案が出たころの新聞記事でも、


 八三年のJIS改定で略字体の「鴎」などの二十九字=表右列=が康熙字典体=左列=に代わって採用された。ワープロなどで、この二十九字は略字体しか出なくなり、康煕字典体を使う教科書や辞書との違いが出た。

【朝日新聞 1998年6月25日付朝刊1面】(表は割愛)


 今回の国語審議会での議論は、ワープロやパソコンで、「鷗」や「瀆」などが略字体でしか入力できないという問題がきっかけとなった。これは、コンピューターなどの文字表記を定める日本工業規格(JIS)の漢字コードが八三年に改訂された際、「鴎」など二十九字分の略字体が採用されたことに伴うものだ。

【読売新聞 1998年6月26日付朝刊17面】

 といった具合に、「29字」がずいぶん強調されていました。字体を簡略化したのは29字だけではありませんから、その点については誤解を招く書き方だったように思います。

 「それでどうなった?」
 「JIS X0213で第3・第4水準をつくったとき、この29字の78JIS字体がすべて第3水準に復活しました。だからX0213では鴎と鷗は包摂関係にはなく、別々のコードで表されるんです」
 「JISとして落とし前をつけたわけか。でも僕のXPだと、第3・第4水準はまだ載っていないんだよね?」

 その通り。XPのMSフォントで「鴎」と「鷗」がそれぞれきちんと見えるのは、第3・第4水準ではなく補助漢字(JIS X0212)のおかげです。

 1990年に制定された補助漢字も、一部の78JIS字体を「復活」させました。ただし、97JISで別ワクにされその後第3水準に復活した「29字」とは少し違う、「28字」でした。

 先の「29字」とこの「28字」を比べると、「29字」にだけ含まれるのが「」の3字、「28字」にだけ含まれるのが「瘦 繫」の2字です。

 そして補助漢字は、Windows98以降のMSフォントに搭載されました。

 

 「じゃあ29字のうちの3字以外は補助漢字に入っているから、XPでも使えるわけだね」
 「はい」
 「しかし似たようなことをやったのに、28字だったり29字だったりとズレちゃったのか」
 「97JISの『解説』は、補助漢字を『文字集合の範囲の設定の意図が明確でない』などと厳しく批判していて、28字の復活も意図や理由が不明だとしています」
 「ふーん。でも補助漢字ってそのままあるんだろ」
 「そうですけど、JIS漢字のメーンストリームはもう補助漢字じゃなくてX0213(第1~第4水準)ということになっていますね」
 「ところで2004年にも何文字か追加されたよね。それはこの28字とか29字とかとは全然別?」
 「実は28字とちょっとかぶっています」

 

■「追加10字」もあわせてみると

 

 2004年改正は、2000年に国語審が答申した表外漢字字体表を反映させるためのもので、X0213を対象に、168字の字形変更と10字の追加が行われました。

 このうち「10字の追加」というのは以前にも述べました(「シカルとシカル」の1回目3回目)が、本来なら包摂の対象なので字形変更で済むはずのところが、国際文字コードのUnicode(ISOの規格も含めてこう呼んでおきます)では区別しているため、Unicodeとの対応関係に齟齬が生じないよう、やむなく分離・追加したものです。

 「28字」「29字」「10字」の関係をまとめると、以下のようになります。

 

 

 上の表のように、04年に追加された「10字」のうち「瘦」と「繫」の2字は、補助漢字で復活した「28字」と重なっています(瘦は、補助漢字と第3・第4水準との間に微細な形の違いがありますがここでは無視しておきます)。

 そもそもUnicodeの漢字領域を最初に作る際、日本、中国、台湾、韓国のそれぞれの文字コード規格が材料となったのですが、「ある国の規格で区別されているものは、Unicodeでも区別する」というルールが立てられました。原規格とUnicodeとの「往復」を可能にするための措置です。日本からは第1・第2水準と補助漢字が材料に使われたため、必然的に「補助漢字で復活した28字の78JIS字体」は全てUnicodeでも83JIS字体から区別されて別のコードが与えられています。実際、このルールの適用例には「痩/瘦」が挙げられており、本来は区別しない字体差だが日本の規格にあわせて区別を保持したことが示されています。

 補助漢字で復活した「瘦」と「繫」は、第3・第4水準では当初「落選」したものの、Unicodeという別のルートを通って、2004年にみごと第3・第4水準に「再復活」したわけです。いったん落選したとはいってもMSフォントでの実装という面から見れば、その間もより地位が高かった、とも言えるのですが。

 「ややこしいけど、要するに補助漢字に入っていないの3字との8字が要注意ってことか」
 「表外漢字字体表が示した1022字の印刷標準字体のうち、XPで中黒に見えることがあるのはその11字です。ほかの印刷標準字体は、多少形が変わることがあってもその漢字だということはわかります」
 「04年に追加された10字に気をつければいいってわけじゃないんだね。でも補助漢字にあるかどうかって、どうやって調べるのがいいのかな」

 では、その件は年明けにでも。

(比留間直和)

(次回は2012年1月16日掲載予定です)