メインメニューをとばして、このページの本文エリアへ

文字

文字@デジタル

続・漢和辞典に文字コードをみる

比留間 直和

 漢和辞典を開くと個々の漢字に付されている、JIS漢字などの「文字コード」。JISの規格票を実際に目にする機会がまずない、ごくふつうのユーザーにとって、漢和辞典のこうした記載はなかなか有用です。

 ただ文字コードの側からみると、漢和辞典に示されたコードを見るだけでは、「その文字コードが表しているもの」を十分に理解するのは難しいのが実情です。

 どういうことでしょうか。

 

■「朝」の旧字はJIS漢字にない?

 

 たとえば、朝日新聞の「朝」という字。前回参照した5種の漢和辞典――「漢字源」「新選漢和辞典」「新漢語林」「全訳漢辞海」「新明解現代漢和辞典」――はいずれも、JIS漢字の区点番号「3611」をこの字に付しています。

 一方、これまたどの辞書も「朝」の横に“旧字体”として、つくりの月の横棒が点々(いわゆる舟月)になった「」を掲げているのですが、こちらには文字コードが何も付されていません。例えば「漢字源」では下のような具合です。

 では、JIS漢字には旧字体の「」を表すコードは存在しないのか?というと、そういうわけではないのです。

 ここで登場するのが、このコーナーではおなじみの「包摂」という概念です。

         ◇

 文字コードの規格は、字体・字形の標準を決めたものではなく、「既に存在する文字と、コードとの“対応関係”を決めたもの」に過ぎません(字体の標準は、JISではなく「常用漢字表」や「表外漢字字体表」の守備範囲です)。

 たとえばJIS第1・第2水準(JIS X0208)では、「朝」は「36区11点」(区点3611)と決められていますが、JIS規格票に印刷された「朝」の形は単なる例示であり、「3611」という区点で表される文字の字体・字形には一定の“幅”が想定されています。これが「包摂」です。

 JIS漢字の規格票には、どういう字体差を包摂するのかを具体的に示した「包摂規準」が掲げられており、そのひとつに「月」の字体差に関するものがあります。下の3種類の「月」の字体差は、文字コードとしては同一視することになっています(JIS X0208:1997 規格票から)。いちばん右の月は、2本の横棒が右の縦棒に接しない形です。

 この包摂規準により、JIS漢字ではいま我々が普通に目にする「朝」だけでなく、旧字体の「」も、区点「3611」で表すということが分かります。

 もちろん実際のほとんどの製品は、JISの例示字体と同じく、常用漢字表が掲げる通用字体の「朝」になっていますし、わざわざ旧字体の「」を使う場面はめったにありませんから、《旧字体も同じコードで表される》といっても、多くのユーザーには関係がありません。

 しかしDTPなど専門的な用途では、旧字体の「」が必要な場合もあります。その際、JIS漢字の規定に従えば、文字コードとしては常用漢字の「朝」と同じ区点「3611」を使うことになります。新旧の字体を使い分けるには、特定のフォント名を指定したり、フォントやアプリケーションが異体字切り替え機能をサポートしていればそれを利用するなどして、通常の文字コードとは別のレベルで区別するのが一般的です。

 

 漢和辞典が掲げる文字コードが、JIS漢字の規格に忠実に「この字はこのコードポイントで表される」ということを示すものであるならば、旧字体の「」に対しても、ふつうの「朝」と同じく「3611」という区点番号が掲げられてしかるべきだ、ということになるでしょう。

 しかし先に述べたように、見た限り、どの漢和辞典も旧字体の「」にはJIS漢字のコードを付していません。常用漢字の字体と旧字体とが同一のJIS漢字コードで表される例はほかにもけっこうあるのですが、そのような場合に漢和辞典では旧字体にJIS漢字のコードを掲げていません。

 ということは、漢和辞典に記載されたコードは、JIS漢字の規定を(包摂まで含めて)厳密に示すものではなく、「ここに掲げた字体はJIS漢字のこのコードポイントの例示字体と同じである」といった性格のものだと理解したほうがよさそうです。そのコードポイントで表すことになっている“字体の幅”は考えない、ということです。

 言い換えると、漢和辞典を見ただけでは「文字コード規格として、そのコードポイントがどこからどこまでを表すことになっているか」をきちんと知ることはできないわけです。

 

 ただ、そのことが問題だ、と決めつけるつもりはありません。

 一般に使われているフォントの多くは「JISが例示したとおり」に設計されています。だとすると、漢和辞典に「これも包摂、あれも包摂」と書き込んでも、一般ユーザーにとってそれほど有用とは思われません。

 JIS漢字に包摂規準が細かく示されたのは1997年改正以降の話で、それ以前は規格票の「解説」に“字形の違いがわずかであると認めるもの”が一部例示されているだけでした。そのため当時は、例示字体を頼りにコードを振るしかなかったと思われます。

 また、漢和辞典には日常めったに使われない異体字も収録されることがありますから、辞典編集者が規格票と首っ引きで「包摂されるか否か」をいちいち突き詰めるのは、必ずしも建設的とはいえません。その点からも、「例示字体ベース」という今の割り切り方がよいのかもしれません。

 ただ、文字コードの側の「理屈」との間にズレがあるのは間違いないわけですから、できれば漢和辞典の凡例にそのあたりの説明を少しつけておいてほしいと思います。

 

■「葛」の略字はJIS漢字にない?

 

 「朝」のように、戦後の当用漢字に入り、割と早くから字体が安定していたものはよいのですが、JIS漢字には、途中の規格改正で例示字体が変わったものがあります。

 たとえば、東京都カツシカ区の「カツ」。1978年にJIS漢字が制定されたときの例示字体は康熙体の「」でしたが、83年の改正で略字体の「」になり、さらに2004年のJIS X0213改正では再び康熙体の「」になりました。

 ちょっと昔の漢和辞典の例として、学研「漢字源」の改訂新版(1994年発行。手元にあるのは1998年の第5刷)を見ると、康熙体の「」のコード欄には何も示されていない一方、略字体の「」にはJIS漢字の区点番号「1975」が付されています。

 これに対し、今回使った最新の漢和辞典では、略字体の「」ではなく、康熙体の「」にJIS区点「1975」が掲げられています。「どちらの字体にJIS漢字のコードをつけるか」がひっくりかえったわけです。

 ※漢和辞典の多くは康熙字典に倣って草冠を「4画」に設計していますが、その差はここでは無視しています。

 

 しかしJIS漢字の立場からすると、「表外漢字字体表」(2000年国語審答申)を反映させるための2004年改正で、例示字体を略字体の「」から康熙体の「」に変えはしたものの、その前から「曷」の部分の字体差に関する包摂規準が立てられており(下の図)、規格としては今も、略字体の「」が同じ区点「1975」に包摂されています。

 つまり、区点「1975」が表す“内容”は、2004年改正を経ても、全く変わっていないのです。

 また、JIS漢字の例示字体が変わったからといって、世の中の製品が一斉に入れ替わるわけでもありません。今も使われている Windows XP に搭載されているMSフォントは、(ユーザーが意図的にフォントを入れ替えない限り)略字体の「」になっていますし、多くの携帯電話のフォントも同様です。

 「最新のJIS漢字の例示字体」だけに合わせてコードを示す方式だと、以前の例示字体に合わせた製品を使っているユーザーが漢和辞典を見たときに戸惑ってしまうかもしれません。

 こうした問題については、「新潮日本語漢字辞典」(新潮社)のように、2004年改正の前と後の両方の字体に同じ文字コードを付したうえで、改正後のほうに「04改」マークをつけている辞書もあります。移行期においては、このような示し方が便利かつ無難であるように思います。

         ◇

 文字コードにつきものの「包摂」の基本的な部分をおさえたうえで、次回以降、2004年JIS改正やUnicodeとの関係をめぐる悩ましい事柄をさらに見ていきます。

(つづく)

(比留間直和)