メインメニューをとばして、このページの本文エリアへ

文字

文字@デジタル

漢和辞典に文字コードをみる Ⅵ

比留間 直和

 「Unicodeを記載」とうたっている漢和辞典同士を比べてみると、同じ形の字でもUnicodeを掲げていたりいなかったりすることを見てきました。

 これまで挙げた例は、「Unicodeを示すか示さないか」という違いでしたが、「Unicodeをどの字体に示すか」が異なっている例もあります。

 

 東京都カツシカ区のカツ。「続・漢和辞典に文字コードをみる」(2012年2月20日)の回で、参照した五つの漢和辞典のすべてが、2004年のJIS改正後の例示字体「」にだけJIS区点を掲げ、改正前の例示字体「」には掲げていない――ということを紹介しましたが、実はUnicodeのほうは、辞典によって記載のしかたが2通りに分かれています。

 五つの辞典のうち「全訳漢辞海」と「旺文社漢字典」の二つは、ご覧のように、Unicodeを標準字体の「」でなく異体の「」のほうに示しています。

 ※漢和辞典では草冠を康熙字典に倣って「4画」で示すものがありますが、ここではその違いは無視します。

 1978年にJIS漢字(第1・第2水準)が制定された際の例示字体は、いわゆる康熙字典体の「」でしたが、83年の改正で略字の「」に変わり、ワープロ・パソコンの普及期には多くの機器で「」の字体が搭載されてきました。しかし2000年の国語審議会答申「表外漢字字体表」で「」が“印刷標準字体”と位置づけられたのを受け、2004年のJIS X0213(第1~第4水準)改正で、例示字体が再び「」になりました。

 一方、Unicode(ISO/IEC 10646)のコード表では、漢字についてはそのコードポイントに統合された各国・地域の字体が併記されていますが、このうち日本の字体はUnicodeが作られた当時のJIS漢字(1990年版)のまま変わっていません。そのため、カツシカのカツを表す「845B」というコードの日本の字体の欄は、いまも略字の「」になっています。

 しかしUnicodeでは「」も「」も845Bに統合されており、そのコードに対応する日本のJIS漢字の例示字体は康熙体の「」に変わっているわけですから、漢和辞典で845BというUnicodeを「」でなく「」のほうだけに掲げるのは不思議と言わざるを得ません。「どれかひとつの字体」にUnicodeを振るのであれば、JIS区点と同じく「」に掲げるのが自然でしょう。

 「」と「」をパソコン上で使い分けたいと考えている人がこのような辞典の記載を見たら、「を使うにはJISの区点1975、を使うにはUnicodeの845Bを入力すればいいのか」と思ってしまうかもしれません。

 しかし、Windowsの「IMEパッド」や、ATOKの「文字パレット」などのツールを使ってその通りに入力しても、(アプリケーション上で何らかの加工をしたりしない限り)画面に現れるのは同じ字体です。使用フォントがMS明朝やMSゴシックの場合、XPならふつうどちらも「」、Vista以降ならどちらも「」になります。パソコンにとっては、「JIS区点で1975」と「Unicodeで845B」は、実質的に同じものだからです。

 その意味でも、「JIS区点で1975」と「Unicodeで845B」を別々の字体に分けて掲げるのは適当でないように思われます。

         ◇

 ところで、「カツシカのカツ」でJIS区点とUnicodeを2004年JIS改正後と改正前の字体に分けて振っている「全訳漢辞海」と「旺文社漢字典」は、2004年改正で字体が変わったものはどれも同じように分けて記載しているのでしょうか。2004年に字体が変更された168字を、この二つの辞典でひいて確かめてみました。その結果が下の表です。

 2004年改正で字体が変わった168字のなかには見た目の変化がわずかなものもあり、上の表の最下段のように、改正前の字体を異体として掲げていないケースも少なくありません。

 改正前の字体を異体として掲げているのは「全訳漢辞海」では計125字、「旺文社漢字典」では計73字。これらの字の多くは、「カツシカのカツ」と同様、2004年改正後の字体にJIS区点、改正前の字体にUnicodeが掲げられていましたが、一部はJIS区点とUnicodeの両方が改正後の字体に示される(これが自然な示し方です)などしており、方針が一貫していないことが分かりました。

 

         ◇

 

 ここまで6回にわたり、漢和辞典における文字コードの記載についてあれこれ紹介してきました。

 全体を通じて感じたのは、やはり、Unicodeの取り扱いについて漢和辞典が戸惑っているように見えることです。「JIS漢字と対応づけられていないUnicodeも示すか」「既存の文字コードとの互換性をとるための『互換漢字』のコードも掲げるか」「2xxxxで表される5桁の領域まで掲げるか」などについて、漢和辞典によって差があることを、具体例とともに見てきました。

 流れとしては「より多くUnicodeを掲げる」という方向に進んでいるようですが、漢和辞典にとってどこまで意味があるでしょうか。

 

 かつて、ワープロ・パソコンの入力システムが未熟だったころは、文字コードを使って目的の漢字を入力する場面がしばしばありました。しかし現在では「手書き入力」も可能になり、一般ユーザーが文字コードを打ち込むことはかなり減っていると思われます。

 その一方で、今回の「カツシカのカツ」のような事例を見ると、漢和辞典の側はUnicodeをいささか「持てあましている」ようにも感じられます。

 JIS漢字は日本国内の需要をもとに作られたもので内容がはっきりしており、また最近の漢和辞典は収録範囲として「JIS漢字を網羅」などとうたっていますから、個々の字にJIS区点(面区点)を示すのは十分意味があります。他方、Unicodeには各国・地域からさまざまな事情で入った字があり、またそこに定義された漢字全体のうち一部しか漢和辞典に載っていないことを考えると、漢和辞典にUnicodeを載せるのがそれほど重要とは言えない気がします。

 辞典によって対応が大きく異なってしまうぐらいなら、いっそUnicodeに神経を使うのはもうこのへんにして、その分、漢和辞典本来の中身の充実や精度向上にさらに力を注いでくれたほうがありがたい。商売柄、ほぼ毎日漢和辞典を開いているユーザーとしては、そんなふうに思っています。

(比留間直和)