メインメニューをとばして、このページの本文エリアへ

文字

文字@デジタル

Win8で味わう「IVS」・その四

比留間 直和

 “枝番号”方式で細かい字形差を表す「IVS(Ideographic Variation Sequence)」に対応した、Windows8。前回は、そのWindows8のMS-IMEとMSフォントとの間で、「筵」という字をめぐってIVSへの対応に「ずれ」が生じていることを述べました。

 かいつまんでいうと、

 Windows Vista以降、JIS2004に対応してMSフォントの字形が変わったが、そのうち122字はOpentypeの字体切り替えという方法により、DTPソフトなどで、変更以前(いわゆるJIS90)の字形を呼び出すことができる。
 Windows8では、それらのJIS90字形をIVSによって使うこともできるようになった。MS-IMEの変換辞書にも登録されており、(設定を変えれば)JIS90字形が候補に出てくる。
 ところが122字のうち「筵」だけは、JIS90字形をIVSで使うことができない。MS-IMEは枝番号つきの「筵」を変換候補に出すが、それはJIS90字形になっておらず枝番号なしの「筵」(JIS2004)と同じ字形であり、無意味な辞書登録となっている。

 ……というものでした。(詳しくは前回をご参照ください)

 Vista以降とXPまでの、それぞれのMSフォントの「筵」は、こんな形です。

 


 「でもまあ、間違った字が出てくるわけじゃないから、さほど害はないんじゃないの?」
 「MSフォントで、IVS形式ではJIS90字形の『筵』が使えないということについては、まず問題にならないと思います。でもMS-IMEで余計な候補が出てくるのは混乱のもとでしょう。もっとも、初期設定ではIVS形式の候補は出てこないようになっているので、初心者にはあまり関係ないですが」
 「ところで、XPまでの『筵』の形って、なんか懐かしい気がするんだけど」
 「ああ、以前朝日新聞が使っていた字体といっしょです」
 「やっぱりそうか……」

 

■朝日の「筵」もこの形でした

 

 IVSの仕組みとは別の話ですが、WindowsXPまでのMSフォントの「筵」はごらんの通り、竹かんむりの下が常用漢字の「延」の形。6年前まで朝日新聞が使っていた「筵」も、これと同じスタイルでした。

 頻度の高い字ではないので、紙面でこの字の変化に気づいた方はほとんどいらっしゃらないでしょう。

 戦後、当用漢字(のち常用漢字)以外の漢字(=表外漢字)の字体基準が示されないなか、朝日新聞では独自の判断で当用漢字の略し方を表外漢字にも適用し、「鴎(←鷗)」「涜(←瀆)」などの字体を使っていました。「竹かんむり+延」という要素からなる「筵」も、表内の「延」に合わせたスタイルにしていました。

 その後、2000年に国語審議会(当時)が「表外漢字字体表」を答申し、表外漢字の字体基準がようやく示されました。表外漢字には明治以来使われてきた「いわゆる康熙字典体」が採用され、「筵」についても康熙字典に沿った字体が「印刷標準字体」として掲げられました。「止」の部分の最後の縦棒と横棒が続けて1画で書かれるのがそれです。

 朝日新聞では2007年1月15日から表外漢字の字体を同字体表に従い変更しましたが、このとき「筵」も上に示したように変わりました。「延」を構成要素に含むほかの表外漢字も、同様に字体を変更しました。

 

 一方、JIS漢字も2004年の改正で「筵」の例示字体が変更されましたが、前回述べたとおり、改正前の字体は朝日やMSのような“表内型”ではありませんでした。(つまりXPまでの「筵」は、厳密な意味での「JIS90=90年版JISの例示字体」ではないわけです)

 「JISは『止』の形じゃなくて、えんにょうの『筆押さえ』が変わったんだったね。これって、ほんとはどっちでもいいんでしょ?」
 「表外漢字字体表で筆押さえは『デザイン差』とされているので、あってもなくても差し支えないんですが、表外漢字字体表の掲げる字はみんなこういう筆押さえのない形なんです。JIS改正では、こういう細かい違いしかないものも、機械的に表外漢字字体表に合わせて変更されました」
 「ほかにも『延』が部品になってる字はあるよね。MSフォントだとそういう字はどうなってるの」

 Vista以降のMS明朝で「延」が構成要素に含まれる漢字を並べてみると、こんな具合です。

 「第1・第2水準の表外漢字は、だいたいが常用漢字と同じ『延』の形だったんだね」
 「ここに挙げた第1・第2水準の字のJIS例示字体はもともと康熙字典体なんですが、MSフォントはJISと違って、その多くが表内型でした。このうち、表外漢字字体表に示された『筵』だけはVistaで形が変わりましたが、ほかの字は今もそのままです」
 「3列目の『その他』っていうのは?」
 「補助漢字や第3・第4水準の字ですが、こちらはMSフォントもみな康熙字典体です。あとから追加された字なので、JISの例示字体と合わせたんでしょう」
 「ひとつのフォントのなかでも形がいろいろなんだなあ」
 「『延』の新旧は表外漢字字体表ではデザイン差として認められていないんですが、MSは『筵』以外の字は変えなかったんですね。まあ、この違いに目くじらを立てる人もあまりいないと思いますけど」

 

■何を「区別」しているか

 

 これも前回触れましたが、IVSのための登録簿である漢字字形データベースには、DTP用フォントのための字形コレクション「Adobe Japan1」から登録されたものと、戸籍や住基台帳の文字を集めた「汎用電子情報交換環境整備プログラム」から登録されたものの2種類があり、MSフォントのIVSは、Adobe Japan1コレクションの一部を使っています。

 「そのAdobe Japan1コレクションには、表内型の『筵』が入ってないんだったね」
 「ええ。汎用電子コレクションには入っていて、『E0102』という枝番号が与えられているんですが、Adobe Japan1コレクションにあるのはJISの2004年改正の前後の字体だけで、MSフォントのJIS90字形に使える枝番号が無いんです」
 「この字だけでも汎用電子のほうの枝番号を使っちゃえばいいんじゃないのかな」

 

 たしかに、世の中には両方のコレクションをカバーしているフォントもあり、「どちらか一方のコレクションしか使ってはいけない」というわけではありません。ただ、IVSは「どちらのコレクションか」を強く意識して使うのがふつうのあり方です。それぞれのコレクションは別々の目的や方針で作られた集合であり、IVSではそれが整理・統合されずに併存しているからです。

 そのため、同じ字形が両コレクションに重複して登録されています。「筵」の場合、枝番号E0100とE0103は“同じ”と見なすことができますが、枝番号が違うのでデータとしては異なったものになります。コレクションごとの運用でないと、入力するときにどちらを使うべきか、また入力済みのデータに含まれる“同じ字形”をどう処理するか、などが問題になります。

 さらに、「何を区別しているか」がコレクションによって異なる、ということがあります。たとえばAdobe Japan1は「えんにょうの右払いの筆押さえ」の有無を区別し、そこだけが違う字形を別々にもっていますが、汎用電子のほうは基本的にその違いを区別していません。上の「筵」のE0103はたまたま筆押さえのある字形になっていますが、E0102との違いで大事なのはそこではなく、「止」の部分の形です。だとすると、「筵」のE0100(筆押さえ有り)とE0101(筆押さえ無し)とE0103(筆押さえを区別せず)は、どれとどれが“同じ字形”と考えればよいのでしょう。

 IVSは、通常なら区別されない字形どうしを枝番号という「おまけ」によって区別する手法であり、“文字としては同じ”というのが大前提なので、従来の文字コードのような「包摂か区別か」という議論を持ち込むべきではないかもしれません。しかし、入力されたデータを共有しその字形の情報を混乱なく運用していくには、枝番号と字形の「解釈」について共通認識が必要だと思います。

 

 「そうするとやっぱり『両方ごちゃまぜに使おう』とはなりにくいのか」
 「それぞれのコレクションのなかだけで運用すれば、そのコレクションの作成方針とか字形認識に依拠できますからね。自分の手元で一時的に使う場合はともかく、長く安定的に運用するのなら、業務ごとにどのコレクションかはっきりさせて使うことになるでしょう」
 「うーん、やっぱり普通のユーザーには難しそうだなあ」

 

 とはいえ、IVSの時代はまだまだ始まったばかり。これからに注目です。

(比留間直和)