メインメニューをとばして、このページの本文エリアへ

文字

文字@デジタル

続々・Win8で味わう「IVS」

比留間 直和

 Windows8に搭載された機能、「IVS」の話をつづけます。今回は、Windows8の「あれっ?」という話題です。

 まずは簡単におさらいから。IVS(Ideographic Variation Sequence)とは、漢字を表すコードの後ろに“枝番号”(Variation Selectorといいます)を付けることで、文字コードでは本来区別しない細かな字形差を表す仕組みです。

 「この漢字にこの枝番号をつけるとこの字形になる」という組み合わせは、ユニコードコンソーシアムが管理する漢字字形データベース(Ideographic Variation Database=IVD)に登録されており、現在までに二つのコレクション、計2万7724字(重複あり)が収録されています。

 今回Windows8のMSフォントにIVSが採り入れられましたが、これは上記のデータベースに登録されたすべての字形ではなく、WindowsXPまでのいわゆる「JIS90」の形を出すためのものです。例えば「辻」という字は、Vista以降(JIS2004)は2点しんにょうであるのに対し、XPまで(JIS90)は1点しんにょうでした。Windows8のMSフォントでは、枝番号を付けなければ「辻」は2点しんにょうですが、後ろに特定の枝番号を付けると、JIS90の「1点しんにょうの辻」になります。

 Vistaや7のMSフォントでも、Opentypeの字体切り替えという別の手法によって、DTPソフトなどではJIS90の形を出すことができていたのですが、Windows8からはそれに加えてIVSという手段でも出せるようになったわけです。つまり「使える字形が増えた」のではなく、「手段が増えた」ということです。

 IVSの大きな特徴として、「文字コードの枠組みであるため、仮名漢字変換辞書に登録することができる」ということがあります。Windows8搭載のMS-IME2012では、枝番号つきでないふつうの字――現行のJIS2004字形――に加え、枝番号つき、すなわちIVSで表されたJIS90字形が出てきます(IVSを含む候補も出すよう設定を変える必要あり)。

 「辻」の場合も、MS-IMEによって第1のツジ(2点しんにょう=JIS2004字形)と、第2のツジ(1点しんにょう=JIS90字形)とが候補に現れます。それぞれの文字コード(Uniocde)は、第1のツジは「8FBB」と枝番号がつかない形、第2のツジは「8FBB E0100」と枝番号がついた形です。

 

■122字中、1字だけ例外

 

 では、MSフォントでIVSによってJIS90字形が出せるのは、具体的にはどの字でしょうか。

 まず、マイクロソフトがVistaを発売したときに公開した資料「Microsoft Windows Vista および Windows Server 2008 における JIS X 0213:2004 (JIS2004) 対応について」(Version 1.2) によれば、Vista以降、Opentypeの字体切り替えでJIS90字形が出せるようになっているのは、以下の122字です。

 

 

 「ああ、確かに『辻』とか『葛』とかが入ってるなあ。つまりVistaのときに形が変わったのはこの122字ってことか」
 「えーと、Vistaのときに形が変わった字はほかにもたくさんあるんですが、この122字に限って、Opentypeの字体切り替えで以前の字形(JIS90)に戻せるようにした、ということです。ほかのものは微細な修正などで、元の字形は必要ないと判断したのでしょう」
 「なるほど。そしてこんどのWindows8のMSフォントは、この122字のJIS90字形がIVSでも出せるようになったんだね」
 「いや、ところが実はですね……」
 「えっ、それもなにか違うの?」

 

 そう、違うんです。ひとつだけ。

 

■ムシロとムシロ、どこが違う?

 

 Windows8をお使いの方は、お手元のMS-IMEで、IVSを含む文字も出てくるように「変換文字制限をしない」設定にしたうえで(前々回を参照)、「むしろ」と打って変換してみてください。候補一覧のなかに、「竹かんむりに延」の「筵」が出てきます。

 まずは、「第1の筵」。MS-IMEの標準辞書に登録されているものです。候補の右側に「環境依存」の文字が見えないので、枝番号つきでない、通常の文字であることが分かります。Unicodeは「7B75」です。

 

 

 次に、スペースキーをたたいていって「単漢字辞書」を選ぶと(設定によって手順はやや異なります)、やがて「第2の筵」が出てきます。右に「環境依存」と表示されているように、こちらは枝番号つきの字です。別途文字コードを調べると、「7B75 E0101」であることが分かります。

  

 

 この二つの「筵」をよくご覧ください。

 「うーん、気のせいかもしれないけど、『第1の筵』と『第2の筵』は同じ形に見えるなあ」
 「それは、気のせいじゃないと思いますよ」
 「やっぱり? しかしどういうことかな」

 先ほど掲げた122字のうち「筵」以外の121字については、IVSでJIS90字形が出せることを確認できたのですが、この「筵」に限っては、MS-IMEが変換候補として出す“枝番号つき”の字をどう眺めても“枝番号なし”と何も変わらないんです。

 MSフォントにおける「筵」の新旧字形を、改めて見比べてみましょう。
 

  

 両者の違いは、えんにょうの右の「正」のような部分の形。右側のJIS90字形は竹かんむりの下が常用漢字の「延」と同じ形をしていますのに対し、左側のJIS2004字形はそこが一続きになっています。

 この字のJIS90字形、実は2004年改正前のJIS漢字の例示字体とは異なる形で、MSフォント特有のデザインでした。当時のJIS例示字体は、左のJIS2004字形のえんにょうの右払いの起筆に「筆押さえ」が付いただけの形。JIS漢字は2004年改正で国語審答申「表外漢字字体表」に合わせて筆押さえを外し、MSフォントもVistaのときに同じ形を採用したため、それ以降、両者の「筵」は一致しています。

 そんなわけで、ここで「JIS90字形」と呼んでいるのはあくまで「XPまでのMSフォントの形」の通称であり、当時のJIS例示字体そのものではないことをご承知おきください。

 それはそれとして。

 「Opentypeの字体切り替えだと、『筵』もこのJIS90字形がちゃんと出せるの?」
 「それは間違いありません」
 「でも、Windows8のMS-IMEで出る二つの『筵』は、どちらもJIS2004字形だったよね。IVSだとJIS90が出ないってこと?」

 

■あてはまる「枝番号」なく

 

 ここで、「筵」の字に対して取り決められている、枝番号と字形の関係を見てみましょう。

 ユニコードコンソーシアムが管理する漢字字形データベースでは、「筵」のIVSは以下のように示されています。左端の「7B75」は「筵」という字そのものを表すコードポイント、「E0100」「E0101」「E0102」「E0103」がそれぞれの字形に対応した枝番号です。

 

 

 このように「筵」に対しては、計4個の字形が登録されています。枝番号「E0100」と「E0101」は、DTP用フォントの字形コレクションである「Adobe Japan1」から、「E0102」と「E0103」は、戸籍や住民基本台帳の字を集めた「汎用電子情報交換環境整備プログラム」から、それぞれ入ったものです。

 MS-IMEの変換候補に出てくる「第2の筵」は、「E0101」という枝番号が後ろについていました。ご覧の通り、漢字字形データベースに登録されている「E0101」の字形は、MSフォントのJIS2004と同じスタイルです。一方、「E0102」を見ると、竹かんむりの下が常用漢字の「延」の形になっており、MSフォントのJIS90字形と同じです。

 「じゃあ、E0101じゃなくてE0102を付ければJIS90の形が出てくるってこと?」
 「ところがMSフォントの『筵』にE0102を付けても、残念ながらそうはなりません」

 MSフォントで、「筵」にさまざまな枝番号をつけるとどうなるか、実際に確かめたのが下の図です。


 「全部同じ字形になるのか。要するに『筵』のJIS90字形はIVSでは出てこないってことだね」
 「そういうことですね」
 「でも、『E0102』を後ろにつけてもJIS90の形にならないのはどうして? データベースにはそう登録されているんだから、この枝番号で出るようにフォントを作ればよかったんじゃないの?」
 「前回も触れましたけど、Windows8のMSフォントが使っているのはAdobe Japan1コレクションの枝番号だけで、汎用電子のほうは使っていないんですよ」
 「筵の『E0102』は汎用電子コレクションだから、MSフォントはその枝番号は使わないというわけか」
 「もしAdobe Japan1コレクションにも『E0102』と同じ字形が入っていたら、それを使っていたはずです。しかしたまたま無かったので、IVSでの実装はできなかったということでしょう」
 「そのせいで1字だけ仲間外れか。それなのに、MS-IMEの変換候補に『E0101』つきの筵が出てくるのはなんでかな?」
 「まあ、何らかの行き違いでもあって、対応にズレが生じてしまったのではないでしょうか」

 

 MSフォントに「筵」のJIS90字形がIVSで実装されていない以上、MS-IMEの辞書に「第2の筵」を登録しておく必要はないはず。小さなことではありますが、適当な機会に修正がなされることを期待します。

(比留間直和)