メインメニューをとばして、このページの本文エリアへ

文字

文字@デジタル

Win8で味わう「IVS」

比留間 直和

 世間ではあまり話題にならないのですが、Windows8では「1点しんにょうの辻」と「2点しんにょうの辻」の両方がMS-IMEの変換候補に出てきます。

 「どういうこと? 僕の新しいパソコンもWindows8だけど、2点しんにょうの辻しか出てこないよ」
 「初期状態だと1点しんにょうの辻は出てきません。MS-IMEの『プロパティ』で設定をちょっと変える必要があるんです」

 確かに、買ってきたままでは「つじ」で変換してもこんな具合です。

 

 前々回にも登場しましたが、MS-IMEのプロパティで「詳細設定」を押し「変換」タブでさらに「詳細設定」を選ぶと下の画面が現れます。

 

 

 この画面の下半分の「変換文字制限」は、初期状態では上から2番目の「IVS(Ideographic Variation Sequence)を含む文字を制限する」が選択されていますが、一番上の「変換文字制限をしない」を選んで「OK」します。

 この状態で「つじ」と打って変換すると、1点しんにょうの辻も候補に出てきます。

 

 

 「あっ、ほんとだ。『IVSを含む文字』の制限をやめると出てくるってことは、1点の辻は『IVSを含む文字』なの?」
 「はい」
 「で、IVSって何?」
 「細かな字体差を区別するために、枝番号を付けて異体字を表す仕組みです」

 

■後ろに「枝番号」をつけて区別

  

 UnicodeやJIS漢字などの文字コードでは、細かい形の違いは同一視され、同じコードポイントに集約されています。しんにょうの点の数も区別しないことになっており、Unicodeでは「1点しんにょうの辻」も「2点しんにょうの辻」も「8FBB」で表されます。同じコードポイントですから、通常のテキストデータではしんにょうの点の数の違いを表現することはできません。

 しかし現実にはこうした違いを区別したいという需要があり、それに応えるために生み出されたのがUnicodeのIVSです。

 同じ「MS明朝」でも、JIS漢字の2004年改正による字体変更のせいで、XPだと「1点しんにょうの辻」、Vista以降だと「2点しんにょうの辻」になるのはご存じのとおり。Windows8のMS-IMEが出す「2点しんにょうの辻」も文字コードでいうと「8FBB」だけで表されており、これは Vistaや7で出てくる「2点しんにょうの辻」と同じです。

 これに対し、Windows8のIMEで出てくる「1点しんにょうの辻」は、コードでいうと「8FBB E0100」というふうに、後ろに「E0100」が付いています()。異体字を表す枝番号(Variation Selector と呼ばれます)のひとつで、「辻」の場合はこれが付くと1点しんにょうの字体、というふうに決められています。

 ※実際のデータは E0100 ではなく UTF-16のサロゲートペアによる DB40 DD00 ですが、ややこしくなるのでその件は割愛します。

 

 Unicodeで漢字の異体字用の枝番号として用意されているコードは「E0100」から「E01EF」までの240個。これらは枝番号専用であり、独立した文字を表すことはありません。必ず何らかの漢字の後ろに付けて使われます。「どの枝番号がどういう異体字を表すか」は、Unicodeを開発しているユニコードコンソーシアムが管理する漢字字形データベース(Ideographic Variation Database)に登録されています。

 「後ろの枝番号は文字を表すんじゃなくて、直前にある“本体”の形を左右する情報なんだね」
 「そういうことです。ただしIVSに対応していない環境では、この枝番号が独立した文字のように認識され、うしろに空白や四角など余計なものが付いてしまいます。漢字本体のほうもお目当ての異体字にはならず、枝番号がつかないときの形で表示されます」
 「Windows8なら大丈夫だけど、7までだとダメってこと?」
 「実はそう単純ではなくて、8でもアプリケーションがIVSに対応していないとダメなんです。逆に7でも『メモ帳』などは対応済みですが、7に搭載されるMSフォントは未対応なので、IVSに対応したフォントを自分でインストールしないといけません」

 

 Windows8上でも、IVS未対応のアプリケーションだとこんなふうになります。

 IVSに対応していない環境では総じてこんな具合に見えます。相手の環境(OS、アプリケーション、フォント)がはっきり分かっている場合以外は、共有するデータでの使用は避けるべきでしょう。閉じた環境や、手元で印刷する場合などは問題ありません。

 

■JIS90のために実装

 

 「ところでWindows8だと、『辻』以外でしんにょうがつく『近』とか『道』とかも、1点と2点が両方出てくるの?」
 「いや、Windows8の標準の状態ではそうはいきません。IVDには確かに『近』や『道』などの2点しんにょうの字体も登録されて枝番号も決まっているんですが、MSフォントはそれには対応していませんし、MS-IMEの変換辞書にもそういうものは登録されていません」
 「じゃあどういうものなら出てくるんだい?」

 

 今回のMSフォントでIVSによって出せるようになった異体字は、「Vista以前(JIS90)の字体」の一部です。

 Vista以降のMSフォントは、字体を変更したもののうち主な122字について、Opentypeフォントの字体切り替えという手法で、以前の字体も使えるようになっています。このほか、122字を以前の字体に戻したJIS90互換のフォントファイルもVista、7向けに無償提供されました。ただ、字体切り替えは対応アプリケーション(DTPソフトなど)が必須▽フォントファイルを入れ替えるとJIS改正後(JIS2004)の字体が使えなくなる――といった難点がありました。

 Windows8では、IVSという従来とは違う技術でこのJIS90の字体を出せるようにしたわけです。IVSに対応したOSやアプリケーションが普及すれば、プレーンテキストで細かな字体の区別を表すことができるようになります。

 Vistaから字体が変わったものとしてよく知られる「葛」も、変換文字制限を外して「かつらぎし」で変換すると、下のように2種類の「葛城市」が出てきます。2004年に合併してできた奈良県葛城市は、正式には略字体(下がヒ=JIS90の形)ということになっていますから、IVSならお目当ての字体が出せるのです。

 

 

 「なるほど、葛城市の関係者は喜んでるだろうね」
 「でも前回述べたように、『ひだ→飛』は候補に出ないんですよ。『』はVistaからMSフォントにちゃんと入っているのに」
 「ああそうだった。飛市のことは放ってあるのか。なんだかちぐはぐだな」
 「まあそれはともかく、渡辺の辺が何十種類もあるとかっていうのは、IVSそのものとは深く関係しますが、少なくともこのMSフォントだと出てこないんです」
 「IVSについては、とても1回じゃ終わらないね」
 「そうなんですけど、いったいどんな順番で話せばいいのやら……」

 とりあえずは、Windows8標準の環境――MSフォントとMS-IME――ではどうなっているのかなどをチクチクと見ていきます。

(つづく)

(比留間直和)