メインメニューをとばして、このページの本文エリアへ

文字

文字@デジタル

続・JIS外漢字のメダリストたち

比留間 直和

 前回はロンドン五輪のメダリストのうち、名前の漢字表記にいわゆる「JIS外字」(JIS X0208=第1・第2水準=にない字)を含んでいる選手たちを挙げてみました。中国、台湾、香港、韓国の4カ国・地域あわせて29人のメダリストが該当し、漢字の異なり数は26字でした。

 国内の大手新聞各社は、五輪の取材のために多くの記者を投入して独自の記事を紙面に載せる一方、試合結果など記録については通信社から配信を受けてそのまま掲載しています。

 五輪やアジア大会の開幕前には、通信社から出場予定選手の一覧が届き、中国など漢字で表記する選手名をあらかじめ確認しておきます。新聞製作システムに常備していない珍しい漢字が突然出てきて慌てることがないようにするためです。なにしろ五輪は数多くの選手名が登場するうえ、たいていは時差があって変則的な工程を組んでいますから、よけいな遅れが生じないよう入念な準備が必要です。

 今回のロンドン五輪でも、開幕の直前、通信社から届いた選手名簿をもとに、どんな字が含まれているか、それぞれの字が自社のシステムに搭載されているか、などを確認。システムに未搭載のものはフォント部門が前もって「作字」をしておいたのでした。

  

■補助漢字+第3・第4水準で多くはカバー

  

 すでにお察しかもしれませんが、前回お見せした「JIS外漢字を含むメダリスト」は、タネを明かせば、開幕直前に上述のような「選手名に含まれる漢字の洗い出し」をしたときのデータを一部再利用したものでした。

 今回は、メダルに届かなかった選手や、補欠参加のため競技には出場しなかった選手も合わせてカウントしてみました。4カ国・地域の代表選手計733人のうち、名前(本国で使う表記ではなく、日本の新聞における表記)にいわゆるJIS外字を含むのは、前回挙げたメダリストを含め、中国57、台湾5、香港6、韓国26の計94選手で、JIS外字の異なり数は63字でした。

 それを一挙に示したのが、下の表です。選手名に登場したJIS外字を軸とし、Unicode(16進表記)の順に並べました。また、それぞれの字が、JIS補助漢字(X0212)、第3・第4水準(X0213)、WindowsのシフトJISにおける機種依存文字に含まれているかどうかも示しました。「補助漢字」「第3・第4」欄は、それぞれの区点(面区点)番号、「SJIS」欄はWindowsのシフトJISコードです。

 選手名のうち、赤字は前回紹介したメダリスト。選手名につけた「※」は、重複掲出を表します。

 

UNICODE漢字補助漢字第3・第4SJIS競技・選手
4EC9   ボート男子・方兵(中国)
4F5F16801-1417 柔道女子・佟文(中国)
4FE017341-1426 ホッケー女子・李紅俠(中国)
501E17552-0160FA77フェンシング男子・朴倞杜(韓国)
558621721-1510FA95体操男子・馮喆、ボート男子・黄喆(以上中国)、ボクシング男子・韓淳喆、ハンドボール男子・白元喆(以上韓国)
59AE25182-0544 陸上女子・高妮(中国)
59DD25321-1580 バドミントン女子・裵延姝※(韓国)
59E325352-0549 陸上女子・鞏立姣(中国)
59F5   バドミントン女子・葉延(香港)
5A5525652-0561 バドミントン女子・鄭韶婕(台湾)
5A5E2566  重量挙げ女子・郭婞淳(台湾)
5A7725711-1585 シンクロ女子・蔣婷婷※、水球女子・孫雅婷(以上中国)、アーチェリー女子・方玉婷(中国)、同・譚雅婷(台湾)、
65FC 2-1384 バドミントン女子・金貞、セーリング男子・曺成※、アーチェリー男子・金法(いずれも韓国)
660033851-8512FACE競泳男子・李昀琦※(中国)
661533921-8514FACF卓球男子・許昕(中国)
66BB34611-8538 卓球女子・金暻娥(韓国)
66FA34771-8544FADEセーリング男子・曺成※、柔道男子・曺準好(いずれも韓国)
6C7638691-8653 競泳女子・宋汶岩(中国)
6C8538731-8654 サッカー男子・池東沅(韓国)
6DFC39701-8686FB45自転車男子・張淼(中国)
6F8840691-8715FB4Bレスリング男子・李承澈、金真澈(いずれも韓国)
700541111-8728FB4E競泳女子・陸瀅(中国)
705D41311-8732 セーリング男子・梁灝雋(香港)
708541421-8737FB51サッカー男子・金甫炅(韓国)
70AB41511-8739FB52シンクロ女子・朴炫河、朴炫宣、バドミントン男子・李炫一、高成炫、レスリング男子・金炫雨(いずれも韓国)
715041882-7983 ハンドボール男子・朴賛煐(韓国)
715241891-8754 射撃男子・王煒一、バスケットボール男子・劉煒(いずれも中国)
71C142191-8762FB59ホッケー女子・任燁(中国)
720042301-8766 卓球男子・朱世爀、アーチェリー男子・呉真爀、レスリング男子・金鎮爀(いずれも韓国)
739F43581-8784 射撃女子・余艾玟(台湾)
73A7   射撃女子・羅卿(韓国)
73FA43922-8076 水球女子・楊珺、射撃女子・郭文珺、バレーボール女子・楊珺菁(以上中国)、卓球女子・姜華珺(香港)
7421   バレーボール女子・林孝(韓国)
742644111-8806FB67競泳男子・李昀琦※蔣海琦※(いずれも中国)
742A44141-8808FB68競泳女子・白安琪、バレーボール女子・恵若琪、フェンシング女子・許安琪(いずれも中国)
742C44161-8810 競泳女子・程琬容(台湾)
749044501-8829 重量挙げ女子・周璐璐(中国)
749F44571-8827FB6D射撃女子・李佩璟(中国)
772D46712-8193 体操女子・眭禄(中国)
799548702-8272 近代五種女子・苗禕驊※(中国)
7FFA53361-9035 水球女子・高翺(中国)
82AE55371-9067 バドミントン女子・李雪芮(中国)
835455672-8611 陸上女子・謝荔梅(中国)
84D356942-8660 陸上女子・方綺蓓(香港)
852357221-9122 競泳男子・蔣海琦※、シンクロ女子・蔣婷婷※蔣文文、フェンシング男子・蔣科律(いずれも中国)
855357382-8681FB9Aバドミントン女子・趙蕓蕾(中国)
88F560511-9177FBA2バドミントン女子・裵延姝※(韓国)
8ABD   柔道女子・金永(韓国)
8AF662211-9213FBAAバドミントン男子・諶竜(中国)
90A265841-9263 アーチェリー男子・邢宇(中国)
90C566021-9267 バスケットボール男子・王治郅(中国)
90DD66101-9270 競泳男子・郝運(中国)
912766391-9280FBB9陸上男子・鄧亦峻、競泳女子・鄧穎欣(以上香港)、体操女子・鄧琳琳、新体操女子・鄧森悦、セーリング男子・鄧道坤(以上中国)
923A67531-9308FBC4競泳女子・邱鈺涵、テコンドー女子・呉静鈺(いずれも中国)
9241   レスリング男子・崔圭(韓国)
92EE6846  競泳男子・王鋮湘(中国)
946B69851-9343 競泳女子・辛鑫、バドミントン女子・汪鑫、ボート男子・王鉄鑫(いずれも中国)
96EF70911-9369 競泳女子・邵依雯、卓球女子・劉詩雯、トランポリン女子・何雯娜、バレーボール女子・馬蘊雯(いずれも中国)
975A71211-9375 ボート女子・田靚(中国)
98C872381-9408 バドミントン男子・柴飈(中国)
9A4A73461-9418 近代五種女子・苗禕驊※(中国)
9DD776311-9469 シンクロ女子・劉鷗(中国)
9F9077571-9486 競泳女子・龐佳穎、射撃男子・龐偉(いずれも中国)

 

 なお、表のうち「」の3字は、紙面ではここに示した印刷標準字体(康熙字典体)を使うことになっており、それがJIS第1・第2水準外であるために表に含めてありますが、ニュースサイトなどではそれぞれ第1水準にある略字の「」で代用するのが一般的です。

 

■通信社電で「字解き」になるのは

 

 上に示したように、全63字のうち、補助漢字(X0212)にあるのは56字、第3・第4水準(X0213)にあるのは55字でした。また、WindowsのシフトJISに機種依存文字として含まれているのは19字でした。

 逆に、補助漢字にも第3・第4水準にも入っていないのは、「」の6字でした。いずれも、メダリストの名前には入っていなかった字です。

 

 補助漢字と第3・第4水準について、簡単におさらいしておきましょう。

 JIS補助漢字(X0212)は、国内の情報機器で広く使われている第1・第2水準(X0208)の補助として用いる規格として1990年に制定され、計6067字(漢字は5801字)が収録されました。

 一方、第3・第4水準が作られたのは2000年。補助漢字とは違って、第1・第2水準も含んだ大きな文字コード規格(X0213)の一部という位置づけなので、「第3・第4水準だけ」の規格はありません。2004年の改正で漢字10字が追加され、非漢字を含む第3・第4水準部分の字数は4354字(うち漢字3695字)となりました。

 漢字の選定方法を比べると、補助漢字がさまざまなメーカーや業界の漢字表を基礎資料とし、漢和辞典で確認がとれたものを優先して採録したのに対して、第3・第4水準は電話帳や教科書、国語辞典、新聞などで実際に使われている字を集めた、という違いがあります。両者に重複して入っている漢字も多数ありますが、選定方法の違いを反映して、補助漢字は漢籍などの学術分野に強く、第3・第4水準は国内の小地名など現実社会の需要に強いという特徴があります。

 両者の文字集合はUnicodeにも収録されており、たいていUnicodeベースで利用されています。Windowsに標準搭載されているMSフォントを見ると、Windows98で補助漢字が加わり、さらにVistaで第3・第4水準も搭載されました。つまり現行のMSフォントには、「JIS第1・第2水準」+「補助漢字」+「第3・第4水準」の文字イメージが搭載されています。

 このようにパソコンフォントの基準のひとつになっているほか、報道機関にとっては、より実務的な意味を持っています。国内の大手通信社が記事配信用に使っている文字コード(ベースはUnicode)が、「JIS第1・第2水準」+「補助漢字」+「第3・第4水準」という集合を基本に作られているからです。この範囲に含まれる漢字であればふつうのテキストデータとして送受信されますが、そのほかの漢字だと「〓」(ゲタ)などの記号に置き換えて送信されます。こうした場合、受け手(新聞社や放送局)は、ゲタに添えられた「字解き」(何へんに何、といった字形の説明)を参照して、個別に対応しなければなりません。

 「五輪代表選手の名前に、補助漢字にも第3・第4水準にもない漢字がどれだけあるか」というのは、つまりは「五輪の記録の配信の際に、“ゲタ+字解き”で送られてくるものがどれぐらいあるか」ということを意味しているわけです。

 業界内の技術的な話にすぎない、といってしまえばそれまでですが、「業界標準」の文字集合が実際の需要をどの程度カバーできているのか、新聞社で文字を担当する者としては気になるところです。

 

■新聞によって表記に揺れも

 

 調べたところ、通信社からの配信の際に“ゲタ+字解き”になるものは、今回の選手名では上に挙げた「」の6字にとどまったわけですが、このうちいくつかの字をめぐっては、別の問題がありました。

 

 まず、「」。「しょう」と読み、中国人の姓で使われる字ですが、あまり多くはないようで、日本の新聞に登場する機会はめったにありません。今回の「方兵」も、出場した軽量級ダブルスカルで15位に終わったため、結局紙面には出ませんでした。

 中国の簡体字では「几」は「幾」の省略形で、他の字の一部分になるときも「機→机」のように略されます。簡体字を使わない日本の新聞では、「」でなく「」を使うのが正しいようにも見えますが、中国語では「」が zhang であるのに対し、「」は(めったに使われませんが) ji と読み、「よくつつしむ」「ちかい」を意味する別の字です。

 データの配信元の判断によるものなのか、五輪の記録を伝える一部のサイトではこの選手の名を「僟方兵」と表記しているものが見られますが、もしメダルをとるなどして朝日新聞の紙面に出ていれば、「」ではなく「」と表記していたはずです。(ちなみに「」もいわゆるJIS外字ですが、補助漢字に入っています)

 

 このほか、新聞によって使う漢字が異なったのが「」。辞書を引くと「珍」に同じ、と載っています。この字が名前に含まれるのは、レスリングのグレコローマン55キロ級で入賞した韓国の「崔圭」ですが、この選手名には「」でなく「」を当てた新聞も少なからずありました。ハングルで書くとどちらも「」。通信社によって漢字表記が分かれたようです。

 一般に、韓国人名の漢字表記は特定するのが難しいケースがあります。北朝鮮が公式には漢字を廃止していることはよく知られていますが、韓国でも日常的にはあまり漢字が使われておらず、若者の中には自分の名前を(漢字表記があっても)漢字で書くのが苦手な人さえいます。

 仮に、本人も漢字をほとんど使っていないのだとすれば、日本の新聞が読者になじみの無い字を用意してまでその人名を漢字で書くのが適切なのだろうか、などとつい考えてしまいます。

 

 多くの国のさまざまな人名が短期間に大量に紙面に出ることが、新聞報道にとっての五輪の特徴のひとつ。ふだんとは少し違う角度から、漢字のありかたについて思いを巡らす機会でもありました。

(比留間直和)