メインメニューをとばして、このページの本文エリアへ

文字

文字@デジタル

1語のために3登録 ― 変換辞書のはなし6

比留間 直和

 前回は変換辞書からいったん離れて「幽霊文字」の話を書きましたが、また変換辞書に戻ります。

 仮名漢字変換ソフトの辞書を新聞記者向けに調整する際に、新しく登録する単語の多くは、「いおきべ→五百旗頭」といった人名・地名や専門用語などで、つまりほとんどが名詞です。

 動詞や形容詞など、活用のある語を登録するケースももちろんあるのですが、そのほとんどは漢字や送り仮名を新聞表記のルールに合わせるためのもので、それほど複雑な作業ではありません。そのため、単語登録と動詞の活用パターンについて深く考えることも無かったのですが、この連載を書いているうちに、「自分では単語登録したことがなく、どう登録すればいいのかもよく知らない活用形式」があることに気づきました。

 さて、それは何だったでしょうか。「ナントカ活用」の一種ですが、ヒントは「ひとつの動詞なのに、いくつも単語登録する必要があるもの」です。

 

■動詞は「変化しない部分」を登録

 

 答えを書く前に、動詞を単語登録するときの一般的な手順について触れておきます。

 動詞はふつう、どの活用形でも変化しない共通の部分を「単語」欄に指定し、品詞を「ラ行五段」などと選んで登録します。

 具体例で見てみましょう。ほとんど死語になっている言葉で恐縮ですが、例えば「あじる」と入力して「アジる」と変換させたい場合は、

 【単語】 アジ
 【読み】 あじ
 【品詞】 ラ行五段
  ※各品詞の具体的呼称はソフトによって様々です。

 というかたちで登録します(五段活用の場合は「語幹」と一致します)。こうすると、「アジらない」「アジります」「アジる」「アジるとき」「アジれば」「アジれ」「アジろう」「アジった」……と、それぞれの活用形で適切に変換できるようになります。

 なお、「アジる」は「アジテーション」の省略形を動詞化したもので「あおる、扇動する」という意味の言葉です。「味」や「鰺」とは関係ありませんので、念のため。

 

 一方、「上一段(かみいちだん)」や「下一段(しもいちだん)」の動詞の場合は、変換ソフトではともに「一段動詞」と扱われます。

 またもや特殊な事例で恐縮ですが、九州などで使われる方言に「(穴が)あく」という意味の「ほげる」という動詞があります(広辞苑にもちゃんと載っています)。この動詞が「ほげる→ホゲる」と変換されるようにしたい場合は、

 【単語】 ホゲ
 【読み】 ほげ
 【品詞】 一段動詞

 というふうに登録すれば、「ホゲない、ホゲます、ホゲる……」がちゃんと出てきます。

 学校で習った口語文法の「未然・連用・終止・連体・仮定・命令」というパターンで言うと、この「ほげる」は「げ-げ-げる-げる-げれ-げろ」の「ガ行下一段活用」で、語幹は「ほ」。しかし変換辞書に登録するときは、どの活用形でも変化しない「ほげ」の部分が単語登録の対象となり、これに「○-○-る-る-れ-ろ」が付く、という扱いになります。

 「上」(イ段)か「下」(エ段)かの区別は単語登録する部分に吸収されてしまうので、品詞としては「一段」に統合されているわけです。

 

■「変化しない部分」が無い動詞は?

 

 ほとんどの動詞は、上述の「五段」「上一段」「下一段」に分類されます。口語の動詞でそれ以外の活用といえば? そう、「サ行変格活用(サ変)」と「カ行変格活用(カ変)」です。サ変は「する」、カ変は「く(来)る」が該当します。

 「未然・連用……」のパターンで言えば、サ変は「し(せ・さ)-し-する-する-すれ-しろ(せよ)」、カ変は「こ-き-くる-くる-くれ-こい」と活用します。動詞全体の形が変わってしまい、先に例示した「あじる」「ほげる」における「あじ」「ほげ」のような「形が変わらない部分」がありません。このような動詞を、ユーザーが単語登録できるのでしょうか。

 

 まずはサ変。主要2製品について、単語登録の際に選べる品詞のリストを見てみると、マイクロソフトの Microsoft Office IME 2010 にはサ変名詞(IME2010の分類では「名詞・さ変形動」と「さ変名詞」の2種類が該当)はあるのですが、「サ変動詞」はそもそも見当たりません。一方、ジャストシステムの ATOK2011の単語登録画面では「サ変名詞」と「サ変動詞」の両方があります。

 両製品にある「サ変名詞」は、「参加」や「援助」のように、単独で名詞としても使われるほか、「~する」が下についてサ変動詞にもなる語です。つまり名詞の一種であり、「する」という動詞の表記に関わるものではありません。

 ATOKに用意されている「サ変動詞」も、想定されているのは「ねっする→熱する」の「熱」、「さっする→察する」の「察」など、やはり「する」の上の部分。単独で名詞になることはない(「ねつ→熱」はあっても「ねっ→熱」という名詞はありません)という点がサ変名詞との違いですが、いずれにせよ「する」という部分のための枠組みではありません。

 国語辞典には「する」の漢字表記として「為る」が掲げられていますが、現代日本語ではほとんどの場合仮名書きされています。サ変動詞「する」そのものについて独自の表記を登録する方法が用意されていなくても、実質的に問題ないということでしょうか。

 

 一方のカ変「くる」はどうでしょう。

 Microsoft Office IME 2010 の単語登録画面で出てくる品詞のリストには、「カ変動詞」も見当たりません。

 Microsoft Office IME 2010
 の単語登録画面

 

 これに対し ATOK2011 は、単語の品詞に「カ変動詞」を選ぶことができます。

 ふつうカ変動詞「くる」に「来る」以外の漢字を当てることはありませんが、ここでは例として旧字体の「來る」に変換するケースを想定して、実際に登録してみましょう。

 カ変動詞で漢字にする部分の読みは「こ」(未然・命令)、「き」(連用)、「く」(終止・連体・仮定)の3通り。これに合わせ、

 【単語】 來
 【読み】 こ
 【品詞】 カ変動詞   
 
 【単語】 來
 【読み】 き
 【品詞】 カ変動詞   
 
 【単語】 來
 【読み】 く
 【品詞】 カ変動詞

 という三つの登録をします。

 すると、

登録した読み活用形変換例
未然形 こない→來ない こず→來ず こよう→來よう
 こられる→來られる こさせる→來させる
命令形 こい→來い
連用形 きます→來ます きづらい→來づらい きた→來た
終止形 くる→來る
連体形 くる→來る(時)
仮定形 くれば→來れば
 くれども→來れども 〔厳密には文語の已然形〕

 というふうに、「こ」「き」「く」で始まる各活用形で変換できるようになります。

 「こ」「き」「く」がそれぞれどの活用形かを指定して登録しているわけではないのですが、「きる」や「こる」で「來る」が出てくるようなことはなく、内部的にそれぞれの読みがどの活用形にあたるかきちんと見分けているようです。試しに「こ」だけで登録すると「こ」で始まる未然形と命令形だけが変換されるようになります。人間にとっては「くる」という一つの動詞でも、変換ソフトは三つの語として処理している、ということでしょう。

 また、カ変動詞「くる」の前に別の語がついた「○○くる」という複合語の場合も、上の例と同じように読みの末尾を「こ」「き」「く」と変えて三つ登録すれば、カ変動詞として変換できるようになります。

        ◇

 冒頭に書いた「自分で単語登録したことがなく、登録方法もよく知らなかった活用形式」とは、このカ変のことです。サ変のほうは「サ変名詞」などでしばしば意識することがあり多少様子が分かっていたのですが、カ変の単語登録を考えることはありませんでしたから。

 とはいえ、カ変「くる」は日常的に漢字(来)が使われており、ほとんど漢字では書かれないサ変「する」に比べれば、単語登録の需要はありそうです。ATOKはこのほか「○行上二段」など文語の活用も選べるようになっており、ヘビーユーザーを意識した構成になっています。

 一つ不満があるとすれば、カ変動詞の登録方法(三つの読みで登録すること)が容易に分からず、たどり着くまでにしばらく試行錯誤を要した、ということでしょうか。

(比留間直和)