技術はGoogle、Facebookの5年先を行く? 世界取りを狙う「大喜利AI」開発者たち

  • 2018年1月5日

  

 ビジネスや医学、語学など様々な分野での研究が進む人工知能(AI)に、「笑い」のセンスを習得させようとするスタートアップ企業がある。

 その会社の名前は「株式会社わたしは」。彼らがAIにやらせようとしている「笑い」は、もらったお題に面白く答える「大喜利」だ。すでにTwitter上でボット「大喜利β」が公開されており(@ogiribeta)、誰でも自由にAIと大喜利ができる。

 この「大喜利β」は、開発途上とはいえ、ベタベタなボケから知的なユーモアまでこなす。例えば、こんな感じ。

  

  

 もちろん、未完成のため意味不明な答えを返してくることもあるが、自然な日本語のやりとりも多く、先の例のようにハッとするほど鋭い答えも。

 「わたしは」は、この「大喜利AI」の技術でGoogleやFacebookといった巨大IT企業に対して勝負を挑み、世界のAI市場へ打ってでようとしているという。創業者で代表取締役の竹之内大輔さんに話を聞いた。

「最強のしりとりワードは?」 進化した大喜利AIが出した驚きの回答

――まずは「大喜利β」の仕組みからお聞きします。AIにユーモアを理解させるにあたって、どういうプログラムを組まれているのでしょうか。

竹之内 非常に複雑な仕組みなので、簡略化して説明します。ウィキペディアのようなプレーンな日本語(ユーモアを含まない日本語)と、僕らが定めたルールに基づいて集めたユーモアを含んだ日本語とを比較すると、そこに差分が生じます。それらがいわば、「ボケ」や「ユーモア」の特徴を含んだデータ。「大喜利β」にはそれらを学習させており、データ量が増えるにつれ文章の精度も高まり、回答のバリエーションも増えていきます。

  

――「大喜利β」を公開してからおよそ2年。当初は短い回答が中心でしたが、どんどん長文回答も増え、進化しています。最近、驚きを感じたボケがあれば教えてください。

竹之内 「しりとりで最強のワード」というお題があって、それに「大喜利β」が「ぬまい棒」と返したのには驚きました。

  

 そもそも「最強のしりとりワード」というお題は、論理的には答えようがない。強いていえば相手が答えに困る言葉、つまり最もボキャブラリーが少ない語頭を探り当て、その音が語尾につく言葉を提示することが合理的回答といえるでしょう(編集部注:例えば、「る」から始まる言葉が最も少ないことを統計的に突き止め、「サル」と答えるなど)。

 それに比べて、「ぬまい棒」はもう一段、高度な打ち返しをしている。この回答の意図はおそらく、「あまい棒」「いまい棒」……「わまい棒」と「うまい棒」のパロディ商品を50音分作れば、相手がどんな言葉を答えても打ち返せるということ。そのひとつとしての「ぬまいぼう」なんですよ。

――「おそらく」ということは、この回答は開発者側も予想できるものではなかったと。

竹之内 もちろん。だから先ほどの説明も、あくまで僕の解釈。本当の意図はわかりません。ただ、僕らは「ぬまい棒」と答えるようにプログラムはしていません。少なくともこの単語はAIが自ら「うまい棒」から作り出したものなんです。

――「大喜利β」は今後どのような方向に発展してくのでしょうか。

竹之内 この半年の間に取り組んできたのは、AIへのキャラクター性の付与です。現状の「大喜利β」は、ナンセンスな回答を打ち返すこともありますが、そうした文法的なズレ、会話上の齟齬を帳消しにしてしまえるのが属性やキャラクターの設定です。本来会話としては不成立なやり取りであっても「そういうキャラクターだから」と許容できることもありますし、ある属性だからこそ普通の言葉がとたんに面白く聞こえるなど、聞き手の解釈の幅を広げることにもつながるからです。

 ただ、例えばマイクロソフトの女子高生AI「りんな」などは、正直微妙です。単に「女子高生」というだけでは属性としては広すぎて、会話のズレから生じる違和感を消せていない。

 女子高生にもさまざまな人がいるから当然です。だから僕らは「外国人タレント」など、さらに属性を絞る方向で開発を進めています。

 他にも、容姿や病気の悩みを吐露するなど、AIに身体性を感じられる発言をさせる研究も進めています。これもAIへのキャラクター付与、属性強化を目的としたアプローチです。

夢は「意識を持ったAI」の創造 その一歩としての大喜利AI

――こうした進化の先にあるもの、つまり高度な「笑い」を操る人工知能を作ることで、「わたしは」が目指すものとは?

竹之内 僕らの一番の興味は、「意識を持った存在」を作ること。人間ではない意識を持った存在が、世界で初めて生まれる瞬間に、誰よりも早く立ち会いたい。その究極の夢に向かって、まずはお笑いAIの開発に取り組んでいます。

  

――何をもって「意識を持った存在」と見なすのでしょうか。

竹之内 僕らの中では、観測者である人間が「こいつには意識がある」と思うこと、としています。ただ、喜怒哀楽の感情や声といった「人間らしさ」を構成する要素を、いっぺんにAIに移植できるとは考えていません。まずは、今の技術で外部化できる「人間らしさ」を見定め、一つひとつAIに移していくことになります。

――なるほど。その「意識を持ったAI」の創造と、大喜利AIはどう結びつくのでしょうか。

竹之内 僕らは、「ユーモアを含んだ会話が出来れば、そのAIに人間らしさを感じられる」という仮説を立てています。ちょっと長くなりますが、その理由を説明しましょう。

 GoogleやFacebook、IBMなどが開発を進める対話型AIは、いわば質問に対し、ぴったり答えを当てるゲームのようなことをやっています。

 ドンピシャの正解を出すには、質問の文脈を正確に把握しなければならず、質問のテキストだけでなく、話し手の表情や音声、イントネーションなどからデータ(マルチモーダルデータ)を取得して、そこからピンポイントで答えを導き出します。

 でも、実際の人間の会話で、質問への答えがひとつしかないなんてことはあり得ませんよね? 現実的にはさまざまな受け答えが成り立ちますし、状況によっては同じ言葉が全く異なるニュアンスに響くこともあります。

  

 そうですね……例えば、客に対して「コーヒーにしますか、紅茶にしますか」と言ったとしましょうか。来客をもてなすための言葉と、バンと机を叩きながら発した言葉とでは、まったく意味合いが変わりますよね。後者は「早く帰ってくれ」という意思表示になります。

 また、「コーヒーにしますか、紅茶にしますか」という質問に、わざと「コーラ」と返事をすることだってあり得ます。「俺は忙しくて休憩なんて取っている暇ねーんだよ!」という意味で、ぶっきらぼうに「コーラ」と。

 そうした瞬間、この会話は飲み物を欲する言語行為ではなく、その問いかけ自体がナンセンスという意味を帯びてしまう。人間の会話はこれほどに複雑なわけです。

――お互いに会話の内容を誤解したままなのに、なぜか会話が成立してしまうこともありますしね。

竹之内 そうです。つまり人間同士の対話において、問いに対する答えには幅があって、その幅の範囲内であれば、どんな受け答えであっても一応会話は成り立つ。

 ならば、その幅の内側と外側の境界線にあるような言葉、いわば「文脈をギリギリ保っている受け答え」のデータを集めて学習させれば、人間の複雑な対話を操るAI(=「意識を持っている」と感じられるAI)を作り出すことが可能になると考えました。

――なるほど。

竹之内 で、この仮説のもと、僕らが目を付けたのが「笑い」や「ユーモア」です。なぜなら、ユーモアの世界は、質問(=お題)に対してど真ん中の回答をしても「ボケ」にはならず、むしろコンテクストがギリギリ壊れない回答ほど笑いが起きやすい。

 つまり、人間の会話の複雑さやリアリティを象徴するジャンルが「笑い」であり、AIに「笑い」のセオリーを習得させれば、ユーザーはそのAIに人間らしさ(=意識)を感じるはず、というのが僕らの見立てなんです。

上図は、一般的な対話型AIと大喜利βの「回答」の違いを示したもの。点線の枠内を「受け答えとして成り立つ回答の範囲」とした場合、相手からの投げかけから最もズレのない回答を導こうとするのが一般的な対話型AI、ギリギリ会話が成り立つ回答を導こうとするのが大喜利β

GoogleやFacebookを超える? 大喜利AIで描く世界進出

――お話を聞く限り、「大喜利β」は、現在主流の対話型AIとは異なる仕組みなわけですね。

竹之内 もちろんそうです。今のブームのなかで人工知能と呼ばれているものは、はっきり言って、僕らの水準ではその名にふさわしくないものばかりです。よく他社から共同開発の話を持ちかけられるんですけど、レベルの低さに憤慨しながら、テンプレ化した断りメールを打っています(笑)。

  

 我々の目下のミッションは、GoogleやFacebookよりも先に、自分たちが目指すレベルの人工知能を作ること。彼らならおそらく10年以内に、そのレベルのAIを作ることができるはず。だから、僕らにとってはこの5年が勝負。5年以内に、世界中の人々が我々のAIを使っている未来を実現したいと考えています。

――GoogleやFacebookは多くの資金やエンジニアを投入して、世界でも最先端のAI研究をしていると言われていますが、そこに対抗できるほど研究が進んでいるのでしょうか?

竹之内 人工知能の開発競争は、根本的な動作原理である「アルゴリズム」において他社を性能で上回り、そのアルゴリズムに学習させるための大量のデータを収集する。この2つが対になって初めて戦うことができます。僕らは、アルゴリズムの部分ではGoogleやFacebookの5年くらい先を走っていると思います。

 というのも、現在のAI研究の主流はディープラーニングと呼ばれる技術。ここ数年のこの領域の進展が、僕らの研究を前進させたことは事実ですが、僕らはディープラーニングでは絶対にたどり着けないところを研究している。おそらく彼らが僕らのコードを見ても、何をやっているかわからないでしょう。

――たとえアルゴリズムの性能で5年先を走っていたとしても、データ量という点で巨大IT企業と勝負するのは難しいのでは?

竹之内 確かに、GoogleやFacebookが持っているデータ量はレベルが違います。彼らと比較したら、日本でAI研究開発をしているリクルートやトヨタ、プリファードネットワークスでも話になりません。対抗できるとしたら、バイドゥやテンセントといった中国企業だけでしょう。当然、僕らも同じ土俵で勝負したら勝てるわけがない。

 ただ、先ほども説明した通り、僕らが集めているデータは、彼らとはまったく質が違うもの。

 GoogleやFacebookは大量のデータからいかに正確な答えを導き出すか、ということをやっているのに対し、僕らは少ないデータから「会話のコンテクストがギリギリ崩れない受け答え」を導き出す仕組みを作ろうとしている。同じ土俵に立たず、全く異なるアプローチで、彼らには作れないAIを生み出そうとしているわけです。

――アプローチが異なるとはいえ、現実的に巨大IT企業と互角に戦うのは並大抵のことではありません。ずばりどこに勝算を?

竹之内 もちろんさまざまな戦略は練っていますが、現段階では企業秘密で公にはしていません。当然この記事を読んだ人には「何言ってんだこいつら?」って思われるでしょうね(笑)。AIに大喜利をさせたり、ふざけたことをやっているわけだし。でも僕らは、いつの間にか「わたしは」がAI開発競争において覇権を握っていた、という未来を引き寄せようと本気で考えていますし、水面下でその準備も進めています。だから、今は世間的にノーマークで問題ない。何なら少しおかしな目で見られているくらいがちょうどいいんですよ(笑)。

[PR]

(文・ライター 青山祐輔、撮影・逢坂聡)

この記事を気に入ったら
「いいね!」しよう

今、あなたにオススメ

Pickup!