• このエントリーをはてなブックマークに追加
広告特集 企画・制作 朝日新聞社メディアビジネス局

ニッポン、グローバル人材のリアル

人に寄り添う“和のAI”
NTTグループが「corevo」で見据える未来予想図

AI(人工知能)を取り巻く技術は飛躍的に進歩し、今や「第3次AIブーム」とされている。日常生活でも“AI”をうたったサービスや機能を見る機会が増えた。

機械学習の進歩、ディープラーニング(深層学習)の登場によって、一部の分野ではAIの能力がヒトを上回ろうとしている。囲碁や将棋のプロを立て続けに負かし、小説の執筆などクリエーティブとされる分野にも進出した。

AIは人間を超えていく存在なのか。一人ひとりがどのようにAIと向き合うべきかについて、考えるべき時代が迫っているのかもしれない。

「人間の活動を支援したり、人間の能力を補完して引き出す技術」と、AIの意義を明確に打ち出したのが、日本のITを代表する企業、NTTグループだ。2016年にAI関連技術群を「corevo(コレボ)」というブランドで統一し、様々なパートナーとコラボレーションして社会実装に向けての取り組みを始めた。

ヒトと調和して共創を目指し、外部のパートナーと連携するcorevoは、世界に向けて日本の技術の個性や強みを主張しようとしている。“和のAI”が、未来にどのような価値を生みだしていくのか。メディアインテリジェンス研究所の八木貴史さんに話を聞いた。

日本電信電話株式会社(NTT)
NTTメディアインテリジェンス研究所 企画部長/主幹研究員
八木貴史さん
1992年入社。NTTグループの研究所や企業で、遠隔協調作業支援システム、VRを用いた遠隔地とのコミュニケーション技術、ライフログなどの研究・開発に携わってきた。2016年から現職。知識メディア処理技術に関するプロジェクトマネージャーとして、「corevo」のエージェントAIの研究開発などを行う。専門分野はAI、HCI(ヒューマン・コンピュータ・インタラクション)。

コラボレーションを通じて革新を起こすAI

――今回はcorevoについてのお話を伺います。NTTとしてどんな組織体制でAIの研究開発に取り組んでるのですか?

corevoは、NTTグループの共通ブランドという形で立ち上げました。持株会社の研究所についていえば、10の研究所と2のセンターの半数以上が関わっており、グループ全体で相当な人数になると思います。研究している領域の一部がAIと関わっている場合もあり、正確な数は把握しにくいのですが、私の所属するメディアインテリジェンス研究所だと、160人の組織のうち約9割がcorevoに携わっています。

――AIの研究は従来から進んでいたと思います。corevoというブランドとして集約した経緯は?

AIという言葉が生まれて約60年と言われており、NTTのAI関連研究も40年以上前に始まりました。今回の「第3次AIブーム」は、学術面だけでなく産業面からのブームになっており、世の中の関心が高まっています。そこで、我々が脈々と研究してきた技術の蓄積を、社会にアピールしてその価値を問い直していきたい、という思いから、corevoを立ち上げることになりました。それに加えて、積み重ねてきた研究が、ようやく本格的なサービスとして世に出せるレベルに達したというのも大きいですね。

――corevoという名前には、コラボレーションを通じて革新を起こす(co-revolution)という意味が込められているとお聞きしました。外部とのコラボに主眼を置いている理由は何ですか?

理由は2つあると考えています。一つは、実際に技術をサービスにしていく際に、その業種やフィールドを知っている人たちと組んで最適化していかなければ、うまく社会実装できないという点があります。もう一つは、パートナーは実際に市場やエンドユーザーを抱えていますから、立ち上げたサービスを効率的に届けられます。これだけ技術の進展が速い時代ですから、サービスも速く展開するためには、自分たちで最初から立ち上げるよりは、フィールドを持っているパートナーと組むというのが必須になってきていると思います。

――「共創」という考え方ですね。

パートナーのお客様が現在困っていることや実現できていないことを、我々の技術で一緒に解決できれば、と思います。そして、我々の技術自体も高まれば、それを他の領域に水平展開していくこともできます。

コラボレーションによって多くの価値が生み出される様子を表現したロゴ

――NTTグループはAIのどういう分野で強みを持っていますか?

我々は元々、電話事業をやってましたから、音響の処理や音声認識に関する研究開発の蓄積は非常に大きいです。音声認識に関しては、2015年に開催されたCHiME-3という技術評価国際イベントで世界1位の精度を達成しています。そのようなヒトと機械がやりとりするヒューマンインターフェース技術については、大きな強みを持っていると考えています。

人間の感情や深層心理にも迫る技術

――corevoの具体的な技術を紹介していただきます。個々の要素技術は、どのような領域で分類されていますか?

エージェントAI(Agent-AI)、ハートタッチングAI(Heart-Touching-AI)、アンビエントAI(Ambient-AI)、ネットワークAI(Network-AI)という、4種類の方向性でAIを位置付けています。

corevoを構成する、4つの方向性のAI

――まずは、「エージェントAI」について教えてください。

エージェントAIは、ヒトの発する言葉や表情を理解して、対話をするようなAIです。研究の一部が既に、具体的なサービスとして実用化されています。先行しているのがコンタクトセンター等でお客様との通話を録音し、音声認識技術を使ってテキスト化して分析するシステムです。それにより、問い合わせやクレームの傾向を分析して、応対やサービスの品質を高めることができるようになります。最近では、怒りや満足といった感情を対話音声から抽出する技術の開発も進められています。

――感情もわかるんですか! 将来はAIとの高度な対話ができそうですね。

声の特徴だけでなく、対話のリズムや言葉遣いを用いることで様々な感情の抽出を実現します。お客様の状態を判定して、それをリアルタイムで提示することもできるようになります。また、雑談対話技術の研究開発が進んでいます。人間の会話のかなりの部分は雑談が占めると言われているので、AIが雑談をできるようになると、ヒトとのコミュニケーションは豊かなものになるでは、と思っています。

――「ハートタッチングAI」も、人間に関連しているのですか?

エージェントAIがヒトの表面に現れる感情や意図を理解するのに対して、ハートタッチングAIは、表に現れない深層心理や本音に迫っていくAIになります。例えば、マイクロサッカードと呼ばれる眼球の微細な運動を観測すると、好きな音楽を聴いている時とそうでない音楽を聴いているときでは、眼の動きが異なるそうです。ほかにも、ウエアラブルデバイスを使って心拍数などの生体情報を計測したりして、その人がどういう状態にあるかということが判別できる可能性があります。

――先ほどのコンタクトセンターの話だと、テレビ電話などを使ってエージェントAIとハートタッチングAIを組み合わせれば、さらにコミュニケーションの精度は高まりそうですね。

お客様の表情などを映すことができれば、AIが担当者を支援する事も可能だと思います。ただこれは、お客様に許可していただけることが必須です。応対の質が良くなるなどのメリットを映される側に訴求できるようになれば、実現する時も来るのではないでしょうか。

AI同士のネットワークで最適化を目指す

――「アンビエントAI」は、ヒトを取り巻く環境、という意味でしょうか?

ヒトも若干は含みますけども、機械やモノ、環境が中心になります。それらの情報をセンシングして集めたデータを活用することによって、近未来を予測して制御するのが、アンビエントAIです。最近ではIoT(Internet of Things:モノのインターネット)で様々な場所から大量のデータが集められますので、その情報を分析するという意味では“IoTの頭脳”という捉え方もできますね。

――タクシーの乗車需要を予測してドライバーを支援する技術は、実証実験が進んでいるそうですね。

人流(ヒトの流れ)を予測して、混雑を回避するように誘導する技術にも取り組んでいます。他の例だと、NTTグループが走らせている自社の車を使って、データを集めて分析することにも取り組んでいます。NTTが全国に相当な数のマンホールを持っており、道路にあるマンホールが摩耗すると、車がスリップするなどの危険があります。これをヒトの手で定期的にチェックしているのですが、車を走らせるだけでマンホールの画像を集めることができ、異常を検知することが可能になります。

――最後の「ネットワークAI」とは、どのようなAIですか?

ネットワークAIは、2つの意味で使われています。一つは、まさにネットワークにAIを使って、トラフィックを分析したり機器の異常を検知することによって、安定したネットワークを提供しようという技術です。もう一つは、複数のAIをネットワーク化して、それを最適化させようというものです。例えば、車がネットにつながるコネクテッドカーの時代になれば、1台1台の車にAIが搭載された場合に、行きたい方向などがAI同士で矛盾してしまうかもしれません。個別最適だと矛盾する可能性があるので、ネットワーク化することで全体最適を目指す、という発想になります。

――いろいろ面白い技術がありそうですね。最近の話題になっている研究は?

ハートタッチングAI系で「スポーツ脳科学プロジェクト」が始まっています。逆上がりだったり、自転車に乗ることだったり、そのコツって言葉ではなかなか説明できないですよね。運動のコツの要素を解明することによって、それを人間にフィードバックして、スポーツの上達を支援しようという研究です。

――変わった取り組みでは、どんなものがありますか?

ドワンゴさんとコラボしている研究で、あるアニメのキャラクターを、対話できるように最適化しようというプロジェクトがあります。ユーザーがそのキャラになりきって「こう答えるはずだ」という回答をみんなで最適化して、いろんな対話が可能になるのを目指すものです。

ヒトを超えるのではなく、ヒトに寄り添う

――corevoのAIに対する姿勢は、ヒトをサポートするものだと思います。一方で、従来のAIは、ヒトの知性や思考を模倣して、ヒトと対峙(たいじ)する、というイメージが根強い気もします。

我々としては、そのイメージを覆していきたいですね。人間に寄り添って支援し、それによって人間の能力を補強して拡張していくというのが、corevoが提供するAI技術です。NTTグループの目指すAIは、IA(Intelligence Amplification:人間の知能の増幅)という考え方に近いと思います。

――チェスや囲碁に続いて、今年5月には将棋の佐藤天彦名人がAIに敗れたのが話題になりました。

こんな話があります。チェスの世界チャンピオンがコンピュータに負けてしばらく後に、フリースタイルの大会があったそうです。人間、コンピュータ、人間とコンピュータの組み合わせ、どの形式で参加しても良くて、当時のナンバーワンと言われるコンピュータも参加していました。優勝したのは人間とコンピュータの組み合わせだと聞いて、重要なのは、ヒトがコンピュータといかにうまく付き合っていくかということだと思いました。

――「人間+コンピュータ」「人間+AI」が最も強かったのですね。

それでも「今はAIの方が強い」という見方もあるかもしれないですが(笑)。我々は、AIがヒトとうまく付き合っていけるように、気軽にAIとのコミュニケーションが取れるインターフェースの開発も進めています。

――AIが人間と敵対するというイメージは、海外のSFなどの影響でしょうか?

日本では、AIやロボットと言えば、「ドラえもん」や「鉄腕アトム」のイメージで、どちらかというと親しみがあります。アメリカでは「ターミネーター」のようにヒトと対立構造にあったりするのは、文化的な背景の違いに起因するとも言われています。そういう理由だからなのかはわかりませんが、AI技術にあえて「AI」という言葉を使っていないグローバル企業もありますね。

――ヒトと共存・共創していくのが、日本のAIの強みかと。

他の企業や研究者に怒られるかもしれないので、「日本のAI」とは言い難いですね(笑)。でも、NTTグループが目指すのは、日本らしい考え方のAI。ヒトを超えるのではなく、ヒトに寄り添うAIです。

グローバル時代の人間の、心の距離を近づけたい

――八木さんご本人はどのような専門領域で研究してこられましたか?

基本的には、ヒトとヒトのコミュニケーションをどうやって支援するか、という領域に携わってきました。20数年前に取り組んでいたのが、映像を使ってワークスペースを共有する技術の実用化です。普段使っている紙やペンがそのまま使えて、机の上の作業する空間を遠隔地でもシェアできるというもので、実はそのコンセプトに魅力を感じたのが、私が入社した理由の一つでもあるんです。当時の回線はISDNで、送れる画像も今と比べると小さい容量でしたが、商品化したものは展示施設や科学館などで使っていただきました。

――NTTグループの研究開発の環境について教えてください。

やはり世界の最先端の研究者が集まっている組織だと思います。我々がやっているメディア処理の研究もあれば、データ分析、ネットワーク、セキュリティなどの多方面で、最先端の研究をしている人がたくさんいます。彼らとディスカッションして、それを吸収しながら自分も成長できるというのは魅力です。

――研究者にとってのモチベーションは?

企業の研究所というと、事業への貢献ばかりを求められると思われがちです。NTTグループでは、研究そのものも大切にしていて、事業と研究の両輪で動いているという印象があります。研究をしっかりやりたい人、ビジネス寄りに仕事をしたい人、研究から実用化までの一連の流れに携わりたい人、それぞれ自分の志向に合わせた選択肢があるというのは大きいかなと思います。

――やはり世界を意識していますか?

海外留学や国際会議への発表を含め、国外からも研究者を招くなど、海外の人たちとディスカッションしながら研究開発ができる環境が、NTTグループの研究所にはあります。日本で一番というだけではダメなので、全てを世界基準で考えなければいけない。そういう意味では、初めからみんながグローバルを意識して研究開発をやっています。

――将来的にAIでこんなことを実現したい、という夢はありますか?

グローバル化が進んで、地球の裏側にもすぐに行くことができたり、テレビ電話で会話したりして、世界の物理的な距離は縮まっています。その一方では、分断化が進んでいるような状況で、ヒトの心と心の距離は必ずしも近づいていないのかな、と思います。そこで、AIがヒトとヒトのコミュニケーションをうまく支援できないかと考えています。

――世界平和とまでは行かなくても、ヒトとヒトが理解しあうのにAIが貢献できたら、本当に素晴らしいことだと思います。

以前に、ライフログ(生活をデジタルなデータに残すこと)の研究をしていました。その時に気付いたのが、自分の経験を伝える際に、相手の経験で例えてあげると伝わりやすいということです。ただ、全く違う異文化だと、相手の経験に置き換えるというのは非常に難しい。まだ現実的とは言えないのですけど、そこにAIがうまく機能できるようになれば、コミュニケーションが円滑に進むはずです。AIでヒトの心の距離を近づけることができたら、と思いますね。

Topics

corevo(コレボ)

「corevo」のAI関連技術は、さまざまな場面で実用化され、日々進化を続けている。消費者が実感しやすい例では、NTTドコモがスマートフォンなどに展開している「しゃべってコンシェル」は、2018年に「AIエージェントサービス」として機能を拡張する予定だ。

外部企業や研究機関、自治体などとのコラボレーションにより、どのような革新が生み出されるのだろうか。社会的課題を解決し、ヒトの持つ可能性を広げるAIは、国内外から注目を集めている。

corevo(コレボ)詳細はこちら
TOP