現在位置:
  1. asahi.com
  2. エンタメ
  3. 囲碁
  4. トピックス
  5. 記事

でるかコンピューター名人 囲碁に確率重視の「モンテカルロ法」

2009年4月8日

印刷

ソーシャルブックマーク このエントリをはてなブックマークに追加 このエントリをYahoo!ブックマークに登録 このエントリをdel.icio.usに登録 このエントリをlivedoorクリップに登録 このエントリをBuzzurlに登録

図拡大  

 人間に勝つのは、はるか未来の話と思われてきたコンピューター囲碁の世界が、画期的なプログラムの登場で大変革期を迎えている。確率(勝率)を重視した「モンテカルロ法」の採用で棋力が急上昇。「将棋よりも先に、囲碁の名人がコンピューターに敗れるかも」と大胆な予想をするプログラマーもいる。

●すでに「アマ三段以上」

 06年にイタリアで開催されたコンピューター・オリンピアードで、モンテカルロ法を使ったフランスのプログラム「CrazyStone」が優勝(9路盤部門)し、コンピューター囲碁界に衝撃を与えた。19路盤でも「世界最強」の呼び声は高く、東京で開かれているコンピューター大会UEC杯で、07、08年に連続優勝。昨年は青葉かおり四段に7子局で完勝し、解説にあたった鄭銘●(●は王へんに皇)九段は「アマ三段以上はあるかも」と絶賛した。

 従来のプログラムは「一間トビ」「ケイマ」などの「知識」を大量に覚えさせるのが一般的だった。1960年代の開発初期以降、プログラマーたちの努力で棋力は向上したが、級位者のレベルは脱していなかった。

 主なゲームの考え得る局面数はオセロ=10の60乗、チェス=10の120乗、将棋=10の220乗、囲碁=10の360乗といわれる。囲碁は最も変化が多くすべてを調べるのは不可能。また、将棋では飛車10点、歩1点などと駒を点数化して評価に役立てているが、囲碁は石に役割の差はなく、局面によって価値は頻繁に変動するため難しい。

 そんな状況を一変させたのがモンテカルロ法だ。乱数を用い確率的な立場から数学を解こうという考え方で、名称はカジノで有名なモナコの地名に由来する。ランダムに膨大な終局図を作らせ(プレーアウト)、その結果から最も勝ちやすい手を選ぶことで強いプログラムを生んだ。コンピュータ囲碁フォーラム理事で、電気通信大情報工学科の伊藤毅志助教は「数十年にもわたるプログラマーの血と汗のにじむ方法が、駆逐されるほどのインパクトでした」と語る。

 この仕組みを単純化したのが図だ。ある局面で仮に黒に三つの有力な候補手があるとする。各ケースについて、次の白から終局までをプレーアウトさせ、勝率の高い手は、さらに白の応手(仮に2手)に対してプレーアウトさせていく。プレーアウトは1秒間に1万回程度。科学技術振興機構の研究員美添一樹さんは「プレーアウトするコンピューターの実力はアマ20級程度で構いません。20級も300万人集まれば有段者。数多く、しかも有望な候補手について重点的にプレーアウトできれば、いい手を選べます」という。

●将棋の前に名人破る?

 トップクラスのプログラマーとして知られる山下宏さんは、20代半ばから取り組んだ「知識」重視のプログラミングをあきらめ、07年にモンテカルロ法に移行させた。「12年間やっても勝てなかった別のプログラムをたった4カ月で超えた。ショックでした」と語る。

 モンテカルロ法では(1)大差で勝っている時は緩んで半目勝ちをめざす(2)確率で決めるため常に最善手を選ぶとは限らず、詰碁や攻め合いなどの一本道の読みに弱い、という傾向がある。(1)は差は狭まっても危険のない手が高勝率になるからだ。なお半目勝負では正確なヨセを披露し、大劣勢時は相手のミスに期待する無謀な手を打つクセがある。(2)について山下さんは「正解手順が一つの時は苦手。将棋は終盤に勝敗に直結する詰将棋が頻出するので、モンテカルロ法は有効ではないと思う」。

 コンピューター将棋は現在アマ六段クラスとされ、昨年、アマのタイトル者に勝った。一流棋士に勝つのは2014〜15年との調査結果があるが、「モンテカルロ法によって、もしかしたら将棋よりも先に、囲碁の名人がコンピューターに敗れるかもしれない」と山下さん。チェスとオセロは97年に世界王者がコンピューターに敗れている。

 伊藤助教は「モンテカルロ法は作り手に囲碁の専門的な知識がほとんどいらず、研究の敷居が下がった。まだまだ改良の余地があり、あと1、2年は強くなると予測できます。その先は見えず、研究者によって見解はまちまちです」と話している。(伊藤衆生)

検索フォーム
キーワード:


朝日新聞購読のご案内