2014年04月08日

第3回電王戦第4局 手番による勝率の違いとコンピュータ将棋の特徴

既報の通り第4局はツツカナが本格矢倉で森下九段を下し、コンピュータ側が3−1となって勝ち越しを決めました。
序盤〜中盤の入り口までは森下九段がリードしていましたが、そこからツツカナが地力を発揮。
コンピュータが得意とする中盤のねじり合いで差を付けられてしまった印象です。

今回は今までの振り返りと視点を変え、先手後手の勝率について記します。

ここまで電王戦は計10局行われました。
手番だけを抜き出すと、以下のようになっています。

第1回:後手0−1
第2回:先手1−2、後手0−1−1
第2回リベンジマッチ:先手1−0
第3回:先手1−1、後手0−2

トータル:先手3−3、後手0−3−1

参考にする局数は少ないですが、とはいえ見逃せないデータです。
先手が若干有利なのはプロ公式戦で証明されていますが、こと対コンピュータではそれが顕著に出ています。
コンピュータ同士でも先手がかなり有利のようで、電王トーナメントでも先手の勝率の高さが話題になりました。
人間とコンピュータが手を結んだタッグマッチは先手の3−1。ここでも結果がリンクしています。

なんだ将棋は先手が有利なんだ、と言うのは簡単ですが、もう少し踏み込んで考えるとそこにコンピュータ将棋の特徴があります。

コンピュータ将棋は初形で先手+70程度と判定するそうです。
逆に言えば後手は-70と僅かに不利。
淡々とした駒組みが続けばこの差はなかなか埋まりません。
そうこうしているうちに、激しく動くと-70より1点でも評価値が高いという局面があれば、性質上そちらに飛び込みます。

結果としてコンピュータは、先手番の時はじっくり進めて+の評価値を保ち、後手番の時は-の評価値を挽回しようと激しく動くのです。
ツツカナが第2回と第3回で指し回しが全然違い、実力が大きく上がったという表現を見かけることがあります。
勿論成長しているのは事実ですが、上記を考えると実力が大きく上がったと証明するのは難しいと思われます。
ツツカナは第2回は後手番だったので評価値を挽回しようと激しく動きました。
第3回は先手番で、評価値を+で保つためにゆっくり指しました。
どちらもツツカナであり、コンピュータ将棋の特徴です。

激しい局面は評価値のブレが大きいので、点数を間違える可能性が高くなります。20手読んで+100と判断しても、読まなかった21手目で-500になる、という変化は将棋にはよくあります。
なので後手番のコンピュータが突然激しく動いてきた時は、評価値を無理に挽回しようとしています。そこに隙が生まれることはわりとあります。
人間側の3勝のうち、2勝は後手のコンピュータが無理に動いてそこにカウンターを合わせました。
今回の豊島七段は、平凡に指すと評価値を挽回出来ないとみた後手番のコンピュータが定跡外の手を指し、そこをついて勝ち星をあげました。

コンピュータ将棋は1点でも評価値の高い手を選ぶ性質があります。
その性質が先手と後手での指し方の違いを生み出すのです。
手番によってまるで別人のような指し回しを見せるのは人間と違うところで面白いですね。


さて第5局は人間側の先手番。屋敷九段はA級順位戦という舞台で先手番16連勝という記録を持っています。
対するPonanzaは電王トーナメントで、決勝Tを全て後手番で勝ち抜きました。
まさに頂上決戦です!
私も大変楽しみです。皆さんも土曜日をお楽しみに。
屋敷九段−Ponanza戦 対局ページ PV
棋譜中継は日本将棋連盟モバイル


それではまた
posted by 遠山雄亮 at 11:48| Comment(6) | TrackBack(0) | 電王戦 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
電王戦で勝つためには事前の対局を300局はする必要があります。
次回、タブレットPCにすれば事前対局はしやすく棋士が勝ちます。
盤駒を使うと対局を見るというより、棋士が研究する姿を見るようになりイベントとしてどうかと思います。
リターンマッチで森下九段が盤駒を使う対局は見たいです。
Posted by 事前対局 at 2014年04月08日 13:34
関東中年棋士のツイッターは東方中起では
Posted by 迷彩 at 2014年04月08日 15:03
事前の対局が300局必要ってのはあなたの妄想でしょ。
研究したからといって必勝の局面にできるわけではなく、中盤前には微差で未知の局面になってしまうんですよ。

研究に嵌めたのではなく、強くてしかも本番でミスが(ほぼ)なかったからプロがちゃんと勝てたというのがだんだんはっきりしてきているのに、まだまだこういう偏見の人は多いんでしょうねえ。
Posted by ax at 2014年04月08日 15:23
今晩は。

今回のコンピュータの先手・後手の差し回しの解析には、違和感を感じます。
特に、次の部分です。
>後手番のコンピュータが突然激しく動いてきた時は、評価値を無理に挽回しようとしています。

まだ、先手と後手で異なった評価関数を使っているソフトはないと思うので、コンピュータが”評価値を無理に挽回しようと”する事はないと思います。
(そのようには、プログラムされていない。)

ただ、客観的に見て、ソフトがそのように振舞うのであれば(仮説)、それは、将棋の後手番では、((今の)コンピュータの様に)特定の意図を持たずに序盤を進めると”そのような手を選ばないと互角を維持できなくなる”という事を示しており、それはコンピュータ将棋の特徴ではなく、将棋の本質を示している事になるのではないでしょうか。

失礼しました。
Posted by masatsune at 2014年04月09日 02:27
>後手番のコンピュータが突然激しく動いてきた時は、評価値を無理に挽回しようとしています。
これは評価関数ではなく、探索手法によるものでしょうか。開発者によって個性が出そうですね
Posted by 通りすがり at 2014年04月09日 15:08
アラフィフのSEで大学時代にゲームプログラミングの研究を少しだけかじっただけなので時代遅れの認識違いなのかもしれませんが・・。

ご認識の通り、ソフトは「1点でも評価値が高いという局面があれば、性質上そちらに飛び込みます。」と思われます。
となれば、現局面の評価がプラスであろうとマイナスであろうと、「1点でも高い局面を目指す」のは変わらないわけで、現局面がマイナスであるから「無理気味の着手」を選び、プラスであるから「安定的な着手」を選ぶという仮説には違和感を覚えます。
そもそも、シフトは「無理気味」とか「現状維持」なんて概念を持っておらず、「できるだけ先の局面を読んで、数値評価して、一番獲得数値が高い手順を選ぶ」だけなハズで「評価値を無理に挽回」ということはないのではないかと考えます。

現状のソフトには「ハッタリ機能」(正確に対応されたら悪くなることを知っているが、相手が間違えたら高得点を獲得できるような手を選択する機能)は搭載されていないと思います。
ご提示の見解は、「現局面の評価がマイナスのときはハッタリ機能がONになる」というような未来のソフトを指しているよう見えます。
Posted by もっと、おかやまへ at 2014年04月09日 15:30

この記事へのトラックバック