|
2021/06/24(木)
振り飛車党のジレンマ(文責:N川)
|
|
|
将棋のプレイヤーは序盤における戦法選択の傾向によって2種類の属性に分類されます. 皆様ご存じのこととは思いますが, 居飛車党と振り飛車党のことです. 本稿では後者の振り飛車党に注目し, 序盤において戦法がどのように決定されるのかを簡単なゲーム理論のモデルを用いて分析していきます. また, この文章についての免責事項を以下に挙げておきます. 以下の免責事項を踏まえ, かつ膨大な暇を有し, つまらない文章を読んでも笑って許すくらいの器量を持っている方のみこの文章をお読みください. ・本稿での分析は将棋が内包する複雑な部分を捨象した簡単なモデルを用いた分析です. ・筆者のゲーム理論に関する知識は学部生レベルのものであり, 高度な分析は無く, 理論的な誤りが含まれている可能性があります. ・本来ゼロサムゲームである将棋を非ゼロサムゲームの枠組で分析しているためモデルの随所に不自然な点があります. ・筆者はこのモデルの正当性を主張するつもりはありません.
振り飛車党と一口に言っても, 一枚岩ではありません. ここでは, 2種類の属性を想定します. まず想定されるのは, 純粋振り飛車党です. これに属するプレイヤーは相手の戦法に関わらず常に振り飛車を選択します. 振り飛車党と言えば, このようなプレイヤーを思い浮かべる方が多いかもしれませんが, 本稿ではこのタイプのプレイヤーについての分析は行いません. なぜなら, このタイプのプレイヤーは常に振り飛車を選択するため, 戦法選択に関して戦略的要素が存在しないからです. 本稿で取り扱うのは, 混合振り飛車党, つまり相手が居飛車を選択するか振り飛車を選択するかによって, 自分の戦法選択が変化するようなプレイヤーです. 本稿では, 相手が振り飛車なら居飛車, 相手が居飛車なら振り飛車を選択したいと考えるような混合振り飛車党について分析を行います. このような限定をして分析を行う理由はこのようなプレイヤーが割合として混合振り飛車党の多くを占めているという筆者の経験的な感覚によります. 簡便のため, このようなプレイヤーに対抗形党という名前を与えておきます. では, 上で想定したようなプレイヤーを具体的に定義して, 簡単なモデルに基づいて分析をしてみましょう. まず, このタイプのプレイヤーは相手が振り飛車で自分が居飛車という状況を最も好ましいと考えます. また2番目に望ましい状況は自分が振り飛車を指すという状況です(相手が居飛車であっても振り飛車であっても望ましさは変わらない). 最後に, 最も望ましくない状況は, 相手が居飛車で自分も居飛車という状況です. 以上は全て仮定に過ぎません. 実際にそうであると主張しているわけではないということはご理解ください. このようなセットアップのもと, このプレイヤーの具体的な利得関数(payoff function)を特定化します. u(居, 振)=1, u(居, 居)=-2, u(振, 振)=0, u(振, 居)=0 (居, 振)というのは, 自分が居飛車で相手が振り飛車という状況を意味しており, u(居, 振)=1は自分が居飛車で相手が振り飛車という状況で得られる利得が1であるということを意味しています. このような特定化のもと, まずは見ず知らずの人との対局を考察してみましょう. 見ず知らずというのは, 相手が指す戦法についての予想が全くできないということです. ゆえに, 居飛車を指す確率が1/2, 振り飛車を指す確率が1/2であると予想することはある程度妥当でしょう. この仮定のもと, 居飛車を選択した場合と振り飛車を選択した場合の期待利得(expected payoff)をそれぞれ計算します. 期待利得とは, 名前通り利得の期待値のことです. 居飛車を選択した場合の期待利得: 1/2×(-2)+1/2×1=-1/2 振り飛車を選択した場合の期待利得: 1/2×0+1/2×0=0 この場合, 振り飛車を選択した方が期待利得が高くなります. 要するに, 相手の指す戦法が全くわからない場合は振り飛車を選んでおくのが賢明であるということです. では, 対抗形党同士の対局において, お互いがお互いに対抗形党であることを知っている場合を考えてみましょう. 先手のプレイヤーをF, 後手のプレイヤーをSとして, 利得関数を書き直します. u_F(居, 振)=1, u_F(居, 居)=-2, u=_F(振, 振)=0, u_F(振, 居)=0 u_S(居, 振)=0, u_S(居, 居)=-2, u=_S(振, 振)=0, u_S(振, 居)=1 この場合, 括弧内の第1項がプレイヤーFの戦略, 第2項がプレイヤーSの戦略です. また, u_F(・)はFの利得関数を, u_S(・)はSの利得関数を表します. このような状況ではどのような結果が実現するのでしょうか. 詳細は省略しますが, (居, 振)と(振, 居)がナッシュ均衡(Nash equilibrium)であることがわかります. ナッシュ均衡の定義や求め方などはわかりやすく説明する自信がないため, 説明は割愛します. ナッシュ均衡は求まりましたが, 解が2つ出てきてしまいました. ナッシュ均衡は常に唯一というわけではないので, こういうことはしばしばあります. このような時に問題になるのが, どちらの均衡の方がもっともらしいかということです. そして実は, この場合, (振, 居)という均衡は不適切な均衡であり, (居, 振)が適切な均衡です. このように均衡同士に優劣が生じるのはなぜなのでしょうか. それは,今分析していたモデルが将棋の序盤における戦法選択という戦略的状況において重要な要素をモデルに含めていなかったためです. その重要な要素というのはお察しの方もいるように「手番」です. 将棋において, 2人のプレイヤーが同時に戦法を決定するということはなく, 決定には必ず順序があります. つまり, このゲームは同時手番ゲームではなく, 逐次手番ゲームなのです. (続く)
|
|
|