2024-09-01から1ヶ月間の記事一覧

麻雀の強化学習をする その3(役を学習する編)

前回、ローカルのデスクトップPCで学習を回してShangenAgentに勝ち越すところまで学習できたが、実際に局面を見てみると役のなくなる鳴きが多かったため、これを改善できるかどうかを試した。 方針 特徴量の追加 前回のモデルで入力に含めていた手牌の情報は…

麻雀の強化学習をする その2(ShantenAgentに勝ってビジュアライズする編)

前回強化学習の仕組みを作って実際に学習を回してみたところ、Mjxに実装されているShantenAgentと同等の強さまで学習することができた。 ShantenAgentはロン、ツモ、立直ができるときは必ず行うが、それ以外の副露はランダム、牌を切るときはシャンテン数が…

麻雀の強化学習をする その1(強化学習の仕組みを作る編)

気づいたらこのブログにCTFのことしか書いてないので本業っぽいこともやっていきたいと思い、面白そうなコンテストを探していたら RiichiLab-Mahjong AI Competitionというのを見つけたので、麻雀の強化学習を試してみることにした。 まずは手元で色々試して…