2026年7月2日 木曜日
AI時短ラボ
検証· 約8

ゲームバランスをAIのbotに240回遊ばせて計測した──「深追いの崖」の位置が数字で見えるまで

開発中の深海ローグライクで、バランス調整の判断材料を人力試遊でなくbot自動プレイ12条件×20run=240回の統計で作った。帰還率は3階100%→6階65〜75%→9階0〜15%。「深追いの崖」の正確な位置と、装備が効かない設計ミス、そしてbot計測の限界まで正直に記録する。

編集部で開発中のゲームのバランス調整で、「どこから先が無理な深さか」を人力の試遊ではなく、botの自動プレイ240回の統計で出した。結果、帰還率は3階まで100%、6階で65〜75%、9階で0〜15%と急落し、7階前後に「深追いの崖」があることが数字で特定できた。本記事はその方法と、「この数字を結論にしてはいけない」理由の記録だ。数字はすべて2026年7月3日時点の開発ビルドでの編集部計測による。

3行まとめ

  1. 開発中の深海ローグライク(スクウェア・エニックスのゲームコンテストに応募予定)で、バランスの判断材料をbot自動プレイ12条件×各20run=240回の統計で作った
  2. 帰還率は3階100%→6階65〜75%→9階0〜15%。死亡は7階前後に集中し、報酬の期待値ピークは6階だった
  3. botは全マップ既知で回復アイテムも使わない、人間とは別物のプレイヤー。この数字は判断材料であって結論ではない

前提──「潜って、拾って、浮上」のゲーム

対象は編集部が開発中のターン制ローグライク。詳細は伏せるが、ルールは3行で説明できる。

  • 深海に潜り、フロアでお宝を拾い、自分の判断で浮上すれば拾った分を持ち帰れる
  • 途中で死ねばその潜行の全ロスト。深いほど敵と水圧が強く、報酬も上がる
  • 酸素はターン経過で減り続ける。「いつ引き返すか」の判断がゲームの核だ

つまりバランス調整の最重要問題は「深追いの限界点がどこに来るか」になる。ここを感覚で語らず、数字にしたかった。

どう測ったか──BFS移動のbot×条件マトリクス×シード固定

計測はゲームをheadless(画面なし)で起動し、bot に自動プレイさせるスクリプトで行った。botの移動はBFS(幅優先探索)による最短経路で、フロアのアイテムを拾ってから階段へ向かう。

条件は次のマトリクスで組んだ。

水準
bot能力 A 素手 / B わざ使用(HP半分で回復わざ・酸素低下で酸素回復わざ・隣接敵に攻撃わざ) / C B+装備(出撃時にショップの耐圧服+予備ボンベを購入した想定)
浮上目標 3階 / 6階 / 9階 / 12階
試行数 12条件×各20run=240回

重要なのはシード固定だ。同じ浮上目標ならA/B/Cは同一のマップ系列でプレイするので、「マップ運の差」を排除して条件間だけを比較できる。

結果──壁は7階、わざは崖を1階押し上げる

帰還率のマトリクスがこれだ(各20run)。

bot\浮上目標 3階 6階 9階 12階
A 素手 100% 65% 0% 0%
B わざ 100% 75% 15% 0%
C わざ+装備 100% 75% 0% 5%

読み取れたことは4つある。

①壁は7階前後にある。9階・12階を目指した場合の死亡地点は、全条件で平均6.5〜8.1階に集中した。これは敵が強くなる中域帯の開始階(7階)と一致する。

②わざは壁を約1階押し上げる。わざ使用(B)で6階帰還率は65%→75%、9階は0%→15%。死亡地点も9階目標で平均6.5階→7.3階と約1階深くなった。回復系わざのリソース分が延命に効いた、というのが素直な読みだ(推測)。

③装備の上積みは検出されなかった。B≒Cで、9階ではB15%対C0%と逆転すらしている(20runの統計揺れの範囲と見るのが妥当だろう。これも推測)。理由として有力なのは順番の設計ミスだ。耐圧服の効果は深い階ほど大きくなる設計だが、7階時点では最大HPが26→28の+2にしかならない。効果が本格化する10階以深に、そもそも到達できずに死ぬ。「壁の奥で効く装備」は、壁を越えられないプレイヤーには存在しないのと同じだった。

④期待値のピークは6階。帰還率×帰還時の平均持ち帰り額で期待値を出すと(わざ使用bot基準)、3階≈1069G、6階≈2101G、9階≈587G、12階≈0〜283G。**このbotの腕では「6階まで潜るのが期待値最大、9階以深は大損」**という崖がはっきり出た。人間の腕なら崖の位置は変わるが、「崖が存在する」こと自体は今の商品の形だ。

240回分のログが流れ終わって、9階の欄に0/20が並んだのを見た瞬間のことは書いておきたい。試遊で薄々感じていた「7階あたりからキツい気がする」という手癖の感想が、初めて「死亡平均6.5〜8.1階」という分布になった。感想は反論できるが、分布は調整するしかない。この切り替わりが、計測をやる意味そのものだった。

botの限界──この数字を結論にしないこと

ここが本記事でいちばん大事な章だ。この240回は人間のプレイと決定的に違う。

  • botは全マップ既知。視界も探索も無視して最短移動する。人間の「未知への恐怖」と探索コストはゼロ
  • フロアの全アイテムを必ず拾いに行く。人間の核心スキルである「間引く・引き返す判断」を持たない。酸素の収支は人間より大幅に不利な計測になっている
  • 使わない機能が多い。回復の瓶を飲まない、緊急脱出用の浮き袋を使わない、敵から逃げない
  • 20runの統計揺れは±15〜20ポイント程度ある。前述のB9階15%対C9階0%の逆転が実例だ

総じてこの数字は条件間の相対比較の材料であって、「帰還率65%」という絶対値をそのまま人間の体験と見なしてはいけない。判断材料であって、結論ではない。

正直に書くと、副産物もあった。計測中、botが海流(踏むと1マス流される地形)のあるフロアで「踏み込む→流され戻る→また踏み込む」の無限往復にハマり、その場で700〜1500ターンを浪費して酸素切れで死ぬバグ的挙動が見つかった。回避処理を入れる前の計測では、これだけで6階帰還率が40%まで落ちていた。人間は同じハマり方をしないのでバランスの信号ではないが、「1歩戻される地形は往復コストを静かに倍増させる」という性質の言語化は思わぬ収穫だった。

持ち帰り──個人開発でも「感想でなく分布」で語れる

やったことは、ゲームのロジックを描画から分離し、headlessで回し、条件マトリクス×シード固定で統計を取っただけだ。大手スタジオのQA部隊がなくても、この型は個人開発で再現できる。2日でブラウザゲームを公開した記事と同じで、AIとの開発ではコードを書く速度より「何を計測して何を判断材料にするか」の設計が人間の仕事になっていく。

バランス調整の議論が「なんか難しい気がする」で止まっている個人開発者に、bot240回という選択肢を置いておきたい。

調整はこれからだ。壁の位置や報酬曲線を動かしたら、同じ240回を回して崖がどう動いたかを続編で報告する


出典と但し書き:本文の数字はすべて編集部の開発計測レポート(2026年7月3日・開発ビルドv0.6時点、12条件×20run・シード固定)による。計測はゲーム本体の数値や仕様を一切変更せずに行った。bot計測の限界は本文の通りで、帰還率などの絶対値は人間のプレイ体験を代表しない。ゲームは開発中のため、仕様・数値は今後変わる。

シェア: ポスト はてブ

📎 出典・一次ソース

このニュースの解説動画も作っています

解説動画はYouTube、速報はX(旧Twitter)で毎日更新中。

コメント

まだコメントはありません。最初のコメントを書いてみませんか?

AIについて聞きたいことはありますか?

質問箱で無料で受け付けています。回答は公開され、他の方の参考にもなります。

質問箱を見る →

関連記事