堅牢なメタ対応 Dragapult ex エージェント
要約
最終戦略は、決定論的なルールベースの Dragapult ex エージェントです。方針はシンプルです。Dragapult ex を安定して立てること、単純なダメージ量ではなくサイドレースを軸に判断すること、そして妨害カードは現在の局面を本当に変える時だけ使うことです。
最も強い検証材料は Simulation の結果でした。Team TomTom は観測上の最高順位 #73、スコア 1076.4 に到達し、最終準備時のスナップショットでは #86 / 3243、スコア 1068.8 でした。これらは戦略そのものではなく、戦略が実戦的に機能したことを示す経験的な検証材料として扱っています。
最大の学びは、ローカル検証とライブ環境の挙動が大きくズレることでした。最終ポリシーはあえて保守的です。Dragapult の基本プランを崩さず、繰り返し出た負け筋を狭い修正に変換し、特定の1マッチアップだけに効く過剰なパッチを避けました。
最終エージェント
主軸: Dragapult ex。Dreepy、Drakloak、Budew、Fezandipiti ex、Latias ex、Meowth ex、Rare Candy、Crushing Hammer、Boss's Orders、Crispin、Lillie's Determination、Team Rocket's Watchtower で支えます。
各合法手に対して、エージェントは次を行います。
- 盤面、手札、トラッシュ、利用可能なアタッカー、見えているリソースを読む。
- 可能な範囲で残りリソースを推定する。
- Dragapult ex と Phantom Dive を中心にサイドレースの計画を作る。
- 展開、進化、エネルギー、サポーター、逃げ/入れ替え、Boss 対象、ベンチダメージ、妨害の各モジュールで合法手をスコアリングする。
- 無効・カウンター対象への無駄なダメージや、山札が薄い時の不要なドロー/サーチを避ける。
Dragapult を選んだ理由
検討した方向性は多岐にわたりました。Dragapult のリソース管理型、Lucario、Iono/Bellibolt、Crustle 壁、Abomasnow/Kyogre、同系ミラー調整、target-energy 系、no-Hammer/Boss 系、Hop/Dunsparce、Alakazam/Dunsparce、初期の探索/ルーター案などです。
いくつかはローカルでは有望でした。しかしライブ環境では、壊れやすい変更が厳しく罰せられました。最終 Dragapult 方針が強かった理由は、重要な部分で安定していたからです。
- 欲張ったサポート展開より先に Dragapult ex の成立を優先する。
- 単純なダメージより、Phantom Dive による複数サイドターンを重視する。
- Boss 対象とベンチダメージを一律ルールではなくマッチアップ別に評価する。
- Lucario、Alakazam/Dunsparce、Crustle、Iono/Bellibolt、Abomasnow/Kyogre、ミラー、低HP横並びを別々の脅威として扱う。
- Crushing Hammer、Boss、Unfair Stamp、Watchtower は、現在のサイドプランを進めるか相手の完成アタッカーを止める時だけ高く評価する。
- 1つのスモークテストを改善しても、広く壊れるパッチは採用しない。
アーキテクチャ
| レイヤー | 役割 | 重要性 |
|---|---|---|
| 性能アンカー | 最終 Dragapult ex 方針。観測最高 #73 / 1076.4、準備時スナップショット 1068.8 | 選択した方針の経験的な裏付けになる。 |
| 盤面/リソース解析 | バトル場/ベンチ、手札/トラッシュ枚数、見えているリソース、サイド不確定性、ターンログ、KO/アイテムロック兆候を読む | 盲目的なプレイを避け、展開/逆転局面を認識する。 |
| サイド計画 | バトル場の対象と Phantom Dive のベンチダメージ配分を評価する | ダメージ量ではなくサイドレースを中心にする。 |
| ターゲット評価 | サイド価値、エネルギー、どうぐ、進化段階、HP、既知の脅威を重み付けする | 主要メタに対するマッチアップ知識を入れる。 |
| 展開エンジン | Dreepy、Drakloak、Dragapult ex、Rare Candy、Poffin、サーチラインを進化可能性に応じて評価する | Dragapult の遅れ/不成立という主要負け筋を直接減らす。 |
| サポート抑制 | Budew、Meowth ex、Latias ex、Fezandipiti ex、ドロー/サーチの使用を制御する | 相手がレースしている時の過剰な受け身ターンを防ぐ。 |
| 妨害タイミング | Boss、Crushing Hammer、Unfair Stamp、Watchtower をサイド計画/逆転状況/脅威状態で評価する | 妨害を雑に撃たず、局面に効く時だけ使う。 |
| 安全ガード | 悪いダメージ対象を避け、山札が薄い時のドロー/サーチを制限する | Phantom Dive の無駄打ちとデッキアウトリスクを減らす。 |
開発プロセス
これはニューラルネットの学習ではなく、反復的な戦略エンジン開発でした。
- 候補デッキ/エージェントを作る。
- パッケージ安全性とデッキ合法性を確認する。
- アーカイブ済みの強いエージェント、公開系エージェント、現行候補に対してローカルガントレットを回す。
- 選別した候補だけをライブ評価に出す。
- ライブで弱かった結果を負の証拠として扱う。
- 繰り返し出る負け筋を狭いヒューリスティック変更に変える。
- 再検証し、1マッチアップだけ良くなって全体が悪化する変更は捨てる。
最も重要だったのは抑制です。ローカルで良く見えた変更を、そのまま最終改善とは見なしませんでした。その変更が広い相手に耐えるのか、それとも昨日のローカルテストにだけ刺さったのかを常に確認しました。
ローカルとライブのメタ差
大きな発見の1つは、ローカル性能とライブ性能が大きくズレることでした。ローカルテストはデッキミスや明らかな戦術劣化を見つけるには有効ですが、外部の相手プールを完全には代替できません。
例:
- 同系ミラー調整はローカルでは有望に見えたが、ライブでは 710.9。
- target-energy ロジックは 723.7。
- no-Hammer-Boss は 842.6。
- リソース重視 Dragapult は 959.0 前後まで伸びたが、複雑さが最終 guarded 方針を上回らなかった。
- 最終 Dragapult 方針は、準備時スナップショット 1068.8、観測最高 #73 / 1076.4 で最も強い方向性だった。
このため、評価の問いは「ローカルで何が勝つか」から「変化する外部メタに何が耐えるか」に変わりました。
検証の推移
| フェーズ | 戦略アイデア | 結果 | 学び |
|---|---|---|---|
| 初期の別アーキタイプ | Dragapult 以外の方向性と公開メタ対策 | 低め、または不安定 | 負の証拠とマッチアップ探索として有用。 |
| リソース重視 Dragapult | 見えているリソースと山札枚数の管理を強化 | 959.0 前後 | リソース管理は重要だが、複雑さは堅牢性リスクも増やす。 |
| Dragapult の局所アブレーション | ミラー調整、target-energy、妨害カード調整 | 710.9、723.7、842.6 | 狭いローカル改善は十分に汎化しなかった。 |
| Lucario/Riolu 方針 | 独立した Lucario 系戦略エンジン | 967.6 | 強い補完・メタ探索材料だが、最終トップではない。 |
| 最終 Dragapult 方針 | 保守的な展開、サイド計画、マッチアップ別ターゲット | スナップショット 1068.8、観測最高 #73 / 1076.4 | ライブ証拠、ローカル堅牢性、実装安全性のバランスが最も良い。 |
検討した代替案
| 候補 | 魅力 | 学び | 最終判断 |
|---|---|---|---|
| Lucario/Riolu 方針 | 独立した強いアーキタイプで、Dragapult の弱点に圧力をかけられる | 負けがサイドレース圧力由来か展開不全由来かを切り分ける助けになった | 二次証拠として保持。最終エージェントにはしない。 |
| Dragapult リソース/サーチ型 | リソース推定、サーチ順、妨害枚数、サポートテンポを改善できる | 一部は十分強かったが、複雑さが最終トレードオフを改善しなかった | 有用な規律だけを単純な guarded 方針へ戻す。 |
| ミラー/target-energy/妨害アブレーション | 局所変更で広い方針を上回れるか検証できる | ローカルであり得てもライブでは弱かった | 過学習または不完全な変更として棄却。 |
| 別アーキタイプ探索 | 公開メタ脅威と非 Dragapult の道を調べられる | 相手・アンカー・脅威分類として価値があった | 最終アーキタイプは変えず、ターゲットマップに反映。 |
| Lucario + Dragapult ポートフォリオ分析 | 異なるアーキタイプがメタを補完するか見られる | メタリスク理解には有用だが、単一エージェントの主張ではない | 戦略上の参考としてのみ扱う。 |
失敗から修正への対応表
| 失敗モード | 症状 | 対応 | 判断 |
|---|---|---|---|
| Dragapult の遅れ/展開不足 | Drakloak / Dragapult が遅い、または立たない | 相手がレースしている時は遅いサポート/足止めより進化ラインと盤面安定を優先 | 最終の展開規律に採用。 |
| Lucario 圧力 | Mega Lucario が Dragapult をレースし、弱いサイド計画を咎める | Riolu/Mega Lucario とエネルギー付きアタッカーへのターゲットロジックを追加し、広すぎる補正は避ける | 広い anti-Lucario パッチは baseline 未満だったため棄却。 |
| Crustle 壁 | 壁効果が Phantom Dive の勝ち筋を崩す | Crustle/Dwebble と壁パーツを戦略対象として評価 | ターゲットマップの証拠として採用。危険な大改修はしない。 |
| Alakazam/Dunsparce 圧力 | コントロール/スタールが Dragapult と Lucario の両方を脅かす | 山札枚数とターゲット規律を検証してから採用判断 | 1テストでは効いたが全体信頼性を落としたため棄却。 |
| 過剰対策パッチ | 1つの局所マッチアップは改善するが他を悪化させる | 保守的な堅牢性と負の証拠を優先 | 最終方針の中心原則。 |
| 単一パッケージ制約 | ポートフォリオ分析は安定しても、1エージェントとしては主張できない | メタカバレッジとリスク判断の材料としてのみ使う | 文脈として含め、過大主張しない。 |
Lucario の二次証拠
Lucario/Riolu 方針は最終トップではありませんが、戦略的には有用でした。Dragapult の一部弱点を補い、脅威分類を切り分ける助けになりました。ライブスコア 967.6 は、強い補完・メタ探索材料として十分でした。
Lucario と最終 Dragapult のオフライン比較は 432ゲーム、245-187-0 / 56.7% で安定していました。これは単一エージェントの改善として主張するものではなく、メタカバレッジと提出リスクをどう考えたかの証拠です。
再現性
ローカルの evidence pack には、正確なパッケージ名、ハッシュ、ソース断片、詳細テーブルを監査用に保持しています。本文では、内部ファイル名を前面に出さず、読みやすい戦略説明を優先します。
再現性の基盤は次の通りです。
- 最終選択方針: 決定論的な Dragapult ex ルールベースエージェント。
- ソース: evidence pack 内のエージェント実装と対応するデッキリスト。
- 検証: Python コンパイル、デッキチェック、Docker/ローカルエンジンのガントレット。
- 経験的証拠: ライブのスコア/順位スナップショットと提出履歴。
- ローカル証拠: anchor、expanded-pit、meta-proxy、ablation、failure-analysis テーブル。
結論
最終戦略は、堅牢でメタ対応した Dragapult ex ルールベースエージェントです。強さの源泉は、ライブ結果を観察し、ローカル検証と比較し、ローカルプロキシが外した点を特定し、繰り返し出た負け筋を狭い脅威分類へ変換し、1つの問題だけを解く変更を捨てる、という規律あるプロセスでした。
安定した盤面展開、サイドレース計画、保守的なマッチアップ別ヒューリスティック、そしてローカルとライブのズレへの謙虚さが、壊れやすい複雑さに勝ちました。失敗した提出や棄却したパッチは無駄ではなく、最終方針を形作った証拠でした。