integration-e2e-testing

提供統合テストとエンドツーエンドテストの設計・実装フレームワーク,依据业务价值与用户影响优先级确定测试范围,通过行为驱动验证、属性式测试及可观测性检查确保功能正确性与系统稳定性,支持自动化CI集成。

快捷安装

在终端运行此命令,即可一键安装该 Skill 到您的 Claude 中

npx skills add shinpr/ai-coding-project-boilerplate --skill "integration-e2e-testing"

統合テスト・E2Eテスト設計・実装ルール

References

テスト種別と上限

テスト種別目的スコープ外部依存ファイル形式機能あたり上限実装タイミング
統合in-processでのコンポーネント間連携を検証システムの部分的な統合(in-processモジュール、UIコンポーネントの場合はReact/TSではRTL+MSW)モック または in-process*.int.test.ts最大3件実装と並行して作成
fixture-e2e決定論的フィクスチャを用いてブラウザ上でUIの振る舞いを検証UIフロー全体(モックバックエンド/フィクスチャ駆動の状態)モック/フィクスチャのみ — ライブサービスなし*.fixture-e2e.test.ts最大3件UI機能と並行して作成
service-integration-e2e起動済みのローカルスタックに対してクリティカルユーザージャーニーを検証サービスをまたいだシステム全体ローカルの実サービスまたはスタブ*.service-e2e.test.ts最大1-2件最終フェーズでのみ実行

レーン選択(E2Eのみ):

  • ユーザー向けUIジャーニーのデフォルトレーンは fixture-e2e — 決定論的フィクスチャに対して実ブラウザを動かし、ユニット/統合テストでは捕捉できないバグ(ボタンが動作しない、状態が更新されない、ナビゲーションが壊れる等)を検出でき、インフラ準備なしにCIで実行可能
  • service-integration-e2e は、ジャーニーの正しさが安全にフェイクできない実サービス間の挙動(データ永続化、トランザクション整合性、外部サービスのコントラクト)に依存する場合のみ追加

2つのE2Eレーンの予算は独立して計上される — あるジャーニーに fixture-e2e があっても service-integration-e2e の予算は消費されず、その逆も同様。

クリティカルユーザージャーニー: 収益影響・法的要件・大多数のユーザーが日常的に利用する機能

振る舞い優先の原則

観測可能性チェック(全てYESで対象)

チェック質問NOの場合
観測可能ユーザーが結果を観測できるか?除外
システム文脈複数コンポーネントの統合が必要か?除外
自動化可能CI環境で安定実行できるか?除外

Include/Exclude基準

Include: ビジネスロジック正確性、データ整合性、ユーザー可視機能、エラーハンドリング Exclude: 外部実接続、パフォーマンス指標、実装詳細、UIレイアウト

スケルトン仕様

必須コメント形式

各テストに以下のアノテーションを含めること。

// AC: "[受入条件原文]"
// ROI: [0-100] | ビジネス価値: [0-10] | 頻度: [0-10]
// 振る舞い: [トリガー] → [処理] → [観測可能な結果]
// @category: core-functionality | integration | edge-case | ux | fixture-e2e | service-integration-e2e
// @lane: integration | fixture-e2e | service-integration-e2e
// @dependency: none | [コンポーネント名] | full-ui (mocked backend) | full-system
// @complexity: low | medium | high
// @real-dependency: [コンポーネント名](任意、テスト境界で非モックセットアップが指定された場合)
it.todo('[AC番号]: [テスト名]')

@lane 選択ルール:

  • integration — in-processでのコンポーネント間連携、ブラウザを使用しない(例: React/TSではRTL+MSW、その他言語でも in-process のモジュール/ハンドラ統合)
  • fixture-e2e — モックバックエンド/フィクスチャ駆動の状態に対するブラウザレベルのUI検証。@dependency は通常 full-ui (mocked backend)
  • service-integration-e2e — 起動済みローカルサービスまたはスタブに対するブラウザレベルまたはエンドツーエンドの検証。@dependencyfull-system

Property注釈

// Property: `[検証式]`
// fast-check: fc.property(fc.[arbitrary], (input) => [不変条件])
it.todo('[AC番号]-property: [不変条件記述]')

マルチステップユーザージャーニーの定義

以下の3条件をすべて満たす場合、その機能にはマルチステップユーザージャーニーが含まれる:

  1. 2つ以上の異なるインタラクション境界をユーザーゴール達成のために順番に通過する。何が境界に該当するかはシステムタイプによる:
    • Web: 異なるルート/ページ
    • モバイルネイティブ: 異なる画面/ビュー
    • CLI: 異なるコマンド呼び出しまたは対話型プロンプト
    • API: トランザクションを形成する異なるAPI呼び出し(例: 作成 → 確認 → 確定)
  2. ステップ間で状態が伝搬する — あるステップで生成されたデータや実行されたアクションが、次のステップの受け入れや表示に影響する
  3. ジャーニーに完了ポイントがある — ユーザーまたは呼び出し元が到達する最終状態(例: 確認ページ、保存されたレコード、API成功レスポンス、完了したワークフロー)

ユーザー向け vs サービス内部の分類

マルチステップジャーニーは予約スロット適用判定のために分類される:

分類条件予約スロット適用
ユーザー向け人間のユーザーが直接ステップをトリガーし結果を観察する(UI、CLI、または直接的なAPIインタラクション経由)対象 — デフォルトで fixture-e2e の予約スロットに割り当て。ジャーニーの正しさが実サービス間の挙動に依存する場合のみ service-integration-e2e の予約スロットを追加Web購入フロー、CLIセットアップウィザード、モバイルオンボーディング
サービス内部バックエンドサービスがユーザーの直接操作なしにステップをトリガーする予約スロット対象外 — 統合テストを使用。フルシステム検証が妥当な場合は通常のROI > 50パスを通じた service-integration-e2e は引き続き有効非同期ジョブパイプライン、サービス間saga、スケジュールバッチ処理

この分類は予約スロットルールおよびE2Eギャップチェックに適用される。それ以外の選定はレーンごとのROIルール(後述)に従う。

ROI計算

ROI Score = Business Value × User Frequency + Legal Requirement × 10 + Defect Detection(範囲: 0–120)

ROI Scoreは同一テスト種別内での優先順位付けに使用する(統合テスト同士、E2Eテスト同士)。テスト種別間の比較には使用しない。統合とE2Eの予算は独立して選択されるため、種別間比較は不要。

ROI Scoreが高い = 同一テスト種別内での優先度が高い。正規化やキャッピングは適用しない — 生のスコアをそのままランキングに使用する。重複排除は候補自体を除外する別のステップであり、スコアは変更しない。

レーン別ROI閾値

2つのE2Eレーンは所有コストが大きく異なるため、独立した閾値を使用する。

レーンROI閾値理由
fixture-e2eROI ≥ 20(予約スロット以外)ハーネスが整備されていればコストは統合テストと同等。少数のテストで十分な場合に MAX 3 を低シグナルなテストで埋めてしまうことを避けるためのフロア(基準点)
service-integration-e2eROI > 50(予約スロット以外)作成・実行・保守コストが統合テストの3〜10倍。他の方法では価値を立証できないジャーニーのみに使用

予約スロットのルールはレーンごとに適用され、閾値を上書きする(予約された候補はROIスコアに関わらず出力される)。予約スロット以外でフロアを下回る候補は出力されず、予算は意図的に未消化のまま残し、低価値なテストで埋めない。

ROI計算例

シナリオBVFreqLegalDefectROI Scoreテスト種別選択結果
コア決済UIフロー109true9109fixture-e2e選択(予約スロット: ユーザー向けマルチステップジャーニー、フィクスチャによるブラウザ検証)
実決済サービスへのコア決済109true9109service-integration-e2e選択(実サービスでの正しさ。ROI閾値超過)
Dismissボタンによる UI 状態更新67false850fixture-e2e選択(fixture-e2e 予算3件中ランク2位)
決済エラーメッセージ表示(UI)54false727fixture-e2e選択(fixture-e2e 予算3件中ランク3位)
任意フィルタ切替34false214fixture-e2e不選択(ランク4位、予算上限到達)
実プロバイダへの決済リトライ83false731service-integration-e2eROI閾値未満(31 < 50)、不選択
DB永続化チェック88false872統合選択(3件中ランク1位)
純粋なデータ変換53false419統合選択(3件中ランク2位)

実装ルール

Property-Based Test実装

Property注釈がある場合、fast-checkライブラリ必須:

import fc from 'fast-check'

it('AC2-property: モデル名は常にgemini-3-pro-image-preview', () => {
  fc.assert(
    fc.property(fc.string(), (prompt) => {
      const result = client.generate(prompt)
      return result.model === 'gemini-3-pro-image-preview'
    })
  )
})

必須事項:

  • fc.assert(fc.property(...)) 形式で記述
  • スケルトンの// fast-check:コメントをそのまま実装に反映
  • 失敗ケース発見時は具体的なユニットテストとして追加(リグレッション防止)

振る舞い検証の実装

振る舞い記述の検証レベル:

ステップ種別検証対象
トリガーArrangeで再現API障害 → mockResolvedValue({ ok: false })
処理中間状態または呼び出し関数呼び出し、状態変更
観測可能な結果最終出力の値戻り値、エラーメッセージ、ログ出力

判定基準: 「観測可能な結果」がテスト対象の戻り値またはモックの呼び出し引数として検証されていれば合格

検証項目の決定ルール

スケルトンの状態検証項目の決定方法
// 検証項目: が列挙されている列挙された全項目をexpectで実装
// 検証項目: がない「振る舞い」記述の「観測可能な結果」から導出
両方ある検証項目を優先、振る舞いは補足として使用

統合テストのモック境界

判断基準モック実物
テスト対象の一部か?No → モック可Yes → 実物必須
呼び出しがテストの検証対象か?No → モック可Yes → 実物または検証可能なモック
外部ネットワーク通信か?Yes → モック必須No → 実物推奨

判定フロー:

  1. 外部API(HTTP通信)→ モック必須
  2. テスト対象のコンポーネント間連携 → 実物必須
  3. ログ出力の検証が必要 → 検証可能なモック(vi.fn())を使用
  4. ログ出力の検証が不要 → 実物または無視

E2Eテストの実行条件

fixture-e2e:

  • UI機能の実装フェーズと並行して実行(最後に先送りしない)
  • モックバックエンド/フィクスチャ駆動の状態を使用(@dependency: full-ui (mocked backend))。ライブサービス不要
  • インフラ準備なしにCIで実行可能

service-integration-e2e:

  • 全コンポーネント実装完了かつローカルスタック起動後、最終フェーズでのみ実行
  • ローカルの実サービスまたはサービススタブを使用 — 検証対象コンポーネントに対して in-process モックは使用しない(@dependency: full-system

レビュー基準

スケルトンと実装の整合性

チェック不合格条件
Property検証Property注釈があるのにfast-check未使用
振る舞い検証「観測可能な結果」に対応するexpectがない
検証項目網羅列挙された検証項目がexpectに含まれていない
モック境界統合テストで内部コンポーネントをモック化

実装品質

チェック不合格条件
AAA構造Arrange/Act/Assertの区切りが不明確
独立性テスト間で状態共有、実行順序依存
再現性日時・乱数に依存し結果が変動
可読性テスト名と検証内容が一致しない