成果物品質評価(成果物評価)

多層的な 成果品質評価

要件定義からテストケース、網羅的・多層的実装、実際のカバレッジまでを重視した「成果品質評価」。 シニアエンジニアがAIを使って半自動で成果物を検証し、技術的品質を保証します。

エンジニア以外(デザイナー・オペレーター・コーポレート等)の場合、アウトプットの質に主眼を置き、各パラメータを自分の業務内容に合わせて読み替えて評価して構いません。使わないパラメータは未入力でニュートラル(評価に影響しない)となります。
CI/CDやAIを活用してコードベースを自動・半自動で評価することを奨励します。
要件定義
テストケースの導出
網羅的実装
多層的カバレッジ

深い検証の思想

AIの限界と人間の役割

現実的な認識

もしAIが完全に評価できるなら、そもそも人間は開発に必要ありません。 しかし、現時点ではAIの進化は完全自動で複雑なシステムを構築するほどの能力はありません。

半自動検証の最適化

開発組織のパフォーマンスを向上させるためには、 シニアエンジニアがAIを使って半自動で成果物を検証するプロセスが有効になります。

品質保証と標準化のプロセス

成果物品質の保証

要件定義からテストケース、網羅的・多層的実装、実際のカバレッジまでを 体系的に検証することで、成果物の技術的品質を保証します。

検証プロセスの標準化

シニアエンジニアによる半自動検証プロセスを標準化することで、 一貫性のある品質保証と効率的な開発支援を実現します。

深い検証の核心観点

テストカバレッジの網羅性
• 要件定義書との整合性
• 各レイヤー(ユニット・統合・E2E)の網羅
• エッジケースの考慮
• テストの実行可能性
AIテスト駆動開発
• 要件定義書→テスト自動生成
• CI実行→カバレッジ評価
• 標準化されたアプローチ
• 理想のコード体系追求
設計・セキュリティ・パフォーマンス
• アーキテクチャの一貫性
• セキュリティ脆弱性の検出
• パフォーマンス最適化
• 技術的負債の管理
技術的深さの評価
• 設計思想の明確性
• 実装の技術的妥当性
• 拡張性への配慮
• 保守性の確保
成果物重視の定量評価
• アウトプットの"量"評価
• 網羅性のスコア化
• 要件達成度の測定
• 品質指標の定量化
多層性・整合性の検証
• 各レイヤーの整合性
• テストの多層性確保
• 要件との整合性
• 実装の一貫性

深い検証のプロセス

1

要件定義書の検証

要件定義書の完全性と明確性を確認し、そこから導かれるテストケースの妥当性を検証

2

テストケースの網羅性検証

要件定義から導かれるテストケースが網羅的に実装され、ユニット・統合・E2Eの各レイヤーで適切にカバーされているかを検証

3

多層的実装の検証

各レイヤーでの実装が要件定義と整合し、テストケースが実際にパスしているかを多層的に検証

4

実際のカバレッジ検証

テストの実行結果と実際のカバレッジを測定し、要件定義との整合性を定量的に検証

5

検証結果の記録・改善提案

検証結果を記録し、成果物の品質向上に向けた具体的な改善提案を提示

成果物品質評価プロンプト体系(評価者ガイドライン)

評価プロンプト(基本版)

プロンプト例

あなたはシニアエンジニアとして、成果物の成果物品質評価を行います。

以下の観点で評価してください:

  • 要件定義書の完全性と明確性
  • テストケースの網羅性(ユニット・統合・E2E)
  • 多層的実装の検証
  • 実際のカバレッジ測定
  • 技術的品質の保証

各観点を0-100点で評価し、具体的な改善提案を提示してください。

評価基準

• 90-100点:ベストプラクティス
• 80-89点:高品質
• 70-79点:標準的
• 60-69点:改善必要
• 0-59点:重大問題
評価プロンプト(詳細版)

詳細プロンプト例

成果物の成果物品質評価を実行してください。

評価対象:[成果物名]

評価観点:

  1. 要件定義の検証:完全性・明確性・テストケース導出の妥当性
  2. テスト網羅性:ユニット・統合・E2Eの各レイヤーでのカバレッジ
  3. 多層的実装:要件定義と実装の整合性・一貫性
  4. カバレッジ検証:実際のテスト実行結果とカバレッジ測定
  5. 技術的品質:設計・セキュリティ・パフォーマンス・保守性

各観点でスコア・根拠・改善提案を提示してください。

評価実行手順

1

成果物の事前確認

評価対象の成果物(コードベース・ドキュメント・テスト)を事前に確認し、評価の準備を行う

• ファイル構成の把握
• 主要機能の理解
• テストファイルの存在確認
2

プロンプトの選択・カスタマイズ

成果物の特性に応じて適切なプロンプトを選択し、必要に応じてカスタマイズする

• 基本版 vs 詳細版の選択
• 評価観点の調整
• 成果物固有の要件追加
3

AI評価の実行

選択したプロンプトでAI評価を実行し、各観点でのスコアと根拠を取得する

• プロンプトの入力
• AI評価結果の取得
• 評価根拠の確認
4

人間による検証・調整

AI評価結果を人間の視点で検証し、必要に応じて調整・補完を行う

• 評価結果の妥当性確認
• 見落としの補完
• スコアの調整
5

評価レポートの作成

最終的な評価結果をレポート形式でまとめ、改善提案を提示する

• 総合スコアの算出
• 改善提案の整理
• 優先度の明示

より良いアプローチ(厳密な評価のための指針)

テストの実態確認

テストファイルの中身確認

• テストファイルの存在だけでなく、中身を実際に読む
• 有効なテストケースが書かれているか確認
• テストの実行可能性を検証
• モックやスタブの適切性を評価

カバレッジ・CI状況の確認

• テストカバレッジレポートの存在確認
• CIの実行結果や自動化状況の確認
• カバレッジの可視化・記録の仕組み確認
• テスト実行の自動化レベル評価
実装の実態確認

UI・要素定義の実態確認

• UIや要素定義が多いだけで、ロジックが伴っているか確認
• 実際に動作するコードの有無をサンプルで確認
• モックと実装の区別を明確にする
• ビジネスロジックの実装状況を評価

テストの十分性判定基準

• 主要な画面・APIごとにテストがあるか
• ユニット・統合・E2Eテストの各層が存在するか
• エッジケースや異常系のテストがあるか
• テストカバレッジが一定水準(例:80%以上)を満たしているか

ユーザーからの指示の与え方(より厳密な評価のための指針)

具体的な指示例

テスト評価の指示

• 「テストファイルの中身も見て、実際に有効なテストが書かれているかまで評価して」
• 「テストカバレッジレポートやCIの実行結果が存在するかまで調べて」
• 「主要な画面・APIごとにテストがあるか、E2Eテストがあるか確認して」
• 「テストの実行可能性と有効性を実際に検証して」

実装評価の指示

• 「UIモックや要素定義だけでなく、動作するロジックやテストの有無も重視して」
• 「実際に動作するコードの割合を評価して」
• 「ビジネスロジックの実装状況を確認して」
• 「モックと実装の区別を明確にして評価して」
評価基準の明確化

評価基準の設定

• 「テストが十分か?」を判定するための明確な基準を設定
• カバレッジの最低基準(例:80%以上)を明示
• テスト層の最低要件(ユニット・統合・E2E)を指定
• 実装の最低要件(動作するロジックの割合)を設定

評価の厳密性向上

• 表層的な構造だけでなく、実装・テストの実態を重視
• サンプルでの実態確認を必須とする
• 定量的な評価基準を設定
• 改善提案の具体性を要求

Cursor活用方法

コード分析機能

静的解析

• コードの複雑性分析
• 重複コードの検出
• 潜在的なバグの特定
• パフォーマンス問題の検出

設計パターン分析

• 使用されているデザインパターンの識別
• アーキテクチャの一貫性チェック
• SOLID原則の遵守状況
• 依存関係の分析
AIアシスト機能

コードレビュー支援

• 改善提案の自動生成
• ベストプラクティスの提案
• セキュリティ問題の指摘
• パフォーマンス最適化の提案

ドキュメント生成

• コードの説明文書の自動生成
• API仕様書の作成支援
• 変更履歴の要約
• 技術的負債の可視化

スコア化基準

評価基準
優秀 (90-100点)
ベストプラクティス
良好 (80-89点)
高品質
普通 (70-79点)
標準的
要改善 (60-69点)
改善必要
不合格 (0-59点)
重大問題
重み付け
コードの可読性・保守性
25%
設計パターンの適用
20%
技術的負債の管理
20%
拡張性・柔軟性
15%
エラーハンドリング
10%
テスト設計
10%

検証者の役割

成果物検証の専門家
• 要件定義から実装まで精通したシニアエンジニア
• AIを活用した半自動検証の専門家
• 品質保証プロセスの責任者
• 技術的改善提案の提供者
品質保証の責任者
• 成果物の技術的品質を保証
• 要件定義との整合性を確認
• テストケースの網羅性を検証
• 実装の一貫性を確保
改善提案の提供者
• 検証結果に基づく改善提案
• 具体的な実装例の提示
• 技術的負債の特定と解決策
• 品質向上のためのガイダンス
検証スケジュール
• 成果物完成時の検証
• 1回あたり2-3時間
• 重点検証の実施
• 結果の即座フィードバック
検証レポート
• 各観点の詳細検証
• 改善提案の提示
• 優先度の明示
• 次回検証での確認項目
継続改善
• 検証基準の見直し
• 検証精度の向上
• 新しい観点の追加
• ベストプラクティスの更新

成果物の深い検証で技術的品質を保証

要件定義からテストケース、網羅的・多層的実装、実際のカバレッジまでを
体系的に検証することで、成果物の技術的品質を保証し、開発効率を向上させます