Topiqlo ロゴ

混同行列

公開日: 2025/06/02

混同行列とは?分類モデルの性能を詳細に分析するツール

はじめに

混同行列(Confusion Matrix)は、分類モデルの予測結果を正解と比較し、詳細な性能分析を行うための表形式のツールです。
単に正解率を見るだけでなく、どのクラスで誤分類が起きているかを把握できるため、モデル改善に役立ちます。
この記事では混同行列の構造や指標、活用方法をわかりやすく解説します。

基本情報・概要

混同行列は、実際のクラスとモデルの予測クラスの組み合わせごとにサンプル数を集計したマトリックスです。
2クラス分類では2×2行列、多クラス分類ではクラス数×クラス数の行列となります。

  • 2クラス分類の混同行列の構成:

    • 真陽性(TP):正例を正しく予測
    • 偽陽性(FP):負例を誤って正例と予測
    • 真陰性(TN):負例を正しく予測
    • 偽陰性(FN):正例を誤って負例と予測
    実際\予測PositiveNegative
    PositiveTPFN
    NegativeFPTN

深掘り解説

  • 各指標の計算方法

    • 精度(Accuracy)= (TP + TN) / 全サンプル数
    • 適合率(Precision)= TP / (TP + FP)
    • 再現率(Recall)= TP / (TP + FN)
    • F1スコア= 2 × (Precision × Recall) / (Precision + Recall)
  • 多クラス分類での混同行列
    クラスごとにTP, FP, FNを計算し、平均をとることで評価可能。

  • 誤分類のパターン把握
    特にどのクラスで誤りが多いかを視覚的に確認できる。

応用・発展的な使い方

  • モデルの弱点分析と改善方針の策定
  • クラス不均衡問題の評価補助
  • ハイパーパラメータ調整時の詳細評価
  • 教師なし学習のクラスタリング結果評価(応用)

よくある誤解と注意点

  • 混同行列だけでモデルの全てがわかるわけではない
  • 数値が多いほど良いとは限らず、バランスも重要
  • クラス不均衡がある場合、精度は過信しない

まとめ

混同行列は分類モデルの性能を多角的に分析するための基本かつ強力なツールです。
正確な評価指標を算出し、誤分類の傾向を理解することで、モデル改善や適切な運用が可能になります。
機械学習の実務でぜひ活用したい技術です。