ROC曲線
公開日: 2025/06/02
ROC曲線とは?分類モデルの性能を視覚化するツール
はじめに
ROC曲線(Receiver Operating Characteristic Curve)は、分類モデルの性能を視覚的に評価するグラフです。
真陽性率(感度)と偽陽性率の関係を表し、モデルの判別能力を多角的に分析できます。
この記事ではROC曲線の基本概念や作成方法、活用例をわかりやすく解説します。
基本情報・概要
ROC曲線は、分類モデルの閾値を変化させながら、各閾値における
- 真陽性率(True Positive Rate, TPR)
- 偽陽性率(False Positive Rate, FPR)
をプロットしたものです。
- 真陽性率(TPR)=感度=正しく陽性を検出した割合
- 偽陽性率(FPR)=誤って陽性と判定した陰性の割合
用語 | 説明 |
---|---|
真陽性率(TPR) | 実際に陽性であるものを正しく陽性と判定した割合 |
偽陽性率(FPR) | 実際に陰性であるものを誤って陽性と判定した割合 |
閾値 | モデルが陽性と判断するためのスコアの基準値 |
深掘り解説
-
ROC曲線の描き方
- モデルの出力スコアの閾値を0から1まで変化させる
- 各閾値でTPRとFPRを計算
- FPRを横軸、TPRを縦軸にプロットし曲線を描く
-
理想的なROC曲線
左上に近いほど良く、TPRが高くFPRが低いモデルを示す。 -
対角線(ランダムモデル)
ランダムな予測を表し、AUC=0.5となる。 -
AUC(Area Under the Curve)
ROC曲線の下の面積で、モデルの判別能力の総合指標。
応用・発展的な使い方
- モデル性能の比較
- 閾値設定の最適化
- 医療診断や信用評価など重要な判別タスクの評価
- 多クラス分類への拡張手法
よくある誤解と注意点
- ROC曲線は二値分類での評価が基本
- クラス不均衡が激しい場合はPR曲線も併用すると良い
- 閾値によって性能が大きく変わることに注意
まとめ
ROC曲線は分類モデルの性能を直感的に理解しやすい視覚的ツールです。
真陽性率と偽陽性率の関係を示すことで、モデルの判別力や閾値の適切さを評価できます。
モデル評価の基本として、ぜひ理解しておきたい技術です。