AUCとは？分類モデルの判別能力を評価する指標

はじめに

AUC（Area Under the Curve）は、ROC曲線の下の面積を表し、分類モデルの性能を評価するための指標です。
モデルがどれだけ正しく陽性・陰性を識別できるかを示し、不均衡データの評価に適しています。
この記事ではAUCの基本概念や計算方法、利用シーンをわかりやすく解説します。

AUCはROC曲線（Receiver Operating Characteristic Curve）の下の面積で、0から1の値を取ります。
1に近いほど判別能力が高く、0.5はランダムな予測と同等を意味します。

ROC曲線とは：
- 横軸：偽陽性率（False Positive Rate, FPR）
- 縦軸：真陽性率（True Positive Rate, TPR、再現率）

AUCは分類モデルの判別能力を総合的に評価する強力な指標です。
特に不均衡データ問題において重要であり、ROC曲線とセットで理解すると効果的です。
モデル評価の基本として押さえておきたい概念です。