Topiqlo ロゴ

ROC曲線

公開日: 2025/06/02

ROC曲線とは?分類モデルの性能を視覚化するツール

はじめに

ROC曲線(Receiver Operating Characteristic Curve)は、分類モデルの性能を視覚的に評価するグラフです。
真陽性率(感度)と偽陽性率の関係を表し、モデルの判別能力を多角的に分析できます。
この記事ではROC曲線の基本概念や作成方法、活用例をわかりやすく解説します。

基本情報・概要

ROC曲線は、分類モデルの閾値を変化させながら、各閾値における

  • 真陽性率(True Positive Rate, TPR)
  • 偽陽性率(False Positive Rate, FPR)

をプロットしたものです。

  • 真陽性率(TPR)=感度=正しく陽性を検出した割合
  • 偽陽性率(FPR)=誤って陽性と判定した陰性の割合
用語説明
真陽性率(TPR)実際に陽性であるものを正しく陽性と判定した割合
偽陽性率(FPR)実際に陰性であるものを誤って陽性と判定した割合
閾値モデルが陽性と判断するためのスコアの基準値

深掘り解説

  • ROC曲線の描き方

    1. モデルの出力スコアの閾値を0から1まで変化させる
    2. 各閾値でTPRとFPRを計算
    3. FPRを横軸、TPRを縦軸にプロットし曲線を描く
  • 理想的なROC曲線
    左上に近いほど良く、TPRが高くFPRが低いモデルを示す。

  • 対角線(ランダムモデル)
    ランダムな予測を表し、AUC=0.5となる。

  • AUC(Area Under the Curve)
    ROC曲線の下の面積で、モデルの判別能力の総合指標。

応用・発展的な使い方

  • モデル性能の比較
  • 閾値設定の最適化
  • 医療診断や信用評価など重要な判別タスクの評価
  • 多クラス分類への拡張手法

よくある誤解と注意点

  • ROC曲線は二値分類での評価が基本
  • クラス不均衡が激しい場合はPR曲線も併用すると良い
  • 閾値によって性能が大きく変わることに注意

まとめ

ROC曲線は分類モデルの性能を直感的に理解しやすい視覚的ツールです。
真陽性率と偽陽性率の関係を示すことで、モデルの判別力や閾値の適切さを評価できます。
モデル評価の基本として、ぜひ理解しておきたい技術です。