再現率
公開日: 2025/06/02
再現率(Recall)とは?分類モデルの検出能力を示す指標
はじめに
再現率(Recall)は、機械学習の分類問題において、実際に正であるデータのうち、モデルが正しく検出できた割合を示す評価指標です。
特に医療診断や異常検知など、見逃しを減らすことが重要なタスクで重視されます。
この記事では再現率の定義や計算方法、特徴をわかりやすく解説します。
基本情報・概要
再現率は、真陽性(True Positive、TP)を、実際の正例(TP + FN)で割った値です。
-
再現率の計算式:
[ \text{Recall} = \frac{TP}{TP + FN} ] -
用語説明:
- TP(True Positive):正例を正しく予測
- FN(False Negative):正例を誤って負例と予測
深掘り解説
-
再現率の意味
モデルがどれだけ正例を見逃さず検出できているかを示す指標。 -
再現率が高い場合
見逃しが少なく、多くの正例を捕捉できている状態。 -
再現率が低い場合
正例の多くを見逃している可能性がある。 -
精度(Precision)との関係
精度と再現率はトレードオフの関係にあり、両方をバランスよく評価するためにF1スコアが使われる。
応用・発展的な使い方
- 医療診断での病気検出率の評価
- 不正検知やセキュリティイベントの検出
- 情報検索や文書分類での関連文書検出率
- 音声認識や画像認識での重要クラス検出
よくある誤解と注意点
- 再現率だけが高くても望ましいとは限らない
- 精度とのバランスを考慮する必要がある
- 不均衡データでは特に評価指標の組み合わせが重要
まとめ
再現率は、モデルが正例をどれだけ見逃さずに検出できるかを示す重要な指標です。
用途や課題に応じて適切に使い分け、精度など他の指標と併せて総合的に評価することが大切です。
機械学習モデルの性能評価に欠かせない基礎知識として押さえておきましょう。