【G検定対策】評価指標の使い分け方は?わかりやすく整理

AIモデルの評価といえば「精度(Accuracy)」を思い浮かべる人が多いですが、それだけでは不十分です。
実は、データの偏り(不均衡)があると、精度が高くても役に立たないケースがあります。
そこで重要になるのが、適合率・再現率・F1スコアといった評価指標の使い分けです。
どの指標を使うかによって、モデルの評価は大きく変わります。
この記事では、初心者でも理解できるように
- 精度だけではダメな理由
- 適合率と再現率の違い
- 状況に応じた使い分け方
を図解ベースでわかりやすく整理します。
「どの指標を選ぶべきか」が判断できる状態を目指しましょう。
まず結論

精度だけでは不十分。目的に応じて評価指標を使い分けることが重要です。
- 精度(Accuracy)=全体の正しさ
- 適合率(Precision)=間違って当てない
- 再現率(Recall)=見逃さない
なぜ精度だけではダメ?

データに偏り(不均衡)があると、精度は簡単に高く見えてしまいます。
不均衡データ=片方のデータが極端に多い
不均衡データ=片方のデータが極端に多い
例:99%が正常、1%が異常
全部「正常」と予測 → 精度99%
適合率と再現率の違い

評価指標は「何を重視するか」で使い分けます。
○ 適合率(Precision)
→ 正しいと予測した中で、どれだけ当たっているか
→ 間違って当てない(慎重)
○ 再現率(Recall)
→ 本当の正解の中で、どれだけ見つけられたか
→ 見逃さない(広く拾う)
○ 適合率(Precision)
→ 正しいと予測した中で、どれだけ当たっているか
→ 間違って当てない(慎重)
○ 再現率(Recall)
→ 本当の正解の中で、どれだけ見つけられたか
→ 見逃さない(広く拾う)
どう使い分ける?

状況によって「何を重視するか」が変わります。
○ スパムメール判定
→ 適合率重視(誤判定を減らす)
○ 病気診断
→ 再現率重視(見逃しを防ぐ)
○ 不正検知
→ 再現率寄り(リスクを減らす)
○ スパムメール判定
→ 適合率重視(誤判定を減らす)
○ 病気診断
→ 再現率重視(見逃しを防ぐ)
○ 不正検知
→ 再現率寄り(リスクを減らす)
F1スコアとは?

適合率と再現率のバランスを評価する指標です。
- F1スコア = PrecisionとRecallのバランス
- 両方が高いほど良い
- どちらかが低いとF1も下がる
G検定ではどう問われる?
「状況に応じた使い分け」が問われます。
- 医療 → 再現率
- スパム → 適合率
- 不均衡データ → 精度は信用できない
まとめ

評価指標は目的によって使い分ける必要があります。
- 精度だけでは不十分
- 不均衡データに注意
- 適合率 = 間違って当てない
- 再現率 = 見逃さない
- F1スコア = バランス
評価指標は、問題文の状況に応じて使い分けることが重要です。
精度(Accuracy)だけでは、不均衡データにおいて正しく評価できないケースがあるため注意が必要です。
G検定では「何を優先すべきか」を問う問題が頻出で、見逃しを防ぎたい場合は再現率、誤判定を減らしたい場合は適合率を選びます。
また、両方をバランスよく評価したい場合はF1スコアを使います。
「見逃しNGか?誤判定NGか?」を軸に判断するのが解答のコツです。
公式テキスト
Amazonで確認
楽天市場で確認
合格時に使用した問題集
Amazonで確認
楽天市場で確認
関連記事・おすすめ記事
精度・再現率・適合率は、それぞれ得意な場面が異なります。
目的に応じて使い分けることが重要です。
まずは、それぞれの意味をしっかり理解しておきましょう。

次に、その評価結果が信頼できるかを確認する方法はこちら。

また、評価が良くても本番でうまくいかないケースもあります。

なぜそのような問題が起きるのかはこちら。

どの分野から出題されるか予想しました。

G検定 合格体験談です。2回目の受験で何とか合格できました。




