【G検定対策】精度・再現率・適合率とは?わかりやすく整理

seo-webmaster
プロモーションが含まれています
精度・再現率・適合率のイメージ画像

AIの評価では、「どれだけ正解したか」だけを見ればよいとは限りません。

たとえば、病気の検査では見逃しを減らすことが重要ですが、迷惑メール判定では正常なメールを誤って迷惑メールにしないことも大切です。

このように、AIを何に使うかによって重視する評価指標は変わります。

この記事では、精度・適合率・再現率の違いを、混同行列やF1値とのつながりも含めて整理します。

精度・適合率・再現率とは?

精度・適合率・再現率とは?のイメージ画像

精度・適合率・再現率は、AIの予測結果を評価するための指標です。

どれも「予測がどれくらい正しかったか」を見るために使われますが、見ている範囲が違います。

指標 一言でいうと 見ている範囲
精度 全体でどれだけ正解したか すべての予測
適合率 陽性と予測した中でどれだけ正解したか 予測した陽性
再現率 実際の陽性をどれだけ拾えたか 実際の陽性

ざっくり整理すると、精度は全体の正解率、適合率は「当てたつもりの中の正しさ」、再現率は「本当に拾うべきものを拾えたか」を見る指標です。

G検定では、名前だけで覚えるよりも、何を見たいときに使う指標なのかで整理することが大切です。

精度が高いだけでは不十分な理由

精度が高いだけでは不十分な理由のイメージ画像

精度は、全体の中でどれだけ正解したかを見る指標です。

たとえば100件のデータのうち95件を正しく分類できれば、精度は95%です。

一見すると、とてもよいモデルに見えます。

しかし、データに偏りがある場合は注意が必要です。

たとえば、迷惑メールが5件、通常メールが95件あるとします。
このとき、AIがすべてを「通常メール」と予測しても、通常メール95件は当たるため、精度は95%になります。

予測の状態 結果
通常メール95件 正しく通常メールと判定
迷惑メール5件 すべて見逃す
精度 95%

このモデルは精度だけ見ると高く見えますが、迷惑メールをまったく検出できていません。

つまり、目的によっては 精度が高くても役に立ちにくいモデル になることがあります。

そのため、AIの評価では精度だけでなく、適合率や再現率も見る必要があります。

精度と適合率の違い

精度と適合率の違いのイメージ画像0710

精度と適合率は、名前が似ていて混同しやすい指標です。

ただし、見る範囲が違います。

指標 見る範囲 意味
精度 全体 全体の中でどれだけ正解したか
適合率 陽性と予測したもの 陽性と予測した中でどれだけ正解したか

精度は、すべての予測結果を見ます。

一方、適合率は「AIが陽性だと予測したもの」だけを見ます。

たとえば、AIが「これは迷惑メールです」と予測したメールが10件あり、そのうち8件が本当に迷惑メールだった場合、適合率は高いといえます

適合率は、誤検知を減らしたいときに重要です。

再現率とは?

再現率とは?のイメージ画像

再現率とは、実際に陽性であるものをどれだけ見つけられたかを見る指標です。

たとえば、本当は病気の人が10人いて、そのうちAIが8人を見つけられた場合、再現率は高いといえます。

指標 重視すること
再現率 見逃しを減らす
適合率 誤検知を減らす

再現率は、見逃しが大きな問題になる場面で重要です。

たとえば病気の検査では、本当に病気の人を見逃してしまうと問題が大きくなります。

そのため、多少の誤検知があっても、まずは見逃しを減らすことが重視される場合があります。

適合率とは?

適合率とは?のイメージ画像

適合率とは、AIが陽性と予測したもののうち、どれだけ本当に陽性だったかを見る指標です。

たとえば、AIが「迷惑メール」と判定したメールの中に、通常メールが多く混ざっていると困ります。

この場合、適合率が低い状態です。

適合率は、間違って陽性と判定することを減らしたい場面で重要です。

場面 重視しやすい指標 理由
病気の検査 再現率 見逃しを減らしたい
迷惑メール判定 適合率 通常メールの誤判定を減らしたい
不正検知 場合による 見逃しと誤検知のバランスが必要

適合率と再現率は、どちらか一方だけを見ればよいわけではありません。
目的に応じて、どちらを重視するかが変わります。

どの指標を重視するべきか?

どの指標を重視するべきか?のイメージ画像

重視する指標は、AIを使う目的によって変わります。

見逃しを減らしたいなら再現率、誤検知を減らしたいなら適合率が重要になります。

目的 重視する指標
見逃しを減らしたい 再現率 病気の検査、異常検知
誤検知を減らしたい 適合率 迷惑メール判定、推薦の精度
全体の正解率を見たい 精度 データの偏りが少ない分類

ただし、実際にはどちらか一方だけを極端に高めればよいとは限りません。

再現率を高めようとすると、陽性と判定する範囲が広がり、誤検知が増えることがあります。

反対に、適合率を高めようとすると、慎重に判定しすぎて、見逃しが増えることがあります。

このバランスを見るために、F1値が使われます。

混同行列との関係

混同行列との関係のイメージ画像

精度・適合率・再現率は、混同行列とセットで理解すると整理しやすくなります。

混同行列とは、AIの予測結果を「実際はどうだったか」と「予測はどうだったか」で整理した表です。

実際に陽性 実際に陰性
陽性と予測 TP FP
陰性と予測 FN TN

それぞれの意味は次の通りです。

用語 意味
TP 陽性を正しく陽性と予測
FP 陰性を誤って陽性と予測
FN 陽性を誤って陰性と予測
TN 陰性を正しく陰性と予測

適合率では、FPが重要になります。
陽性と予測した中に、間違った陽性がどれだけ混ざっているかを見るからです。

再現率では、FNが重要になります。
本当は陽性なのに、見逃したものがどれだけあるかを見るからです。

指標 関係するミス 見ていること
適合率 FP 誤検知を減らせているか
再現率 FN 見逃しを減らせているか

混同行列を覚えるときは、数式だけでなく、FPは誤検知、FNは見逃し と整理すると理解しやすくなります。

F1値との関係

F1値との関係のイメージ画像

F1値とは、適合率と再現率のバランスを見るための指標です。

適合率だけが高くても、再現率が低ければ見逃しが多い可能性があります。
反対に、再現率だけが高くても、適合率が低ければ誤検知が多い可能性があります。

F1値は、この2つのバランスをまとめて見るために使われます。

指標 役割
適合率 誤検知をどれだけ減らせているか
再現率 見逃しをどれだけ減らせているか
F1値 適合率と再現率のバランスを見る

G検定では、F1値を細かく計算するよりも、適合率と再現率のバランスを見る指標として理解しておくとよいです。

G検定ではどう問われる?

G検定では、精度・適合率・再現率の違いが問われやすいです。

特に、名前の印象だけで判断すると混乱しやすいため、見ている範囲で整理することが大切です。

問われやすい内容 押さえるポイント
精度と適合率の違い 全体を見るか、予測陽性の中を見るか
再現率の意味 実際の陽性をどれだけ拾えたか
適合率の意味 陽性と予測した中でどれだけ正解したか
混同行列との関係 TP・FP・FN・TNとつながる
F1値との関係 適合率と再現率のバランスを見る

特に、次のように整理しておくと判断しやすくなります。

指標 覚え方
精度 全体の正解率
適合率 当てた中の正しさ
再現率 本物を見逃さない力
F1値 適合率と再現率のバランス

「正解率が高いからよいAI」と考えるのではなく、何を見逃したくないのか、何を誤検知したくないのかまで考えることが重要です。

まとめ

精度・再現率・適合率のイメージ画像のまとめのイメージ画像

精度・適合率・再現率は、AIの予測結果を評価するための代表的な指標です。

精度は全体の正解率、適合率は陽性と予測した中の正しさ、再現率は実際の陽性をどれだけ拾えたかを見ます。

指標 一言でいうと 重視する場面
精度 全体でどれだけ正解したか データの偏りが少ない分類
適合率 陽性と予測した中でどれだけ正解したか 誤検知を減らしたい
再現率 実際の陽性をどれだけ拾えたか 見逃しを減らしたい
F1値 適合率と再現率のバランス 両方を見たい

G検定では、数式を丸暗記するよりも、全体を見るのか、予測した陽性を見るのか、実際の陽性を見るのかで整理すると理解しやすくなります。

精度・適合率・再現率を理解しておくと、混同行列やF1値、過学習、交差検証などの評価に関する用語もつながって理解しやすくなります。

関連記事・おすすめ記事

精度・適合率・再現率の違いを理解したら、どの場面でどの指標を見るべきかも確認しておきましょう。

【G検定対策】評価指標の使い分け方は?わかりやすく整理
【G検定対策】評価指標の使い分け方は?わかりやすく整理

評価指標と損失関数は混同しやすいため、役割の違いも整理しておくと理解しやすくなります。

【G検定対策】損失関数とは?わかりやすく整理
【G検定対策】損失関数とは?わかりやすく整理

評価指標を見るだけでなく、評価のしかた自体を確認するには交差検証も重要です。

【G検定対策】交差検証(クロスバリデーション)とは?わかりやすく整理
【G検定対策】交差検証(クロスバリデーション)とは?わかりやすく整理

重要用語をチェックシートとしてまとめました。

こちらもおすすめ
【G検定対策】重要用語チェックシート
【G検定対策】重要用語チェックシート

用語の意味をまとめて確認したい場合は、G検定で覚えたいAI用語一覧もあわせて読んでみてください。

【G検定対策】G検定で覚えたいAI用語一覧|意味・違い・見分け方をわかりやすく整理
【G検定対策】G検定で覚えたいAI用語一覧|意味・違い・見分け方をわかりやすく整理

1回目不合格でした。不合格だった原因を分析しました。

【不合格体験談】G検定に落ちた原因|「成功体験」と「過学習」が落とし穴
【不合格体験談】G検定に落ちた原因|「成功体験」と「過学習」が落とし穴

公式テキスト

Amazonで確認

楽天市場で確認

合格時に使用した問題集

Amazonで確認

楽天市場で確認

書いている人
運営者
運営者
このブログの運営者です。文系出身です。SEO検定1級、ウェブマスター検定1級を取得しました。ブログ運営には「AIの活用は必須」と思いG検定を取得しました。G検定は簡単といわれがちですが1回目は不合格でした。その失敗経験を元に、これから受験する方の助けになればとできるだけわかりやすくG検定対策は解説しています。間違い等あればご指摘いただければ幸いです。合格バッチ
記事URLをコピーしました