【G検定対策】バイアスと分散とは?過学習・未学習の原因をわかりやすく整理

AIモデルがうまく学習できない原因は、大きく2つに分けられます。
それが「バイアス(ズレ)」と「分散(ブレ)」です。
この2つを理解すると、なぜ「未学習」や「過学習」が起きるのかが一気につながります。さらにG検定では「トレードオフ」として頻出テーマです。
この記事では、直感的に理解できるように図解ベースで整理します。
バイアスと分散

モデルとは『AIがデータをもとに判断するための「仕組み」や「計算のルール」のこと』です。
まずは全体像を一言で押さえましょう。バイアスと分散の本質をシンプルに理解することで、このあとの内容が一気にわかりやすくなります。
バイアス → ズレ(モデルがシンプルすぎ)
分散 → ブレ(モデルが複雑すぎ)
バイアス → ズレ(モデルがシンプルすぎ)
分散 → ブレ(モデルが複雑すぎ)
何が起きているのか

バイアス(ズレ)と分散(ブレ)が大きくなると、モデルは正しく学習できず、予測が不正確になります。ここでは、そのとき内部で何が起きているのかを整理します。
バイアスが大きい
→ モデルが単純すぎる
→ データをうまく表現できない
バイアスが大きい
→ モデルが単純すぎる
→ データをうまく表現できない
分散が大きい
→ モデルが複雑すぎる
→ データに振り回される
分散が大きい
→ モデルが複雑すぎる
→ データに振り回される
どんな問題になるのか?

バイアスや分散が大きいと、モデルは正しく予測できず、未学習や過学習といった問題が発生します。ここでは具体的にどんな問題になるのかを整理します。
バイアスが大きい
→ 未学習(アンダーフィッティング)
分散が大きい
→ 過学習(オーバーフィッティング)
バイアスが大きい
→ 未学習(アンダーフィッティング)
分散が大きい
→ 過学習(オーバーフィッティング)
トレードオフが必要

バイアスと分散は互いに影響し合い、片方を下げるともう片方が上がりやすい関係にあります。この関係を トレードオフ と呼びます。
- バイアスと分散は反対の動きをする
- モデルを複雑にするとバイアスは下がるが、分散は上がる
どう考えればいいか(対処法)

精度が出ないときは、原因が「ズレ(バイアス)」か「ブレ(分散)」かを見極めることが重要です。ここでは実務での考え方を整理します。
○ 精度が低いとき → 原因は「ズレ」か「ブレ」
○ シンプルすぎる → モデルを複雑にする
○ 複雑すぎる → 正則化・ドロップアウトを使う
○ 精度が低いとき → 原因は「ズレ」か「ブレ」
○ シンプルすぎる → モデルを複雑にする
○ 複雑すぎる → 正則化・ドロップアウトを使う
G検定ではどう問われる?
G検定では「状態」と「対策」が問われます。
- バイアスと分散はどのような関係性か
- 未学習はどのような状態か
- 過学習はどのような状態か
- 最適な状態はどのような状態か
まとめ

一言でまとめると…
バイアス → ズレ(モデルが単純すぎ:未学習)
分散 → ブレ(モデルが複雑すぎ:過学習)
バイアス → ズレ(モデルが単純すぎ:未学習)
分散 → ブレ(モデルが複雑すぎ:過学習)
そして…
バイアスは「ズレ」、分散は「ブレ」を意味し、どちらが大きくてもモデルの性能は低下します。
シンプルすぎると未学習(高バイアス)、複雑すぎると過学習(高分散)が発生します。
重要なのはこの2つの バランスを取ること です。
トレードオフの関係を理解し、最適なモデルを目指しましょう。G検定では頻出ポイントなので確実に押さえておきましょう。
関連記事・おすすめ記事
バイアスと分散は、「なぜAIの精度がうまくいかないのか」を説明する考え方です。
モデルが単純すぎるとバイアスが大きくなり、複雑すぎると分散が大きくなります。このバランスが崩れると、過学習などの問題が発生します。

では、どうやってバランスを取るのか?代表的な対策はこちら。

実際の具体的な手法はこちら。

どの分野から出題されるか予想しました。

G検定 合格体験談です。2回目の受験で何とか合格できました。


