【G検定|理解型予想問題】バイアスと分散

バイアスと分散は、G検定でも重要テーマです。
ただし
- 「高バイアス」
- 「高分散」
- 「過学習」
を言葉だけで覚えていると、少し聞き方が変わっただけで混乱しやすくなります。
この記事では
- なぜその答えになるのか
- どこを混同しやすいのか
- どう整理すると理解しやすいのか
まで含めて整理していきます。
問題①
機械学習における「バイアス」の説明として、最も適切なものはどれか?
- A. 学習データへの適応度の高さ
- B. モデル予測のばらつきの大きさ
- C. モデルの予測が真の値からズレる傾向
- D. 学習速度の速さ
- 正解・解説(クリックで開きます)
-
正解
C
解説

バイアス(Bias)は「予測が全体的にズレる傾向」を表します。
つまり
- シンプルすぎるモデル
- 表現力不足のモデル
では、データの特徴を十分学習できず「そもそも予測がズレやすい」状態になります。
これが「高バイアス」です。
補足
高バイアスでは
- 学習データでも精度が低い
- テストデータでも精度が低い
という特徴があります。
問題②
機械学習における「分散」の説明として、最も適切なものはどれか?
- A. モデル予測のばらつきの大きさ
- B. モデルの学習速度
- C. モデルの単純さ
- D. 損失関数の種類
- 正解・解説(クリックで開きます)
-
正解
A
解説

分散(Variance)は「データによって予測が変わりやすい状態」を表します。
複雑すぎるモデルでは
- ノイズ
- 偶然の特徴
まで学習してしまい「データが少し変わるだけで予測も大きく変わる」状態になります。
これが「高分散」です。
補足
高分散では
- 学習データでは高精度
- テストデータで精度低下
が起きやすくなります。
これは過学習と深く関係しています。
問題③
高バイアスなモデルで起きやすい現象として、最も適切なものはどれか?
- A. 学習データだけ異常に高精度になる
- B. データの特徴を十分学習できない
- C. ノイズまで覚え込む
- D. テストデータだけ高精度になる
- 正解・解説(クリックで開きます)
-
正解
B
解説

高バイアスでは「モデルが単純すぎる」ことが問題になります。
そのため
- データの複雑な特徴
- 本来学習すべき関係性
をうまく表現できません。
結果として「全体的に精度が低い」状態になります。
補足
これは アンダーフィッティング(過小適合)とも呼ばれます。
問題④
高分散なモデルで起きやすい現象として、最も適切なものはどれか?
- A. モデルが単純すぎる
- B. 学習データでも精度が低い
- C. ノイズまで学習してしまう
- D. 常に予測が一定になる
- 正解・解説(クリックで開きます)
-
正解
C
解説

高分散では「モデルが複雑すぎる」ことが問題になります。
その結果、本来学習しなくてもよい
- 偶然の偏り
- ノイズ
まで覚え込んでしまいます。
これにより「学習データには強いが、本番に弱い」状態になります。
補足
これは 過学習(Overfitting)と強く関係しています。
問題⑤
「過学習」に最も関係が深いものはどれか?
- A. 高バイアス
- B. 高分散
- C. 学習率低下
- D. 正則化不足
- 正解・解説(クリックで開きます)
-
正解
B
解説

過学習は「学習データに合わせすぎた状態」です。
つまり
- ノイズ
- 偶然の特徴
まで覚えてしまっています。
これは「データによって予測が大きく変わる」高分散の特徴と一致します。
補足
ここはG検定でもかなり重要です。
整理すると
- 高バイアス → 単純すぎる
- 高分散 → 複雑すぎる
- 過学習 → 高分散寄り
となります。
問題⑥
複雑なモデルほど高分散になりやすい理由として、最も適切なものはどれか?
- A. 学習速度が遅くなるため
- B. 学習データの細かな特徴まで覚えやすいため
- C. 損失関数が変化するため
- D. 教師データが不要になるため
- 正解・解説(クリックで開きます)
-
正解
B
解説

モデルが複雑になると「表現力」が上がります。
これは一見良さそうですが、同時に
- ノイズ
- 偶然の偏り
まで学習しやすくなります。
結果として「データ変更への弱さ」が増えてしまいます。
これが高分散です。
補足
つまり「賢すぎるモデル」が危険になることがあります。
これは誤解しやすいポイントです。
問題⑦
バイアスと分散を初心者が混同しやすい理由として、最も適切なものはどれか?
- A. どちらも学習データ数を表すため
- B. どちらも「精度低下」に見えるため
- C. 損失関数と同じ意味だから
- D. 同じアルゴリズム名だから
- 正解・解説(クリックで開きます)
-
正解
B
解説

初心者が混乱しやすい理由は「どちらも精度が悪く見える」からです。
しかし実際は
状態 原因 高バイアス 単純すぎる 高分散 複雑すぎる という違いがあります。
つまり「悪くなる理由」が真逆なのです。
補足(超重要)
ここを暗記だけで覚えると
- 高バイアス
- 高分散
- 過学習
- アンダーフィッティング
が頭の中でバラバラになります。
重要なのは「モデルが単純すぎるのか?」、「複雑すぎるのか?」を線で理解することです。
まとめ

バイアスと分散は、G検定でも非常に重要なテーマです。
ただし
- 高バイアス
- 高分散
- 過学習
を単語だけで覚えると、少し聞き方が変わっただけで混乱しやすくなります。
重要なのは
- 単純すぎる → 高バイアス
- 複雑すぎる → 高分散
- 過学習 → 高分散寄り
という関係を整理することです。
この関係が理解できると
- 正則化
- Dropout
- 交差検証
- モデル設計
なども線で理解しやすくなります。
G検定では「単語暗記」より「なぜそうなるのか」を意識すると、問い方変更にも強くなります。
関連記事・おすすめ記事
この予想問題よりもバイアスと分散の詳しく整理しています。
もっと詳しく学習したい方はご覧ください。

不合格体験記です。私のような失敗をしないように確認しましょう。


