【G検定対策】教師あり学習・教師なし学習・強化学習の違いをわかりやすく整理

G検定に限った話ではありませんが、AIを学び始めると、よく出てくるのが次の3つです。
○ 教師あり学習
○ 教師なし学習
○ 強化学習
○ 教師あり学習
○ 教師なし学習
○ 強化学習
どれも機械学習の代表的な学習方法ですが、名前だけでは違いが分かりにくいと感じる方も多いでしょう。
この記事では、理解しやすいように、3つの違いを画像多めで整理します。
結論:3つの違いを1分で理解

まずはこの3つだけ覚えればOKです。
○ 教師あり学習 : 答えありで学ぶ
○ 教師なし学習 : 答えなしで学ぶ
○ 強化学習 : 行動しながら学ぶ
○ 教師あり学習 : 答えありで学ぶ
○ 教師なし学習 : 答えなしで学ぶ
○ 強化学習 : 行動しながら学ぶ
教師あり学習とは?

教師あり学習とは
入力データと正解ラベル(答え)を使って学習する方法
入力データと正解ラベル(答え)を使って学習する方法
です。
たとえば
- メール本文 → 迷惑メール / 通常メール
- 顧客データ → 離反する / 継続する
- 商品データ → 売れる / 売れない
のように、過去の答え付きデータから学習します。
主な活用例
- 顧客離反予測
- 売上予測
- 画像分類
- 迷惑メール判定
教師なし学習とは?

教師なし学習とは
正解ラベルなしのデータから、特徴や構造を見つける方法
正解ラベルなしのデータから、特徴や構造を見つける方法
です。
答えがないため、AI自身がデータの共通点や違いを探します。
主な活用例
- 顧客のグループ分け(クラスタリング)
- 異常検知
- 傾向分析
- 次元削減
たとえばECサイトなら
- まとめ買い型
- セール重視型
- 高単価商品型
など、顧客のタイプ分けに使われます。
強化学習とは?

強化学習とは
行動の結果として得られる報酬をもとに、最適な行動を学ぶ方法
行動の結果として得られる報酬をもとに、最適な行動を学ぶ方法
です。
人間でいう「試行錯誤して上達する」に近いイメージです。
主な活用例
- ゲームAI(AlphaGoなど)
- ロボット制御
- 自動運転の一部
- 在庫最適化
比較表で整理(保存用)
表にするとこうなります。

よくある誤解

下記は 間違った認識 です。
○ 教師あり学習 = 簡単
○ 教師なし学習 = ディープラーニング
○ 強化学習 = ロボット専用
○ 教師あり学習 = 簡単
○ 教師なし学習 = ディープラーニング
○ 強化学習 = ロボット専用
G検定ではどう問われる?
G検定では、具体例と学習方法を結びつける問題がよく出ます。
- 顧客離反予測 → 教師あり学習
- クラスタリング → 教師なし学習
- AlphaGo → 強化学習
単語暗記より
この事例はどの学習方法か?
この事例はどの学習方法か?
を整理しておくことが重要です。
まとめ

○ 答えあり → 教師あり学習
○ 答えなし → 教師なし学習
○ 行動して学ぶ → 強化学習
○ 答えあり → 教師あり学習
○ 答えなし → 教師なし学習
○ 行動して学ぶ → 強化学習
この3つは
データに答えがあるかどうか
どうやって学習するか
データに答えがあるかどうか
どうやって学習するか
という観点で整理すると理解しやすくなります。
この違いを押さえておくだけで
- AIの仕組みの理解
- 各手法の使い分け
- 問題文の意図の把握
が一気にしやすくなります
特にG検定では
- 顧客離反予測 → 教師あり学習
- クラスタリング → 教師なし学習
- AlphaGo → 強化学習
のように、具体例と学習方法を結びつける問題 が重要です。まずはこの3つの違いを確実に押さえておきましょう。
関連記事・おすすめ記事
AIはどのように「正解・不正解」を判断しているのでしょうか?まずはここを理解しましょう。
その判断基準となる考え方がこちらです。

AIは間違いを見つけたあと、「どうやって改善するのか?」が重要です。
その学習の基本となる方法はこちら。

AIの性能はどうやって評価するのかも、試験ではよく問われます。
代表的な指標はこちらで整理しています。

どの分野から出題されるか予想しました。

G検定 合格体験談です。2回目の受験で何とか合格できました。



