【G検定対策】教師あり学習・教師なし学習・強化学習の違いを図解で整理

G検定に限った話ではありませんが、AIを学び始めると、よく出てくるのが次の3つです。
■ 教師あり学習
■ 教師なし学習
■ 強化学習
■ 教師あり学習
■ 教師なし学習
■ 強化学習
どれも機械学習の代表的な学習方法ですが、名前だけでは違いが分かりにくいと感じる方も多いでしょう。
この記事では、理解しやすいように、3つの違いを画像多めで整理します。
結論:3つの違いを1分で理解

まずはこの3つだけ覚えればOKです。
■ 教師あり学習 : 答えありで学ぶ
■ 教師なし学習 : 答えなしで学ぶ
■ 強化学習 : 行動しながら学ぶ
■ 教師あり学習 : 答えありで学ぶ
■ 教師なし学習 : 答えなしで学ぶ
■ 強化学習 : 行動しながら学ぶ
教師あり学習とは?

教師あり学習とは
入力データと正解ラベル(答え)を使って学習する方法
入力データと正解ラベル(答え)を使って学習する方法
です。
たとえば
- メール本文 → 迷惑メール / 通常メール
- 顧客データ → 離反する / 継続する
- 商品データ → 売れる / 売れない
のように、過去の答え付きデータから学習します。
主な活用例
- 顧客離反予測
- 売上予測
- 画像分類
- 迷惑メール判定
教師なし学習とは?

教師なし学習とは
正解ラベルなしのデータから、特徴や構造を見つける方法
正解ラベルなしのデータから、特徴や構造を見つける方法
です。
答えがないため、AI自身がデータの共通点や違いを探します。
主な活用例
- 顧客のグループ分け(クラスタリング)
- 異常検知
- 傾向分析
- 次元削減
たとえばECサイトなら
- まとめ買い型
- セール重視型
- 高単価商品型
など、顧客のタイプ分けに使われます。
強化学習とは?

強化学習とは
行動の結果として得られる報酬をもとに、最適な行動を学ぶ方法
行動の結果として得られる報酬をもとに、最適な行動を学ぶ方法
です。
人間でいう「試行錯誤して上達する」に近いイメージです。
主な活用例
- ゲームAI(AlphaGoなど)
- ロボット制御
- 自動運転の一部
- 在庫最適化
比較表で整理(保存用)
表にするとこうなります。

G検定ではどう問われる?
G検定では、具体例と学習方法を結びつける問題がよく出ます。
- 顧客離反予測 → 教師あり学習
- クラスタリング → 教師なし学習
- AlphaGo → 強化学習
単語暗記より
この事例はどの学習方法か?
この事例はどの学習方法か?
を整理しておくことが重要です。
よくある誤解

下記は 間違った認識 です。
■ 教師あり学習 = 簡単
■ 教師なし学習 = ディープラーニング
■ 強化学習 = ロボット専用
■ 教師あり学習 = 簡単
■ 教師なし学習 = ディープラーニング
■ 強化学習 = ロボット専用
まとめ

■ 答えあり → 教師あり学習
■ 答えなし → 教師なし学習
■ 行動して学ぶ → 強化学習
■ 答えあり → 教師あり学習
■ 答えなし → 教師なし学習
■ 行動して学ぶ → 強化学習
この3つを整理できると、AIの学習方法が一気に理解しやすくなります。
G検定頻出テーマなのでここは確実に押さえておきましょう。
関連記事・おすすめ記事
機械学習とディープラーニングの違いを整理しました。

CNN・RNN・Transformerの違いを整理しました。

どの分野から出題されるか予想しました。

G検定 合格体験談です。2回目の受験で何とか合格できました。




