【G検定対策】教師あり学習・教師なし学習・強化学習の違いをわかりやすく整理

教師あり学習・教師なし学習・強化学習は、機械学習を理解するときに必ず出てくる基本用語です。
どれも「AIが学習する方法」に関係しますが、何を手がかりに学ぶのかが違います。
この記事では、3つの違いを、正解ラベル・パターン発見・報酬という視点から整理します。
教師あり学習・教師なし学習・強化学習の違いとは?

教師あり学習・教師なし学習・強化学習の違いは、何を手がかりに学ぶかで整理すると分かりやすくなります。
| 学習方法 | 一言でいうと | 学習の手がかり |
|---|---|---|
| 教師あり学習 | 正解付きで学ぶ | 正解ラベル |
| 教師なし学習 | 正解なしで学ぶ | データのパターン |
| 強化学習 | 試行錯誤で学ぶ | 報酬 |
教師あり学習は、正解ラベル付きのデータから学びます。
教師なし学習は、正解ラベルのないデータから、似ているものや隠れた構造を見つけます。
強化学習は、行動の結果として得られる報酬をもとに、よりよい行動を学びます。
教師あり学習とは?

教師あり学習は、入力データと正解ラベルを使って学習する方法です。
たとえば、猫の画像に「猫」という正解ラベルを付けて学習させるイメージです。
| 入力データ | 正解ラベル |
|---|---|
| 猫の画像 | 猫 |
| 犬の画像 | 犬 |
| 過去の売上データ | 売上予測の答え |
| メール本文 | 迷惑メール / 通常メール |
教師あり学習では、AIが予測した結果と正解ラベルを比べながら、間違いを少なくするように学習します。
分類や回帰でよく使われます。
| よく使う場面 | 例 |
|---|---|
| 分類 | 画像分類、迷惑メール判定 |
| 回帰 | 売上予測、価格予測 |
教師あり学習は、正解付きデータから学ぶ方法と押さえると分かりやすいです。
教師なし学習とは?

教師なし学習は、正解ラベルのないデータから、パターンや構造を見つける方法です。
教師あり学習のように、「このデータの正解はこれです」と教えるわけではありません。
AIは、データ同士の似ている点や違いを見つけて、グループ分けや特徴の整理を行います。
| 代表的な使い方 | 内容 |
|---|---|
| クラスタリング | 似ているデータをグループに分ける |
| 次元削減 | データの特徴を少ない軸に整理する |
| 異常検知 | 普段と違うデータを見つける |
たとえば、顧客データをもとに、似た購買傾向を持つ人をグループ分けするような使い方があります。
教師なし学習は、正解なしでパターンを見つける方法と整理すると覚えやすいです。
強化学習とは?

強化学習は、行動の結果として得られる報酬をもとに、よりよい行動を学ぶ方法です。
教師あり学習のように正解ラベルを直接与えるのではなく、行動して、その結果から学習します。
たとえば、ゲームAIがいろいろな手を試し、勝ちにつながる行動を学ぶイメージです。
| 用語 | 意味 |
|---|---|
| エージェント | 行動する主体 |
| 環境 | エージェントが行動する場所 |
| 行動 | エージェントが選ぶ動き |
| 報酬 | 行動の結果として得られる評価 |
強化学習は、ロボットやゲームAIだけでなく、最適化の考え方としても使われます。
教師あり学習・教師なし学習と同じく、学習方法の分類として押さえておくと混同しにくくなります。
3つの違いを表で整理

ポイントは、正解があるかどうかだけで判断しないことです。
強化学習にも正解ラベルはありませんが、教師なし学習とは違い、報酬をもとに行動を改善します。
なぜ混同しやすい?

教師あり学習・教師なし学習・強化学習は、すべて「AIの学習方法」に関する言葉です。
そのため、名前だけを暗記すると混同しやすくなります。
特に混同しやすいのは、次のような点です。
| 混同しやすい点 | 整理のコツ |
|---|---|
| 教師なし学習=ディープラーニングだと思う | 教師なし学習は学習方法、ディープラーニングは機械学習の一種 |
| 教師なし学習と強化学習を混同する | 教師なしはパターン発見、強化学習は報酬による行動改善 |
| 教師あり学習=簡単だと思う | 正解ラベルがあるだけで、問題が簡単とは限らない |
混同しそうなときは、正解ラベル・パターン発見・報酬の3つで見分けると整理しやすくなります。
G検定ではどう問われる?
G検定では、用語の意味だけでなく、具体例と学習方法を結びつける問題が出やすいです。
| 例 | 対応する学習方法 |
|---|---|
| 画像と正解ラベルを使って犬・猫を分類する | 教師あり学習 |
| 顧客を購買傾向ごとにグループ分けする | 教師なし学習 |
| ゲームAIが勝ちにつながる行動を学ぶ | 強化学習 |
| 売上データから将来の売上を予測する | 教師あり学習 |
| データの特徴を少ない軸に圧縮する | 教師なし学習 |
G検定では、単語だけを覚えるよりも、この事例は何を手がかりに学んでいるのかを見ることが大切です。
問題文に「正解ラベル」、「分類」、「予測」が出てきたら、教師あり学習を考えます。
「似ているデータをまとめる」、「クラスタリング」、「次元削減」が出てきたら、教師なし学習を考えます。
「報酬」、「試行錯誤」、「行動の改善」が出てきたら、強化学習を考えます。
まとめ

教師あり学習・教師なし学習・強化学習は、機械学習における代表的な学習方法です。
3つの違いは、何を手がかりに学ぶかで整理すると分かりやすくなります。
| 学習方法 | 覚え方 |
|---|---|
| 教師あり学習 | 正解ラベル付きで学ぶ |
| 教師なし学習 | 正解ラベルなしでパターンを見つける |
| 強化学習 | 報酬をもとに行動を改善する |
G検定では、具体例と学習方法を結びつける問題が出やすいです。
そのため、用語を単独で暗記するよりも、正解ラベルがあるのか、パターンを見つけるのか、報酬で行動を改善するのかを意識して整理しておくと理解しやすくなります。
関連記事・おすすめ記事
この記事とあわせて読むなら、以下の記事がおすすめです。
3つの学習方法を整理したら、次は教師あり学習・教師なし学習の代表的な手法や、強化学習の仕組みをもう少し具体的に見ていきましょう。












