【G検定対策】教師あり学習と教師なし学習とは?|分類・回帰・クラスタリングの違いを整理

「教師あり学習」と「教師なし学習」とはなんでしょうか。
AIの学習方法を理解するときに、まず混同しやすいのが「教師あり学習」と「教師なし学習」です。
ここでは触れませんが、混同しやすいものとして「強化学習」も存在します。
> 教師あり学習・教師なし学習・強化学習とは?
※ リンク先の記事の方がこの記事よりも教師あり学習・教師なし学習もざっくり説明しています
どちらも機械学習の代表的な方法ですが、違いは「正解データがあるかどうか」にあります。
さらに、教師あり学習には分類や回帰、教師なし学習にはクラスタリングや次元削減といった代表的な考え方があります。
この記事では、AIの学習をはじめたばかりの人向けに、教師あり学習と教師なし学習の違いを、分類・回帰・クラスタリングとの関係から整理します。
教師あり学習・教師なし学習とは?

教師あり学習と教師なし学習の違いは、正解データを使うかどうかで考えると整理しやすくなります。
| 学習方法 | 一言でいうと | 代表的な方法 |
|---|---|---|
| 教師あり学習 | 正解を見ながら学ぶ方法 | 分類・回帰 |
| 教師なし学習 | 正解なしでデータの特徴を見つける方法 | クラスタリング・次元削減 |
教師あり学習では、「この入力に対して、正解はこれ」というデータを使います。
教師なし学習では、正解を与えずに、データの中にあるまとまりや構造を探します。
教師あり学習とは?

教師あり学習とは、正解データを使って学習する方法です。
たとえば、画像を見て「犬」か「猫」かを判断するAIを作る場合、あらかじめ「この画像は犬」「この画像は猫」という正解ラベルを用意します。
AIは、入力データと正解を見比べながら
「どの特徴を見れば犬と猫を分けられるのか」
を学習していきます。
教師あり学習には分類と回帰がある

教師あり学習の代表例は、分類と回帰です。
| 種類 | 何を予測するか | 例 |
|---|---|---|
| 分類 | カテゴリを予測する | 犬か猫か、迷惑メールかどうか |
| 回帰 | 数値を予測する | 売上、価格、気温など |
分類も回帰も、正解データを使って学習するため、教師あり学習に含まれます。
分類とは?

分類とは、データを決められたカテゴリに分けることです。
たとえば、次のようなものが分類です。
| 入力 | 予測するもの |
|---|---|
| メール本文 | 迷惑メールかどうか |
| 画像 | 犬か猫か |
| 顧客情報 | 解約しそうかどうか |
分類では、答えがカテゴリになります。
- 「AかBか」
- 「どの種類に入るか」
を予測するイメージです。
回帰とは?

回帰とは、数値を予測することです。
たとえば、次のようなものが回帰です。
| 入力 | 予測するもの |
|---|---|
| 過去の売上データ | 来月の売上 |
| 物件情報 | 住宅価格 |
| 気象データ | 気温 |
分類との違いは、答えがカテゴリではなく数値になる点です。
犬か猫かを予測するのは分類。
価格や売上のような数値を予測するのは回帰です。
教師なし学習とは?

教師なし学習とは、正解データを使わずに、データの特徴やまとまりを見つける方法です。
教師あり学習では「正解」がありますが、教師なし学習では正解ラベルを与えません。
たとえば、顧客データを見て
- 「この人たちは似た行動をしている」
- 「このグループは購入傾向が近い」
といったまとまりを見つけるイメージです。
教師なし学習にはクラスタリングと次元削減がある

教師なし学習の代表例は、クラスタリングと次元削減です。
| 種類 | 一言でいうと | 例 |
|---|---|---|
| クラスタリング | 似ているデータをグループに分ける | 顧客をタイプ別に分ける |
| 次元削減 | データの特徴を少ない軸に整理する | 複雑なデータを見やすくする |
どちらも、あらかじめ正解を与えずに、データの中にある構造を見つける考え方です。
クラスタリングとは?

クラスタリングとは、似ているデータ同士をグループに分ける方法です。
たとえば、顧客データをもとに
| グループ | 特徴 |
|---|---|
| グループA | よく購入する人 |
| グループB | たまに購入する人 |
| グループC | ほとんど購入しない人 |
のように分けるイメージです。
ポイントは、最初から「この人はAグループ」と正解が与えられているわけではないことです。
AIがデータの似ている部分を見つけて、まとまりを作ります。
次元削減とは?

次元削減とは、複雑なデータを少ない特徴に整理する方法です。
データには、たくさんの特徴があります。
たとえば顧客データなら
- 年齢
- 購入回数
- 購入金額
- 閲覧回数
- 利用期間
など、さまざまな情報があります。
次元削減では、こうした多くの特徴を、できるだけ情報を残しながら少ない軸に整理します。
イメージとしては、複雑なデータを見やすくするための整理です。
教師あり学習と教師なし学習の違い

教師あり学習と教師なし学習は、次のように整理できます。
| 見るポイント | 教師あり学習 | 教師なし学習 |
|---|---|---|
| 正解データ | ある | ない |
| 目的 | 正解に近い予測をする | データの構造を見つける |
| 代表例 | 分類・回帰 | クラスタリング・次元削減 |
| 使われる場面 | 予測したい答えが決まっているとき | データの傾向を知りたいとき |
一番大事なのは、正解ラベルがあるかどうかです。
正解をもとに予測を学ぶなら教師あり学習。
正解なしでまとまりや構造を見つけるなら教師なし学習です。
分類・回帰・クラスタリングの違い

G検定では、分類・回帰・クラスタリングの違いも混同しやすいです。
| 用語 | 学習方法 | 一言でいうと |
|---|---|---|
| 分類 | 教師あり学習 | カテゴリを予測する |
| 回帰 | 教師あり学習 | 数値を予測する |
| クラスタリング | 教師なし学習 | 似たデータをまとめる |
分類と回帰は、どちらも教師あり学習です。
違いは、予測するものがカテゴリか数値かです。
クラスタリングは、正解データを使わずに、似ているデータをグループに分けるため、教師なし学習に含まれます。
強化学習とは何が違う?

教師あり学習・教師なし学習と並んで出てくるのが、強化学習です。
強化学習は、行動の結果として得られる報酬をもとに学ぶ方法です。
| 学習方法 | 学び方 |
|---|---|
| 教師あり学習 | 正解を見て学ぶ |
| 教師なし学習 | データの特徴を見つける |
| 強化学習 | 行動して報酬から学ぶ |
たとえば、ゲームAIが高い得点を取る行動を学ぶ場合、強化学習の考え方が使われます。
教師あり学習のように正解を1つずつ教えるのではなく、試行錯誤しながら、より良い行動を選べるようにしていく点が特徴です。
生成AIとはどうつながる?

生成AIを理解するときにも、教師あり学習・教師なし学習の考え方は関係します。
たとえば、事前学習では大量の文章データから言葉の使われ方を学びます。これは、明確な正解ラベルを人間が1つずつ付けるというより、データの中にあるパターンを学ぶ考え方に近いです。
一方で、ファインチューニングやRLHFでは、人間が用意したデータや評価を使って、目的に合うように調整します。
つまり、生成AIでも
| 段階 | 関係する考え方 |
|---|---|
| 事前学習 | 大量データからパターンを学ぶ |
| ファインチューニング | 目的に合わせて追加学習する |
| RLHF | 人間の評価をもとに調整する |
のように、学習方法の考え方がつながっています。
G検定ではどう問われる?
G検定では、細かい数式よりも、どの学習方法に当てはまるかを問われることがあります。
たとえば、次のような見分け方が重要です。
| 問われ方 | 選ぶ学習方法 |
|---|---|
| 正解ラベル付きデータで学習する | 教師あり学習 |
| 犬か猫かを判定する | 分類 |
| 売上や価格を予測する | 回帰 |
| 似た顧客をグループに分ける | クラスタリング |
| 正解なしでデータの構造を見つける | 教師なし学習 |
| 報酬をもとに行動を改善する | 強化学習 |
特に、分類・回帰・クラスタリングの違いは混同しやすいです。
- 「カテゴリを当てるのか」
- 「数値を予測するのか」
- 「似たものをまとめるのか」
この3つで見分けると整理しやすくなります。
まとめ

教師あり学習と教師なし学習の違いは、正解データの有無で考えると整理しやすくなります。
教師あり学習は、正解データを使って予測できるように学ぶ方法です。代表例には、カテゴリを予測する分類と、数値を予測する回帰があります。
教師なし学習は、正解データを使わずに、データの特徴やまとまりを見つける方法です。代表例には、クラスタリングや次元削減があります。
G検定では、用語の定義だけでなく、具体例から学習方法を選ぶ問題が出ることがあります。分類・回帰・クラスタリングを見分けられるようにしておくと、教師あり学習と教師なし学習の違いも理解しやすくなります。
関連記事・おすすめ記事
あわせて読むと、AIの学習方法を流れで整理しやすくなります。
3つの学習方法の全体像を先に整理したい方は、こちらの記事も参考にしてください。

あわせて読むと、AIの学習方法を流れで整理しやすくなります。
3つの学習方法の全体像を先に整理したい方は、こちらの記事も参考にしてください。

教師あり学習のアルゴリズムはどんなものがあるのでしょうか。こちらの記事も参考にしてください。

教師なし学習の手法にはどんなものがあるのでしょうか。こちらの記事も参考にしてください。

教師あり学習で予測と正解のズレをどう扱うのかを知りたい方は、損失関数の記事もあわせて確認してください。

分類モデルの性能をどう評価するのかを知りたい方は、評価指標の記事も参考になります。





