【G検定対策】CNN・RNN・Transformerの違いを図解で整理

ディープラーニングを学ぶと、次の3つの用語がよく出てきます。
- CNN
- RNN
- Transformer
どれも重要なモデルですが「何が違うのか分かりにくい」と感じる方も多いのではないでしょうか。G検定では必ずと言っていいほど出題される項目です。
モデルとは『AIがデータをもとに判断するための「仕組み」や「計算のルール」のこと』です。
この記事では、それぞれの違いを図解イメージでシンプルに整理します。
結論:3つの違いを1分で理解

- CNN:画像を見るのが得意
- RNN:時間の流れを理解する
- Transformer:単語同士の関係を理解する
まずはこの3つを押さえればOKです。
CNNとは?(画像に強いモデル)

CNN(畳み込みニューラルネットワーク)は
画像の特徴を段階的に抽出するモデル
画像の特徴を段階的に抽出するモデル
です。
例えば犬の画像なら
- エッジ(輪郭)
- 形
- パーツ(耳・目)
といった特徴を順番に抽出していきます。
主な用途
- 画像分類
- 物体検出
- 顔認識
RNNとは?(時系列データに強い)

RNN(再帰型ニューラルネットワーク)は
過去の情報を引き継ぎながら処理するモデル
過去の情報を引き継ぎながら処理するモデル
です。
文章でいうと
- 「私は」→「ご飯を」→「食べた」
のように、前の情報が次に影響します。
主な用途
- 文章生成
- 音声認識
- 株価予測
Transformerとは?(言語処理に強い)

Transformerは
データ全体の関係性を一度に捉えるモデル
データ全体の関係性を一度に捉えるモデル
です。
従来のRNNは順番に処理していましたが、Transformerは
- 単語と単語の関係
- 文全体の意味
を同時に理解できます。
主な用途
- ChatGPTのような生成AI
- 翻訳
- 要約
RNNとTransformerの違い

RNN と Transformer 似ているな?と思いませんか?
似ているようですが、ちょっと違います。
RNN(再帰型ニューラルネットワーク)
- 「私 → は → ご飯 → を → 食べた」
- 1つずつ処理する
- 前の情報を少しずつ引き継ぐ
Transformer
- 単語同士を一気に比較
- 「ご飯」と「食べた」の関係も即座に把握
比較表で整理
表で表すとこうなります。

G検定ではどう問われる?
G検定では、用途との対応がよく問われます。
- 画像 → CNN
- 時系列 → RNN
- NLP → Transformer
この対応関係は頻出なので覚えておきましょう。
NLPとは「Natural Language Processing(自然言語処理)」の略称
まとめ

- CNN → 画像
- RNN → 時系列
- Transformer → 言語
この3つを理解すれば、ディープラーニングの全体像がかなりクリアになります。
関連記事・おすすめ記事
機械学習とディープラーニングの違いを整理しました。

教師あり学習・教師なし学習・強化学習の違いを整理しました。

どの分野から出題されるか予想しました。

G検定 合格体験談です。2回目の受験で何とか合格できました。




