【G検定対策】CNN・RNN・Transformerの違いをわかりやすく整理

AI・ディープラーニングを学ぶと、次の3つの用語がよく出てきます。
- CNN
- RNN
- Transformer
どれも重要なモデルですが「何が違うのか分かりにくい」と感じる方も多いのではないでしょうか。
G検定では必ずと言っていいほど出題される項目です。
モデルとは『AIがデータをもとに判断するための「仕組み」や「計算のルール」のこと』です。
この記事ではそれぞれの違いを図解イメージでシンプルに整理します。
結論:3つの違いを1分で理解

- CNN(※1):画像を見るのが得意
- RNN(※2):時間の流れを理解する
- Transformer(※3):単語同士の関係を理解する
まずはこの3つを押さえればOKです。
※1:畳み込みニューラルネットワーク
※2:再帰的ニューラルネットワーク
※3:トランスフォーマー
CNNとは?(画像に強いモデル)

CNN(畳み込みニューラルネットワーク)は
画像の特徴を段階的に抽出するモデル
画像の特徴を段階的に抽出するモデル
です。
例えば犬の画像なら
- エッジ(輪郭)
- 形
- パーツ(耳・目)
といった特徴を順番に抽出していきます。
主な用途
- 画像分類
- 物体検出
- 顔認識
RNNとは?(時系列データに強い)

RNN(再帰型ニューラルネットワーク)は
過去の情報を引き継ぎながら処理するモデル
過去の情報を引き継ぎながら処理するモデル
です。
文章でいうと
- 「私は」→「ご飯を」→「食べた」
のように、前の情報が次に影響します。
主な用途
- 文章生成
- 音声認識
- 株価予測
Transformerとは?(言語処理に強い)

Transformerは
データ全体の関係性を一度に捉えるモデル
データ全体の関係性を一度に捉えるモデル
です。
従来のRNNは順番に処理していましたが、Transformerは
- 単語と単語の関係
- 文全体の意味
を同時に理解できます。
主な用途
- ChatGPTのような生成AI
- 翻訳
- 要約
RNNとTransformerの違い

RNN と Transformer 似ているな?と思いませんか?
似ているようですが、ちょっと違います。
RNN(再帰型ニューラルネットワーク)
- 「私 → は → ご飯 → を → 食べた」
- 1つずつ処理する
- 前の情報を少しずつ引き継ぐ
Transformer
- 単語同士を一気に比較
- 「ご飯」と「食べた」の関係も即座に把握
比較表で整理
表で表すとこうなります。

G検定ではどう問われる?
G検定では、用途との対応がよく問われます。
- 画像 → CNN
- 時系列 → RNN
- NLP → Transformer
この対応関係は重要なので覚えておきましょう。
NLPとは「Natural Language Processing(自然言語処理)」の略称
予想問題
※:あくまで予想です
■第1問
画像認識タスクに最も適しているモデルはどれか。
A. RNN
B. CNN
C. Transformer
D. 強化学習
- 正解(クリックで開きます)
-
■解答
B
■解説
CNNは畳み込み処理により画像の特徴(エッジ・形状)を抽出するのが得意。
画像系=CNNは鉄板
■第2問
時系列データ(株価・音声など)の処理に最も適したモデルはどれか。
A. CNN
B. RNN
C. Transformer
D. 線形回帰
- 正解(クリックで開きます)
-
■解答
B
■解説
RNNは過去の情報を保持しながら処理する構造。
順番が重要なデータ=RNN
■第3問
次の説明として誤っているものはどれか。
A. CNNは画像処理に強い
B. RNNは長期依存関係の問題がある
C. Transformerは並列処理が可能
D. RNNは画像認識に最も適している
- 正解(クリックで開きます)
-
■解答
D
■解説
- CNN → 画像
- RNN → 時系列
- Transformer → 言語・汎用
役割の取り違えが重要ポイント
まとめ

- CNN → 画像(特徴を見つける)
- RNN → 時系列(順番に理解する)
- Transformer → 言語(関係性を一度に理解する)
この3つは、それぞれ得意分野と処理の考え方が異なります。
- CNNは画像の中から重要な特徴を抽出する
- RNNはデータの流れや順序を重視して処理する
- Transformerはデータ全体の関係性を同時に捉える
という違いがあります。
この対応関係を押さえておくだけでも、
どのモデルがどんな問題に使われるのか
どのモデルがどんな問題に使われるのか
が一気に理解しやすくなります。
まずはこの3つの違いをしっかり押さえておけば、ディープラーニングの全体像がかなりクリアになります。
関連記事・おすすめ記事
Transformerについてもう少し詳しく整理しました。

数は少ないですが予想問題を作成しました。

これらのモデルは、単純な計算だけでなく「複雑なパターン」を学習できます。
そのカギとなるのがこちら。

AIには、画像・時系列・文章など、それぞれ得意分野があります。
それらがどのような学習方法で動いているかはこちら。

どの分野から出題されるか予想しました。

G検定 合格体験談です。2回目の受験で何とか合格できました。



