2026.06.10

【G検定対策】CNN・RNN・Transformerの違いをわかりやすく整理

seo-webmaster

プロモーションが含まれています

AI・ディープラーニングを学ぶと、次の3つの用語がよく出てきます。

CNN
RNN
Transformer

どれも重要なモデルですが「何が違うのか分かりにくい」と感じる方も多いのではないでしょうか。

G検定では必ずと言っていいほど出題される項目です。

モデルとは『AIがデータをもとに判断するための「仕組み」や「計算のルール」のこと』です。

この記事ではそれぞれの違いを図解イメージでシンプルに整理します。

画像の文字が多いのでパソコンでご覧になることおおすすめします。
クリックすると画像が拡大表示されます。

ジャンプするもくじ

CNN・RNN・Transformerとは？
CNNとは？（画像に強いモデル）
RNNとは？（時系列データに強い）
Transformerとは？（言語処理に強い）
1. RNNとTransformerの違い
比較表で整理
G検定ではどう問われる？
1. 予想問題
まとめ
関連記事・おすすめ記事

CNN・RNN・Transformerとは？

CNN（※1）

：

画像を見るのが得意

RNN（※2）

：

時間の流れを理解する

Transformer（※3）

：

単語同士の関係を理解する

まずはこの3つを押さえればOKです。

※1：畳み込みニューラルネットワーク
※2：再帰的ニューラルネットワーク
※3：トランスフォーマー

CNNとは？（画像に強いモデル）

CNN（畳み込みニューラルネットワーク）は

　画像の特徴を段階的に抽出するモデル

です。

例えば犬の画像なら

エッジ（輪郭）
形
パーツ（耳・目）

といった特徴を順番に抽出していきます。

主な用途

画像分類
物体検出
顔認識

RNNとは？（時系列データに強い）

RNN（再帰型ニューラルネットワーク）は

　過去の情報を引き継ぎながら処理するモデル

です。

文章でいうと

「私は」→「ご飯を」→「食べた」

のように、前の情報が次に影響します。

主な用途

文章生成
音声認識
株価予測

Transformerとは？（言語処理に強い）

Transformerは

　データ全体の関係性を一度に捉えるモデル

です。

従来のRNNは順番に処理していましたが、Transformerは

単語と単語の関係
文全体の意味

を同時に理解できます。

主な用途

ChatGPTのような生成AI
翻訳
要約

RNNとTransformerの違い

RNN と Transformer 似ているな？と思いませんか？
似ているようですが、ちょっと違います。

RNN（再帰型ニューラルネットワーク）

前から順番に読みながら理解する

「私 → は → ご飯 → を → 食べた」
1つずつ処理する
前の情報を少しずつ引き継ぐ

人間でいうと

音読しながら意味を理解するイメージ

Transformer

すべての単語の関係を一度に見て理解する

単語同士を一気に比較
「ご飯」と「食べた」の関係も即座に把握

人間でいうと

文章全体を一瞬で俯瞰して理解するイメージ

比較表で整理

表でするとこうなります。

G検定ではどう問われる？

G検定では、用途との対応がよく問われます。

画像

→

CNN

時系列

→

RNN

NLP

→

Transformer

この対応関係は重要なので覚えておきましょう。

NLPとは「Natural Language Processing（自然言語処理）」の略称

予想問題

※：あくまで予想です

■第1問

画像認識タスクに最も適しているモデルはどれか。

A. RNN
B. CNN
C. Transformer
D. 強化学習

正解（クリックで開きます）

■解答

■解説

CNNは畳み込み処理により画像の特徴（エッジ・形状）を抽出するのが得意。
画像系＝CNNは鉄板

■第2問

時系列データ（株価・音声など）の処理に最も適したモデルはどれか。

A. CNN
B. RNN
C. Transformer
D. 線形回帰

正解（クリックで開きます）

■解答

■解説

RNNは過去の情報を保持しながら処理する構造。
順番が重要なデータ＝RNN

■第3問

次の説明として誤っているものはどれか。

A. CNNは画像処理に強い
B. RNNは長期依存関係の問題がある
C. Transformerは並列処理が可能
D. RNNは画像認識に最も適している

正解（クリックで開きます）

■解答

■解説

CNN → 画像
RNN → 時系列
Transformer → 言語・汎用

役割の取り違えが重要ポイント

まとめ

CNN

→

画像（特徴を見つける）

RNN

→

時系列（順番に理解する）

Transformer

→

言語（関係性を一度に理解する）

この3つは、それぞれ得意分野と処理の考え方が異なります。

CNNは画像の中から重要な特徴を抽出する
RNNはデータの流れや順序を重視して処理する
Transformerはデータ全体の関係性を同時に捉える

という違いがあります。

この対応関係を押さえておくだけでも、

　どのモデルがどんな問題に使われるのか

が一気に理解しやすくなります。

まずはこの3つの違いをしっかり押さえておけば、ディープラーニングの全体像がかなりクリアになります。

関連記事・おすすめ記事

Transformerについてもう少し詳しく整理しました。

【G検定対策】Transformerとは？なぜ文章生成が得意なのか？

数は少ないですが予想問題を作成しました。

【G検定｜理解型予想問題】CNN・RNN・Transformer

これらのモデルは、単純な計算だけでなく「複雑なパターン」を学習できます。
そのカギとなるのがこちら。

【G検定対策】活性化関数とは？わかりやすく整理

AIには、画像・時系列・文章など、それぞれ得意分野があります。
それらがどのような学習方法で動いているかはこちら。

【G検定対策】教師あり学習・教師なし学習・強化学習の違いをわかりやすく整理

どの分野から出題されるか予想しました。

【2026年初旬版】G検定はどの分野からどのくらい出る？受験者目線で割合を整理してみた

G検定合格体験談です。2回目の受験で何とか合格できました。

【合格体験談】G検定は本当に簡単なの！？1回落ちた失敗を踏まえた体験談

重要用語をチェックシートとしてまとめました。

【G検定対策】CNN・RNN・Transformerの違いをわかりやすく整理

CNN・RNN・Transformerとは？

CNNとは？（画像に強いモデル）

RNNとは？（時系列データに強い）

Transformerとは？（言語処理に強い）

RNNとTransformerの違い

RNN（再帰型ニューラルネットワーク）

Transformer

比較表で整理

G検定ではどう問われる？

予想問題

■第1問

■解答

■解説

■第2問

■解答

■解説

■第3問

■解答

■解説

まとめ

関連記事・おすすめ記事

【G検定対策】アンサンブル学習とは？｜なぜ複数のAIを組み合わせるのか？

【G検定対策】単語埋め込み（Embedding）とは？

【G検定対策】ニューラルネットワークとは？

【G検定対策】事前学習（Pre-training）とは？｜LLMはどうやって大量知識を身につけるのか