【G検定対策】CNN・RNN・Transformerの違いをわかりやすく整理

seo-webmaster
プロモーションが含まれています

AI・ディープラーニングを学ぶと、次の3つの用語がよく出てきます。

  • CNN
  • RNN
  • Transformer

どれも重要なモデルですが「何が違うのか分かりにくい」と感じる方も多いのではないでしょうか。

G検定では必ずと言っていいほど出題される項目です。

モデルとは『AIがデータをもとに判断するための「仕組み」や「計算のルール」のこと』です。

この記事ではそれぞれの違いを図解イメージでシンプルに整理します。

結論:3つの違いを1分で理解

  • CNN(※1):画像を見るのが得意
  • RNN(※2):時間の流れを理解する
  • Transformer(※3):単語同士の関係を理解する

まずはこの3つを押さえればOKです。

※1:畳み込みニューラルネットワーク
※2:再帰的ニューラルネットワーク
※3:トランスフォーマー

CNNとは?(画像に強いモデル)

CNN(畳み込みニューラルネットワーク)は

 画像の特徴を段階的に抽出するモデル

 画像の特徴を段階的に抽出するモデル

です。

例えば犬の画像なら

  • エッジ(輪郭)
  • パーツ(耳・目)

といった特徴を順番に抽出していきます。

主な用途

  • 画像分類
  • 物体検出
  • 顔認識

RNNとは?(時系列データに強い)

RNN(再帰型ニューラルネットワーク)は

 過去の情報を引き継ぎながら処理するモデル

 過去の情報を引き継ぎながら処理するモデル

です。

文章でいうと

  • 「私は」→「ご飯を」→「食べた」

のように、前の情報が次に影響します。

主な用途

  • 文章生成
  • 音声認識
  • 株価予測

Transformerとは?(言語処理に強い)

Transformerは

 データ全体の関係性を一度に捉えるモデル

 データ全体の関係性を一度に捉えるモデル

です。

従来のRNNは順番に処理していましたが、Transformerは

  • 単語と単語の関係
  • 文全体の意味

を同時に理解できます。

主な用途

  • ChatGPTのような生成AI
  • 翻訳
  • 要約

RNNとTransformerの違い

RNNTransformer 似ているな?と思いませんか?
似ているようですが、ちょっと違います。

RNN(再帰型ニューラルネットワーク)

前から順番に読みながら理解する

  • 「私 → は → ご飯 → を → 食べた」
  • 1つずつ処理する
  • 前の情報を少しずつ引き継ぐ
人間でいうと

音読しながら意味を理解するイメージ

Transformer

すべての単語の関係を一度に見て理解する

  • 単語同士を一気に比較
  • 「ご飯」と「食べた」の関係も即座に把握
人間でいうと

文章全体を一瞬で俯瞰して理解するイメージ

比較表で整理

表で表すとこうなります。

G検定ではどう問われる?

G検定では、用途との対応がよく問われます。

  • 画像 → CNN
  • 時系列 → RNN
  • NLP → Transformer

この対応関係は重要なので覚えておきましょう。

NLPとは「Natural Language Processing(自然言語処理)」の略称

予想問題

※:あくまで予想です

■第1問

画像認識タスクに最も適しているモデルはどれか。

A. RNN
B. CNN
C. Transformer
D. 強化学習

Q
正解(クリックで開きます)
■解答

 B

■解説

CNNは畳み込み処理により画像の特徴(エッジ・形状)を抽出するのが得意
画像系=CNNは鉄板

■第2問

時系列データ(株価・音声など)の処理に最も適したモデルはどれか。

A. CNN
B. RNN
C. Transformer
D. 線形回帰

Q
正解(クリックで開きます)
■解答

 B

■解説

RNNは過去の情報を保持しながら処理する構造
順番が重要なデータ=RNN

■第3問

次の説明として誤っているものはどれか。

A. CNNは画像処理に強い
B. RNNは長期依存関係の問題がある
C. Transformerは並列処理が可能
D. RNNは画像認識に最も適している

Q
正解(クリックで開きます)
■解答

 D

■解説
  • CNN → 画像
  • RNN → 時系列
  • Transformer → 言語・汎用

役割の取り違えが重要ポイント

まとめ

  • CNN → 画像(特徴を見つける)
  • RNN → 時系列(順番に理解する)
  • Transformer → 言語(関係性を一度に理解する)

この3つは、それぞれ得意分野と処理の考え方が異なります。

  • CNNは画像の中から重要な特徴を抽出する
  • RNNはデータの流れや順序を重視して処理する
  • Transformerはデータ全体の関係性を同時に捉える

という違いがあります。

この対応関係を押さえておくだけでも、

 どのモデルがどんな問題に使われるのか

 どのモデルがどんな問題に使われるのか

が一気に理解しやすくなります。

まずはこの3つの違いをしっかり押さえておけば、ディープラーニングの全体像がかなりクリアになります。

関連記事・おすすめ記事

Transformerについてもう少し詳しく整理しました。

関連記事
【G検定対策】Transformerとは?なぜ文章生成が得意なのか?
【G検定対策】Transformerとは?なぜ文章生成が得意なのか?

数は少ないですが予想問題を作成しました。

こちらもおすすめ
【G検定|理解型予想問題】CNN・RNN・Transformer
【G検定|理解型予想問題】CNN・RNN・Transformer

これらのモデルは、単純な計算だけでなく「複雑なパターン」を学習できます。
そのカギとなるのがこちら。

次に読んで欲しい記事
【G検定対策】活性化関数とは?わかりやすく整理
【G検定対策】活性化関数とは?わかりやすく整理

AIには、画像・時系列・文章など、それぞれ得意分野があります。
それらがどのような学習方法で動いているかはこちら。

次に読んで欲しい記事
【G検定対策】教師あり学習・教師なし学習・強化学習の違いをわかりやすく整理
【G検定対策】教師あり学習・教師なし学習・強化学習の違いをわかりやすく整理

どの分野から出題されるか予想しました。

【2026年初旬版】G検定はどの分野からどのくらい出る?受験者目線で割合を整理してみた
【2026年初旬版】G検定はどの分野からどのくらい出る?受験者目線で割合を整理してみた

G検定 合格体験談です。2回目の受験で何とか合格できました。

【合格体験談】G検定は本当に簡単なの!?1回落ちた失敗を踏まえた体験談
【合格体験談】G検定は本当に簡単なの!?1回落ちた失敗を踏まえた体験談

公式テキスト

楽天市場で確認

合格時に使用した問題集

楽天市場で確認

書いている人
運営者
運営者
このブログの運営者(文系出身)です。SEO検定1級、ウェブマスター検定1級を取得しました。ブログ運営には「AIの活用は必須」と思いG検定を取得しました。G検定は簡単といわれがちですが1回目は不合格でした。その失敗経験を元に、これから受験する方の助けになればとできるだけわかりやすくG検定対策は解説しています。間違い等あればご指摘いただければ幸いです。
記事URLをコピーしました