【G検定対策】Attention・Self-Attention・Multi-Head Attentionは何が違う?|Transformerの重要な仕組みを整理

seo-webmaster
プロモーションが含まれています

Transformerを学んでいると

  • Attention
  • Self-Attention
  • Multi-Head Attention

という似た言葉が次々に出てきて、混乱した経験がある人も多いのではないでしょうか。

実際、これらはまったく別の技術というより「Attention」が進化してTransformerの中で使われる形になったもの です。

しかし、名前が似ているため、「何が違うのか?」が分かりにくくなっています。

特にAIの学習をはじめたばかりの人は、「Transformer=Attentionがすごいらしい」という理解で止まりがちですが、Transformerの本質を理解するには

Attention
Self-Attention
Multi-Head Attention

という流れ、を整理しておくことが重要です。

この記事では、それぞれの役割と違いを、流れでわかりやすく整理していきます。

Attentionとは?

Attentionとは、簡単に言うと「重要な部分に注目する仕組み」です。

従来のAIでは、入力全体を同じように扱うことが多かったのですが、実際の文章では「特に重要な単語」があります。

例えば

 「私は昨日、友人と映画を見に行った」

という文章なら

  • 映画
  • 友人
  • 昨日

などが重要な情報になるかもしれません。

Attentionは 入力の中で重要な部分に重みをつけて注目する という考え方です。

これによってAIは「全部を同じように見る」のではなく「ここが重要そうだ」と重点的に見る ことができるようになりました。

Self-Attentionとは?

Attentionの考え方をさらに進化させたのが Self-Attention です。

普通のAttentionは「ある入力が、別の情報を見て重要度を決める」という仕組みでした。

一方、Self-Attentionは「文章の中の単語同士がお互いを見て関係を判断する」仕組みです。

例えば

 「私は学校に行った。そこで勉強した。

この文章で「そこで」は何を指しているのか?Self-Attentionは、文章全体を見て

そこで
学校

という関係を判断します。

つまり

  • 単語Aが単語Bを見る
  • 単語Bが単語Cを見る
  • 単語Cが単語Aを見る

というように、文の中の単語同士が相互に関連を見る のがSelf-Attentionです。

これがTransformerの中心技術です。

Multi-Head Attentionとは?

Self-Attentionだけでも便利ですが、問題があります。

それは

 1つの見方しかできない

ということです。

例えば文章には

  • 主語と述語の関係
  • 時系列の関係
  • 意味の近さ
  • 文法の関係

など、複数の見方があります。

そこで登場したのが

 Multi-Head Attention

です。

これは

 複数のSelf-Attentionを同時に動かして、違う視点で見る

仕組みです。

イメージとしては

1つ目のHead
文法を見る
2つ目のHead
意味を見る
3つ目のHead
時系列を見る

1つ目のHead → 文法を見る
2つ目のHead → 意味を見る
3つ目のHead → 時系列を見る

のように

 複数の視点で同時に関連を分析する

ことができます。

これによって、1つの見方だけでは見えない複雑な関係も理解しやすくなりました。

3つの違いを一覧で整理

シンプルに言うと

Attention
注目する考え方
Self-Attention
文の中で単語同士を見る
Multi-Head Attention
複数の視点で
同時に行う

という関係です。

Transformerでなぜ重要なのか?

RNNは 1文字ずつ順番に処理していました

そのため

  • 長文を忘れやすい
  • 並列処理が苦手
  • 関係が遠い単語を見つけにくい

という問題がありました。

Transformerは、Self-Attentionを使うことで

 文章全体を一気に見て、単語同士の関係を判断する

ことができるようになりました。

さらに、Multi-Head Attentionによって

 複数の視点で同時に理解する

ことができるようになりました。

これが、Transformerが革命的だった理由の1つです。

なぜ混同しやすいのか?

この3つが混同しやすい理由は、

「名前が似ていて、進化した関係にある」

からです。

Attention
基本の考え方
Self-Attention
Attentionを文章内部に使う
Multi-Head Attention
Self-Attentionを複数化する

Attention
→ 基本の考え方

Self-Attention
→ Attentionを文章内部に使う

Multi-Head Attention
→ Self-Attentionを複数化する

つまり、

別々の技術というより、

 発展していく流れ

なのです。

そのため、名前だけ見ると違いが分かりにくくなります。

GPTではどう使われているのか?

GPTはTransformerをベースにしています。

GPT内部では

文章をトークン化する
単語埋め込みをする
Self-Attentionで関連を見る
Multi-Head Attentionで
複数視点で分析する
次の単語を予測する

文章をトークン化する

Embeddingする

位置情報を追加する

Self-Attentionで関連を見る

Multi-Head Attentionで複数視点で分析する

次の単語を予測する

という流れが起きています。

つまり、GPTが「文脈を読む」ために重要なのが、

 Self-AttentionとMulti-Head Attention

なのです。

これがなければ、GPTは文章全体の関係を理解しにくくなります。

G検定ではどう問われる?

G検定では「Transformerの特徴」として問われることが多いです。

例えば

  • Transformerで重要な技術は何か
  • Self-Attentionの役割は何か
  • RNNとの違いは何か
  • Multi-Head Attentionの目的は何か

といった形で出題される可能性があります。

特に注意したいのは、Attention = Transformerそのもの ではない ことです。

Attentionは考え方であり、Transformerでは Self-AttentionやMulti-Head Attentionとして実装されている という理解が重要です。

まとめ

Attention・Self-Attention・Multi-Head Attentionは、名前が似ているため混同しやすいですが、役割は少しずつ違います。

Attentionは 重要な部分に注目する考え方 です。

Self-Attentionは 文章の中の単語同士がお互いを見て関係を判断する仕組み です。

Multi-Head Attentionは それを複数の視点で同時に行う仕組み です。

この流れを理解すると

Attention
Self-Attention
Multi-Head Attention
Transformer
GPT

というつながりが見えてきます。

AIは単語を暗記して理解するのではなく

 「どことどこが関係しているか」を見て理解している

その中心にあるのが、この技術たちです。

TransformerやGPTを本当に理解するためにも、この3つの違いは整理しておくことが重要です。

関連記事・おすすめ記事

Transformerの全体像から理解したい方はこちらをご覧ください。

関連記事
【G検定対策】GPTとは?|Transformerとの違いからわかりやすく整理
【G検定対策】GPTとは?|Transformerとの違いからわかりやすく整理

Attentionの基本から整理したい方はこちらをご覧ください。

関連記事
【G検定対策】Attentionとは?|なぜTransformerで重要になったのかをわかりやすく整理
【G検定対策】Attentionとは?|なぜTransformerで重要になったのかをわかりやすく整理

GPTでどう使われているか知りたい方はこちらをご覧ください。

関連記事
【G検定対策】GPTとは?|Transformerとの違いからわかりやすく整理
【G検定対策】GPTとは?|Transformerとの違いからわかりやすく整理

公式テキスト

Amazonで確認

楽天市場で確認

合格時に使用した問題集

Amazonで確認

楽天市場で確認

書いている人
運営者
運営者
このブログの運営者(文系出身)です。SEO検定1級、ウェブマスター検定1級を取得しました。ブログ運営には「AIの活用は必須」と思いG検定を取得しました。G検定は簡単といわれがちですが1回目は不合格でした。その失敗経験を元に、これから受験する方の助けになればとできるだけわかりやすくG検定対策は解説しています。間違い等あればご指摘いただければ幸いです。
記事URLをコピーしました