【G検定|理解型予想問題】生成AIの仕組み|事前学習・ファインチューニング・RLHF・RAG・アライメントはなぜ混同する?

生成AIの仕組みを学ぶとき、事前学習、ファインチューニング、RLHF、RAG、アライメントなど、似たように見える用語が一気に登場します。
どれも「AIをよくするための仕組み」に見えるため、名前だけで覚えると混同しやすくなります。
この記事では、生成AIがまず大量データで基礎力を身につけ、その後に目的に合わせて調整され、人間の意図に近づけられ、必要に応じて外部情報で補われる流れを、理解型予想問題で整理します。
単語を暗記するのではなく「どの段階の話か」、「何を改善する話か」で見分けられるようにしていきます。
問題①
事前学習の説明として最も適切なものはどれか?
- A. 人間の評価を使って、好ましい回答を選べるようにすること
- B. 大量のデータから、言葉の使われ方やパターンを学ぶこと
- C. 外部の検索結果を使って、回答に最新情報を加えること
- D. AIの判断理由を人間に説明しやすくすること
- 正解・解説(クリックで開きます)
-
正解
B
解説

事前学習とは、AIが大量の文章データなどから、言葉のつながりや文脈、表現のパターンを学ぶ段階です。
ここで重要なのは、事前学習は特定の仕事だけを覚える段階ではないということです。
たとえば、文章生成、要約、翻訳、質問応答などに使える土台を作るために、まず広い知識や言語パターンを学びます。
なぜ混同する?
事前学習もファインチューニングも、どちらも「学習」です。
そのため、名前だけで覚えると混同しやすくなります。
見分けるポイントは、広く基礎力を作るのが事前学習、特定用途に寄せるのがファインチューニングです。
問題②
ファインチューニングの説明として最も適切なものはどれか?
- A. 大量データで作ったモデルを、特定の目的に合わせて追加調整すること
- B. AIの回答に外部文書を検索して加えること
- C. AIがもっともらしい誤情報を出すこと
- D. AIの出力を人間の価値観に完全一致させること
- 正解・解説(クリックで開きます)
-
正解
A
解説

ファインチューニングとは、すでに事前学習されたモデルを、特定の目的やタスクに合わせて追加で調整することです。
事前学習で作られたモデルは、広く使える基礎力を持っています。
そこに対して、医療、法律、カスタマーサポート、社内文書対応など、目的に合わせたデータでさらに学習させることで、用途に合った出力をしやすくします。
なぜ混同する?
事前学習もファインチューニングも、モデルの中身を変える「学習」です。
ただし、役割は違います。
事前学習は土台作り、ファインチューニングは目的別の調整 です。
問題③
RLHFの説明として最も適切なものはどれか?
- A. AIが検索エンジンの結果を直接表示する仕組み
- B. 人間の評価を使って、より好ましい回答に近づける仕組み
- C. AIの学習データから著作物を完全に取り除く仕組み
- D. AIが文章を単語や記号に分ける仕組み
- 正解・解説(クリックで開きます)
-
正解
B
解説

RLHFは、Reinforcement Learning from Human Feedbackの略で、人間のフィードバックを使ってAIの回答を調整する考え方です。
生成AIは、ただ文章を作れるだけでは十分ではありません。
ユーザーにとってわかりやすい回答、危険性の低い回答、意図に合った回答を出せるように、人間の評価を使って調整します。
なぜ混同する?
RLHFとアライメントはかなり混同しやすいです。
理由は、どちらも人間にとって望ましいAIに近づける話だからです。
ただし、整理すると- RLHFは手法の一つ
- アライメントは目指す方向性
です。
問題④
アライメントの説明として最も適切なものはどれか?
- A. AIの回答を人間の意図や価値観に沿うように整える考え方
- B. AIが外部データベースを検索して回答する仕組み
- C. AIが画像や音声を偽物として生成する技術
- D. AIが大量データから言葉の並びを学ぶ段階
- 正解・解説(クリックで開きます)
-
正解
A
解説

アライメントとは、AIの出力や行動を、人間の意図や価値観、社会的に望ましい方向に沿わせる考え方です。
生成AIは、文章を作る能力が高くても、そのままでは必ずしも人間の意図に合った回答をするとは限りません。
そのため、危険な出力を避ける、ユーザーの目的に合う回答をする、誤解を招きにくくするなどの調整が重要になります。
なぜ混同する?
アライメントは、RLHFやAIガバナンスと混同されやすいです。
特にRLHFとは近い関係にあります。
ただし、アライメントは目的、RLHFはその目的に近づけるための方法の一つと整理すると見分けやすくなります。
問題⑤
RAGの説明として最も適切なものはどれか?
- A. モデルの重みを変更して、特定分野に専門化すること
- B. 外部情報を検索・参照して、回答を補強する仕組み
- C. 人間の評価を使って、好ましい回答に近づけること
- D. AIが人間の価値観を完全に理解すること
- 正解・解説(クリックで開きます)
-
正解
B
解説

RAGは、Retrieval-Augmented Generationの略で、外部情報を検索・参照して生成AIの回答を補う仕組みです。
生成AIは、事前学習した知識だけで回答すると、情報が古かったり、事実と違う内容を出したりすることがあります。
そこで、社内文書、FAQ、データベース、検索結果などを参照しながら回答することで、回答の根拠を補強します。
なぜ混同する?
RAGとファインチューニングは、どちらも「AIを特定用途で使いやすくする方法」に見えます。
ただし違いは明確です。- ファインチューニングはモデルの中身を調整する
- RAGは外部情報を参照して回答を補う
この違いを押さえると混同しにくくなります。
問題⑥
ハルシネーションとRAGの関係として最も適切なものはどれか?
- A. RAGを使えば、ハルシネーションは必ず完全になくなる
- B. RAGは外部情報を参照するため、ハルシネーション対策に役立つ場合がある
- C. ハルシネーションは、RAGを使ったときだけ発生する
- D. RAGは、AIの出力を人間の価値観に合わせるための評価手法である
- 正解・解説(クリックで開きます)
-
正解
B
解説

ハルシネーションとは、生成AIがもっともらしく見える誤情報を出す現象です。
RAGは、外部情報を参照して回答を作るため、ハルシネーションを減らす対策として役立つ場合があります。
ただし、RAGを使えば必ず正しくなるわけではありません。
参照する情報が古い、検索結果が不適切、AIが参照情報を読み違える、といった問題があれば、誤った回答になる可能性はあります。
なぜ混同する?
RAGはハルシネーション対策として紹介されることが多いため、 RAG = 誤情報を完全になくす仕組み と誤解しやすくなります。
正しくは、RAGはハルシネーションを減らす助けになるが、完全に防ぐものではないです。
問題⑦
Zero-shot・One-shot・Few-shotの説明として最も適切なものはどれか?
- A. AIが追加学習なしに、例の数に応じてタスクへ対応する考え方
- B. AIの回答を人間の評価で強化する方法
- C. AIが外部文書を検索して回答する仕組み
- D. AIの判断理由を説明しやすくする技術
- 正解・解説(クリックで開きます)
-
正解
A
解説

Zero-shot、One-shot、Few-shotは、AIに与える例の数によって整理される考え方です。

これは、モデルを追加学習するというより、プロンプト内でどれだけ例を示すかに関係します。
たとえば、Few-shotでは、いくつかの回答例を示してから質問することで、AIが出力形式や意図をつかみやすくなります。なぜ混同する?
Zero-shot・One-shot・Few-shotは、ファインチューニングと混同されやすいです。
どちらも「AIを目的に合わせる」ように見えるからです。
ただし、整理すると- Few-shotは例を見せて答え方を誘導する
- ファインチューニングは追加学習でモデルを調整する
という違いがあります。
問題⑧
生成AIの仕組みの組み合わせとして正しいものはどれか?
- A. 事前学習:外部情報を検索して回答を補う
- B. RLHF:人間の評価を使って回答を調整する
- C. RAG:大量データで基礎力を作る
- D. ファインチューニング:AIの判断理由を説明しやすくする
- 正解・解説(クリックで開きます)
-
正解
B
解説

正しい組み合わせは、RLHF:人間の評価を使って回答を調整するです。
他の選択肢は、用語と役割が入れ替わっています。
生成AIの仕組みは、似た用語が多いため、何を改善する話なのかで整理することが大切です。
生成AIの仕組みを一覧で整理
生成AIの仕組みを一覧で整理したのが下の表です。

まとめ

生成AIの仕組みは、用語を1つずつ暗記しようとすると混同しやすくなります。
特に、事前学習、ファインチューニング、RLHF、RAG、アライメントは、どれも「AIをよくする仕組み」に見えるため、名前だけで覚えると選択肢で迷いやすくなります。
大切なのは、次のように役割で整理することです。
生成AIは、いきなり正確で安全な回答ができるわけではありません。
まず大量データで基礎力を作り、目的に合わせて調整し、人間の評価を使って望ましい回答に近づけ、必要に応じて外部情報で補います。
それでも誤情報を出すことがあるため、ハルシネーションへの注意が必要です。
つまり、生成AIの理解では「どう作られるか」だけでなく、「どう調整されるか」「どう補われるか」「どこで失敗するか」まで流れで見ること が大切です。
関連記事・おすすめ記事
1回目不合格でした。不合格だった原因を分析しました。



