G検定モデル一覧マップ

領域1画像（Computer Vision）

🏷️ 画像分類（Classification）

LeNet

1998年 / LeCun

CNNの原点。手書き数字認識。畳み込み+プーリングの基本構造を確立

CNN

AlexNet

2012年 / ILSVRC優勝

深層学習ブームの火付け役。ReLU・Dropout・GPUを活用。8層

CNN

VGGNet

2014年 / ILSVRC 2位

3×3の小さいフィルターを積み重ねてシンプルに深く。VGG16/VGG19

CNN

GoogLeNet (Inception)

2014年 / ILSVRC優勝

Inceptionモジュールで複数サイズのフィルターを並列実行。22層

CNN

ResNet

2015年 / ILSVRC優勝

スキップ結合で152層を実現。残差学習で勾配消失を解決。人間超えの精度

CNN

DenseNet

2017年

各層を全ての後続層に直接接続（Dense Connection）。ResNetの発展形

CNN

EfficientNet

2019年

深さ・幅・解像度を最適バランスでスケーリング。高効率

CNN

ViT (Vision Transformer)

2020年

画像をパッチに分割してTransformerで処理。CNNを使わない画像分類

Transformer

📦 物体検出（Object Detection）

R-CNN

2014年

領域候補を切り出してCNNで分類。物体検出にCNNを適用した先駆け

CNN

Fast R-CNN

2015年

画像全体を一度だけCNNに通して高速化。R-CNNの改良版

CNN

Faster R-CNN

2015年

RPN（Region Proposal Network）で領域候補もCNNで生成。End-to-End学習

CNN

YOLO

2016年〜

画像全体を一度見るだけで検出（You Only Look Once）。リアルタイム処理が可能

CNN

SSD

2016年

複数スケールの特徴マップで同時に検出。YOLOと並ぶリアルタイム手法

CNN

🎨 セグメンテーション

FCN

2015年

全結合層を畳み込み層に置換。セマンティックセグメンテーションの元祖

CNN

SegNet

2015年

エンコーダ・デコーダ構造でセグメンテーション。プーリングのインデックスを保存して復元

CNN

U-Net

2015年

エンコーダ・デコーダ＋スキップ結合。医療画像で特に有名。U字型構造

CNN

Mask R-CNN

2017年

Faster R-CNN + マスク予測。インスタンスセグメンテーションの代表

CNN

✨ 画像生成（Generation）

オートエンコーダ (AE)

—

入力を圧縮して復元。次元削減・特徴抽出・異常検知に使用

CNN

VAE

2013年

潜在空間を正規分布に強制。AEと違い新しい画像を生成できる

CNN

GAN

2014年 / Goodfellow

Generator（生成）とDiscriminator（判別）が競い合って学習

GAN

DCGAN

2015年

GANにCNNを組み込んだ構造。安定した画像生成を実現

GANCNN

CycleGAN

2017年

ペアデータなしで画像変換（馬→シマウマ等）。サイクル一貫性損失

GAN

拡散モデル (Diffusion)

2020年〜

ノイズを段階的に除去して画像生成。Stable Diffusion, DALL-Eの基盤

Diffusion

🔧 その他の画像タスク

Neural Style Transfer

2015年

画風変換。CNNの中間特徴を使いコンテンツとスタイルを分離・合成

CNN

OpenPose

2017年

姿勢推定。人の関節位置をリアルタイム検出

CNN

SRGAN / ESRGAN

2017年 / 2018年

超解像。低解像度画像から高解像度画像を生成

GAN

領域2自然言語処理（NLP）

📖 テキスト理解（分類・質問応答・感情分析）

Word2Vec

2013年 / Google

単語をベクトルに変換（分散表現）。CBOW / Skip-gramの2方式

埋め込み

fastText

2016年 / Facebook

サブワード（部分文字列）単位で学習。未知語にも対応可能

埋め込み

ELMo

2018年

文脈に応じて単語ベクトルが変化する。双方向LSTM使用

RNN

BERT

2018年 / Google

Transformerのエンコーダのみ。双方向の文脈理解。事前学習+ファインチューニング

Transformer

✍️ テキスト生成（文章生成・対話）

GPT / GPT-2 / GPT-3 / GPT-4

2018年〜 / OpenAI

Transformerのデコーダのみ。次の単語を予測して文章を生成。大規模化で汎用能力獲得

Transformer

🔄 翻訳・要約（Seq2Seq系）

Seq2Seq

2014年

RNNベースのエンコーダ・デコーダ。機械翻訳の基盤

RNN

Seq2Seq + Attention

2015年 / Bahdanau

Seq2SeqにAttention機構を追加。長文翻訳の精度向上

RNN

Transformer

2017年 / Google

Attention Is All You Need。RNN不要。エンコーダ+デコーダ。全NLPの基盤に

Transformer

T5

2019年 / Google

全タスクを「テキスト→テキスト」として統一。Transformerのエンコーダ+デコーダ

Transformer

BART

2019年 / Facebook

ノイズ除去型事前学習。要約タスクに特に強い。エンコーダ+デコーダ

Transformer

🔗 RNN系アーキテクチャ（NLPの基盤技術）

RNN

—

系列データの基本構造。過去の情報を隠れ状態で保持。勾配消失が課題

RNN

LSTM

1997年

ゲート機構で長期依存を学習。忘却ゲート・入力ゲート・出力ゲート

RNN

GRU

2014年

LSTMを簡略化。リセットゲート・更新ゲートの2つ。計算が軽い

RNN

領域3音声（Speech）

🎤 音声認識（Speech → Text）

CTC (Connectionist Temporal Classification)

2006年

入力と出力の長さが異なる系列を学習する手法。音声認識の基盤技術

RNN

DeepSpeech

2014年 / Baidu

RNN+CTCベースの音声認識。End-to-Endで音声→テキスト

RNN

Whisper

2022年 / OpenAI

Transformerベースの音声認識。多言語対応。大規模データで学習

Transformer

🔊 音声合成（Text → Speech）

WaveNet

2016年 / DeepMind

音声波形を直接生成するCNNモデル。自然な音声合成を実現

CNN

Tacotron / Tacotron 2

2017年 / Google

テキストからメルスペクトログラムを生成。Seq2Seqベースの音声合成

RNNCNN

領域4強化学習（Reinforcement Learning）

🎮 ゲームAI・ロボット制御

DQN

2013年 / DeepMind

Q学習にCNNを組み合わせ。Atariゲームで人間超えの性能

強化学習CNN

AlphaGo

2016年 / DeepMind

CNN + モンテカルロ木探索で囲碁のプロ棋士に勝利

強化学習CNN

AlphaGo Zero

2017年 / DeepMind

人間の棋譜なしで自己対戦のみで学習。AlphaGoを超える強さ

強化学習

AlphaZero

2018年 / DeepMind

囲碁・チェス・将棋を同じアルゴリズムで汎用的に学習

強化学習

A3C

2016年

非同期で複数の環境を並列に学習。Actor-Criticベース

強化学習

PPO

2017年 / OpenAI

安定した方策勾配法。ChatGPTのRLHF（人間フィードバック）でも使用

強化学習

補足マルチモーダル（複数領域の融合）

複数の領域（画像+テキストなど）を横断するモデルも近年重要になっています。

CLIP

2021年 / OpenAI

画像とテキストを同じ空間に埋め込み。テキストで画像検索が可能

TransformerCNN

DALL-E / DALL-E 2

2021年〜 / OpenAI

テキストから画像を生成。CLIPと拡散モデルの組み合わせ

TransformerDiffusion

Stable Diffusion

2022年

オープンソースのテキスト→画像生成。潜在空間での拡散モデル

Diffusion

GPT-4V / Gemini

2023年〜

テキスト+画像+音声を統合的に理解・生成するマルチモーダルLLM

Transformer

📋 全体まとめ

G検定で特に問われやすいモデル

領域	最重要モデル	覚えるべきキーワード
画像	AlexNet → VGG → GoogLeNet → ResNet の進化	ILSVRC、スキップ結合、Inception
	R-CNN → Fast R-CNN → Faster R-CNN の進化	RPN、バウンディングボックス
	GAN、VAE、拡散モデル	Generator/Discriminator、潜在空間、ノイズ除去
言語	RNN → LSTM → Seq2Seq → Transformer の進化	勾配消失、ゲート機構、Attention
	BERT（エンコーダ）/ GPT（デコーダ）	事前学習、ファインチューニング
音声	WaveNet、Whisper	波形生成、End-to-End
強化学習	DQN、AlphaGo → AlphaGo Zero → AlphaZero	Q学習、自己対戦、モンテカルロ木探索

G検定 モデル一覧マップ

領域1画像（Computer Vision）

領域2自然言語処理（NLP）

領域3音声（Speech）

領域4強化学習（Reinforcement Learning）

補足マルチモーダル（複数領域の融合）

📋 全体まとめ

G検定で特に問われやすいモデル

G検定モデル一覧マップ