G検定 モデル一覧マップ

4領域 × タスクごとに主要モデルを整理

領域1画像(Computer Vision)

🏷️ 画像分類(Classification)
LeNet
1998年 / LeCun
CNNの原点。手書き数字認識。畳み込み+プーリングの基本構造を確立
CNN
AlexNet
2012年 / ILSVRC優勝
深層学習ブームの火付け役。ReLU・Dropout・GPUを活用。8層
CNN
VGGNet
2014年 / ILSVRC 2位
3×3の小さいフィルターを積み重ねてシンプルに深く。VGG16/VGG19
CNN
GoogLeNet (Inception)
2014年 / ILSVRC優勝
Inceptionモジュールで複数サイズのフィルターを並列実行。22層
CNN
ResNet
2015年 / ILSVRC優勝
スキップ結合で152層を実現。残差学習で勾配消失を解決。人間超えの精度
CNN
DenseNet
2017年
各層を全ての後続層に直接接続(Dense Connection)。ResNetの発展形
CNN
EfficientNet
2019年
深さ・幅・解像度を最適バランスでスケーリング。高効率
CNN
ViT (Vision Transformer)
2020年
画像をパッチに分割してTransformerで処理。CNNを使わない画像分類
Transformer
📦 物体検出(Object Detection)
R-CNN
2014年
領域候補を切り出してCNNで分類。物体検出にCNNを適用した先駆け
CNN
Fast R-CNN
2015年
画像全体を一度だけCNNに通して高速化。R-CNNの改良版
CNN
Faster R-CNN
2015年
RPN(Region Proposal Network)で領域候補もCNNで生成。End-to-End学習
CNN
YOLO
2016年〜
画像全体を一度見るだけで検出(You Only Look Once)。リアルタイム処理が可能
CNN
SSD
2016年
複数スケールの特徴マップで同時に検出。YOLOと並ぶリアルタイム手法
CNN
🎨 セグメンテーション
FCN
2015年
全結合層を畳み込み層に置換。セマンティックセグメンテーションの元祖
CNN
SegNet
2015年
エンコーダ・デコーダ構造でセグメンテーション。プーリングのインデックスを保存して復元
CNN
U-Net
2015年
エンコーダ・デコーダ+スキップ結合。医療画像で特に有名。U字型構造
CNN
Mask R-CNN
2017年
Faster R-CNN + マスク予測。インスタンスセグメンテーションの代表
CNN
✨ 画像生成(Generation)
オートエンコーダ (AE)
入力を圧縮して復元。次元削減・特徴抽出・異常検知に使用
CNN
VAE
2013年
潜在空間を正規分布に強制。AEと違い新しい画像を生成できる
CNN
GAN
2014年 / Goodfellow
Generator(生成)とDiscriminator(判別)が競い合って学習
GAN
DCGAN
2015年
GANにCNNを組み込んだ構造。安定した画像生成を実現
GANCNN
CycleGAN
2017年
ペアデータなしで画像変換(馬→シマウマ等)。サイクル一貫性損失
GAN
拡散モデル (Diffusion)
2020年〜
ノイズを段階的に除去して画像生成。Stable Diffusion, DALL-Eの基盤
Diffusion
🔧 その他の画像タスク
Neural Style Transfer
2015年
画風変換。CNNの中間特徴を使いコンテンツとスタイルを分離・合成
CNN
OpenPose
2017年
姿勢推定。人の関節位置をリアルタイム検出
CNN
SRGAN / ESRGAN
2017年 / 2018年
超解像。低解像度画像から高解像度画像を生成
GAN

領域2自然言語処理(NLP)

📖 テキスト理解(分類・質問応答・感情分析)
Word2Vec
2013年 / Google
単語をベクトルに変換(分散表現)。CBOW / Skip-gramの2方式
埋め込み
fastText
2016年 / Facebook
サブワード(部分文字列)単位で学習。未知語にも対応可能
埋め込み
ELMo
2018年
文脈に応じて単語ベクトルが変化する。双方向LSTM使用
RNN
BERT
2018年 / Google
Transformerのエンコーダのみ。双方向の文脈理解。事前学習+ファインチューニング
Transformer
✍️ テキスト生成(文章生成・対話)
GPT / GPT-2 / GPT-3 / GPT-4
2018年〜 / OpenAI
Transformerのデコーダのみ。次の単語を予測して文章を生成。大規模化で汎用能力獲得
Transformer
🔄 翻訳・要約(Seq2Seq系)
Seq2Seq
2014年
RNNベースのエンコーダ・デコーダ。機械翻訳の基盤
RNN
Seq2Seq + Attention
2015年 / Bahdanau
Seq2SeqにAttention機構を追加。長文翻訳の精度向上
RNN
Transformer
2017年 / Google
Attention Is All You Need。RNN不要。エンコーダ+デコーダ。全NLPの基盤に
Transformer
T5
2019年 / Google
全タスクを「テキスト→テキスト」として統一。Transformerのエンコーダ+デコーダ
Transformer
BART
2019年 / Facebook
ノイズ除去型事前学習。要約タスクに特に強い。エンコーダ+デコーダ
Transformer
🔗 RNN系アーキテクチャ(NLPの基盤技術)
RNN
系列データの基本構造。過去の情報を隠れ状態で保持。勾配消失が課題
RNN
LSTM
1997年
ゲート機構で長期依存を学習。忘却ゲート・入力ゲート・出力ゲート
RNN
GRU
2014年
LSTMを簡略化。リセットゲート・更新ゲートの2つ。計算が軽い
RNN

領域3音声(Speech)

🎤 音声認識(Speech → Text)
CTC (Connectionist Temporal Classification)
2006年
入力と出力の長さが異なる系列を学習する手法。音声認識の基盤技術
RNN
DeepSpeech
2014年 / Baidu
RNN+CTCベースの音声認識。End-to-Endで音声→テキスト
RNN
Whisper
2022年 / OpenAI
Transformerベースの音声認識。多言語対応。大規模データで学習
Transformer
🔊 音声合成(Text → Speech)
WaveNet
2016年 / DeepMind
音声波形を直接生成するCNNモデル。自然な音声合成を実現
CNN
Tacotron / Tacotron 2
2017年 / Google
テキストからメルスペクトログラムを生成。Seq2Seqベースの音声合成
RNNCNN

領域4強化学習(Reinforcement Learning)

🎮 ゲームAI・ロボット制御
DQN
2013年 / DeepMind
Q学習にCNNを組み合わせ。Atariゲームで人間超えの性能
強化学習CNN
AlphaGo
2016年 / DeepMind
CNN + モンテカルロ木探索で囲碁のプロ棋士に勝利
強化学習CNN
AlphaGo Zero
2017年 / DeepMind
人間の棋譜なしで自己対戦のみで学習。AlphaGoを超える強さ
強化学習
AlphaZero
2018年 / DeepMind
囲碁・チェス・将棋を同じアルゴリズムで汎用的に学習
強化学習
A3C
2016年
非同期で複数の環境を並列に学習。Actor-Criticベース
強化学習
PPO
2017年 / OpenAI
安定した方策勾配法。ChatGPTのRLHF(人間フィードバック)でも使用
強化学習

補足マルチモーダル(複数領域の融合)

複数の領域(画像+テキストなど)を横断するモデルも近年重要になっています。

CLIP
2021年 / OpenAI
画像とテキストを同じ空間に埋め込み。テキストで画像検索が可能
TransformerCNN
DALL-E / DALL-E 2
2021年〜 / OpenAI
テキストから画像を生成。CLIPと拡散モデルの組み合わせ
TransformerDiffusion
Stable Diffusion
2022年
オープンソースのテキスト→画像生成。潜在空間での拡散モデル
Diffusion
GPT-4V / Gemini
2023年〜
テキスト+画像+音声を統合的に理解・生成するマルチモーダルLLM
Transformer

📋 全体まとめ

G検定で特に問われやすいモデル

領域最重要モデル覚えるべきキーワード
画像 AlexNet → VGG → GoogLeNet → ResNet の進化 ILSVRC、スキップ結合、Inception
R-CNN → Fast R-CNN → Faster R-CNN の進化 RPN、バウンディングボックス
GAN、VAE、拡散モデル Generator/Discriminator、潜在空間、ノイズ除去
言語 RNN → LSTM → Seq2Seq → Transformer の進化 勾配消失、ゲート機構、Attention
BERT(エンコーダ)/ GPT(デコーダ) 事前学習、ファインチューニング
音声 WaveNet、Whisper 波形生成、End-to-End
強化学習 DQN、AlphaGo → AlphaGo Zero → AlphaZero Q学習、自己対戦、モンテカルロ木探索