4領域 × タスクごとに主要モデルを整理
複数の領域(画像+テキストなど)を横断するモデルも近年重要になっています。
| 領域 | 最重要モデル | 覚えるべきキーワード |
|---|---|---|
| 画像 | AlexNet → VGG → GoogLeNet → ResNet の進化 | ILSVRC、スキップ結合、Inception |
| R-CNN → Fast R-CNN → Faster R-CNN の進化 | RPN、バウンディングボックス | |
| GAN、VAE、拡散モデル | Generator/Discriminator、潜在空間、ノイズ除去 | |
| 言語 | RNN → LSTM → Seq2Seq → Transformer の進化 | 勾配消失、ゲート機構、Attention |
| BERT(エンコーダ)/ GPT(デコーダ) | 事前学習、ファインチューニング | |
| 音声 | WaveNet、Whisper | 波形生成、End-to-End |
| 強化学習 | DQN、AlphaGo → AlphaGo Zero → AlphaZero | Q学習、自己対戦、モンテカルロ木探索 |