G検定 モデル名一覧

モデル(アーキテクチャ / 具体的なシステム)のみを整理。手法・指標・分野名は含まない。

凡例: 略語 正式名称が別にある(覚える必要あり)  名前 そのまま名前(略語ではない)

画像画像分類(Classification)10モデル

モデル名種別正式名称(略語の場合)一言で言うと
LeNet名前1998CNNの原点。手書き数字認識。LeCunが開発
AlexNet名前2012DLブームの火付け役。ReLU・GPU・Dropout導入。ILSVRC優勝
VGGNet略語Visual Geometry Group Net20143×3フィルターで統一してシンプルに深く。VGG16/19
GoogLeNet名前別名: Inception2014Inceptionモジュールで複数フィルターを並列実行。ILSVRC優勝
ResNet略語Residual Network2015スキップ結合で152層を実現。人間超えの精度。ILSVRC優勝
WideResNet名前2016ResNetを深さでなく幅(チャネル数)方向に広げた派生
DenseNet名前2017全前層の出力を密(Dense)に結合。ResNetの発展形
SENet略語Squeeze-and-Excitation Net2017チャネルごとの重要度を自動学習。ILSVRC最後の優勝
EfficientNet名前2019深さ・幅・解像度をバランスよくスケーリング
ViT略語Vision Transformer2020画像をパッチに分割してTransformerで分類。CNN不使用

画像軽量CNN(エッジ/モバイル向け)2モデル

モデル名種別正式名称一言で言うと
MobileNet名前2017Depthwise Separable Convolutionで軽量化。スマホやIoT向け
MnasNet略語Mobile Neural Architecture Search Net2019NASでモバイル向け最適構造を自動探索

画像物体検出(Object Detection)5モデル

モデル名種別正式名称一言で言うと
R-CNN略語Region-based CNN2014候補領域を約2000個抽出→各々CNNで分類。遅いが元祖
Fast R-CNN略語Fast Region-based CNN2015画像全体を1回だけCNNに通して高速化
Faster R-CNN略語Faster Region-based CNN2015RPNで候補領域生成もCNN化。End-to-End学習
YOLO略語You Only Look Once20161回見るだけで全物体を同時検出。リアルタイム処理可能
SSD略語Single Shot MultiBox Detector2016複数スケールで同時検出する1段階方式

画像セグメンテーション6モデル

モデル名種別正式名称一言で言うと
FCN略語Fully Convolutional Network2015全結合層を畳み込みに置換。セマンティックセグメンテーションの元祖
SegNet名前2015エンコーダ・デコーダ構造。プーリングのインデックスを保存して復元
U-Net名前2015U字型のエンコーダ・デコーダ+スキップ結合。医療画像で有名
PSPNet略語Pyramid Scene Parsing Net2017異なるスケールの文脈情報をピラミッド状に統合
DeepLab名前2015〜Dilated Convolution(穴あき畳み込み)で広い受容野を確保。Googleが開発
Mask R-CNN名前2017Faster R-CNN+マスク予測。インスタンスセグメンテーションの代表

画像姿勢推定1モデル

モデル名種別正式名称一言で言うと
OpenPose名前2017人の関節位置をリアルタイム検出。PAFs(部位親和性場)を内部で使用

画像画像生成(Generation)11モデル

モデル名種別正式名称一言で言うと
GAN略語Generative Adversarial Network2014生成器Gと判別器Dが敵対的に学習。画像生成の革命
DCGAN略語Deep Convolutional GAN2015GANにCNNを組み込み安定した画像生成を実現
pix2pix名前pixel to pixel2017ペア画像で条件付き画像変換。線画→写真など
CycleGAN名前2017ペアデータなしで画像変換。A→B→Aのサイクル一貫性
StackGAN名前2017テキスト→画像を段階的(Stack)に生成。低解像度→高解像度
StyleGAN名前2019スタイルを制御して超高品質な顔画像を生成。NVIDIA開発
PixelCNN名前2016ピクセルを1つずつ自己回帰的に生成するCNN
VAE略語Variational Autoencoder2013潜在空間を正規分布に強制して生成可能にしたAE
SRGAN略語Super-Resolution GAN2017低解像度→高解像度の超解像
ESRGAN略語Enhanced SRGAN2018SRGANの強化版。より自然な超解像
Neural Style Transfer名前2015画風変換。CNNの中間特徴を使いコンテンツとスタイルを分離・合成

NLP基盤アーキテクチャ5モデル

モデル名種別正式名称一言で言うと
RNN略語Recurrent Neural Network再帰型NN。系列データの基本構造。前の出力を次の入力に戻す
LSTM略語Long Short-Term Memory19973つのゲートで長期依存を学習。RNNの勾配消失を解決
GRU略語Gated Recurrent Unit2014LSTMの簡略版。ゲート2つで計算が軽い
CNN略語Convolutional Neural Network畳み込みNN。画像認識の王道だがNLPにも使われる
Transformer名前2017Attentionだけで構築。RNN不要。全NLPモデルの基盤

NLP埋め込み・理解・生成モデル8モデル

モデル名種別正式名称一言で言うと
Word2Vec名前Word to Vector2013単語をベクトルに変換。CBOW / Skip-gram
fastText名前2016サブワード単位で学習。未知語にも対応。Facebook
ELMo略語Embeddings from Language Models2018文脈に応じてベクトルが変化する。双方向LSTM
BERT略語Bidirectional Encoder Representations from Transformers2018Transformerエンコーダのみ。双方向文脈理解。Google
GPT略語Generative Pre-trained Transformer2018〜Transformerデコーダのみ。文章生成。OpenAI
T5略語Text-to-Text Transfer Transformer2019全タスクを「テキスト→テキスト」に統一。Google
BART略語Bidirectional and Auto-Regressive Transformers2019ノイズ除去型事前学習。要約に強い。Facebook
Seq2Seq略語Sequence to Sequence2014RNNベースのエンコーダ・デコーダ。機械翻訳の基盤

音声音声認識・音声合成4モデル

モデル名種別正式名称一言で言うと
DeepSpeech名前2014RNN+CTCベースの音声認識。End-to-End。Baidu
Whisper名前2022Transformerベース音声認識。多言語対応。OpenAI
WaveNet名前2016音声波形を直接生成するCNN。自然な音声合成。DeepMind
Tacotron名前2017テキスト→音声のSeq2Seq。Google

強化学習強化学習モデル13モデル

モデル名種別正式名称一言で言うと
DQN略語Deep Q-Network2013Q学習+CNN。Atariゲームで人間超え。DeepMind
Double DQN名前2015Q値の過大評価を修正。選択と評価を別ネットワークで分担
Dueling DQN名前2016Q値を「状態価値」と「行動優位性」に分離して学習
NoisyNet名前2017ネットワークの重みにノイズを追加して探索を促進
Rainbow DQN名前2017DQN改良7つを全部統合した集大成
A3C略語Asynchronous Advantage Actor-Critic2016非同期で複数環境を並列学習。Actor-Criticベース
PPO略語Proximal Policy Optimization2017安定した方策勾配法。RLHFでも使用。OpenAI
AlphaGo名前2016CNN+モンテカルロ木探索。囲碁プロ棋士に勝利。DeepMind
AlphaGo Zero名前2017人間のデータなし、自己対戦のみで学習
AlphaZero名前2018囲碁・チェス・将棋を同一アルゴリズムで汎用学習
AlphaStar名前2019StarCraft IIのプロゲーマーに勝利。DeepMind
OpenAI Five名前2019Dota 2の5人チームAI。OpenAI
PONANZA名前2017日本の将棋AI。プロ棋士に勝利
注意:Stockfishはディープラーニングを使わない従来型のチェスエンジン(探索+評価関数)です。DL系モデルとは区別して覚えましょう。ただしAlphaZeroとの比較で出題されることがあります。

マルチマルチモーダル・拡散モデル4モデル

モデル名種別正式名称一言で言うと
CLIP略語Contrastive Language-Image Pre-training2021画像とテキストを同じ空間に埋め込み。OpenAI
DALL-E名前ダリ + WALL-E2021テキストから画像を生成。OpenAI
Stable Diffusion名前2022オープンソースのテキスト→画像。潜在空間での拡散モデル
GPT-4V略語GPT-4 with Vision2023テキスト+画像を理解するマルチモーダルLLM

📋 合計

モデル総数:69モデル

領域タスクモデル数うち略語
画像分類104(VGG, ResNet, SENet, ViT)
軽量CNN21(MnasNet)
物体検出55(全て略語)
セグメンテーション62(FCN, PSPNet)
姿勢推定10
画像生成114(GAN, DCGAN, VAE, SRGAN/ESRGAN)
NLP基盤54(RNN, LSTM, GRU, CNN)
具体的モデル86(ELMo, BERT, GPT, T5, BART, Seq2Seq)
音声認識・合成40
強化学習133(DQN, A3C, PPO)
マルチモーダル42(CLIP, GPT-4V)
合計6931が略語