Ward法 vs K-Means法

📊 使うデータ：6人の身長と体重

6人のデータをグループ分けします。同じデータを使って、Ward法とK-Means法の手順の違いを見ていきます。

見た目でも「A,B,C は小柄」「D,E,F は大柄」の2グループに分かれそうです。この分類を2つの手法がどう行うかを比較します。

    方針：全データがバラバラの状態から、最も似ている2つを1つずつくっつけていく（ボトムアップ）。合体基準は「クラスタ内の分散の増加が最も小さいペア」。
  

上の合体過程を1本の図にしたものがデンドログラムです。縦軸の高さは合体時の「距離（分散の増加量）」を表し、高い位置での合体ほど、異なるグループが無理やりくっついたことを意味します。

    デンドログラムの読み方：赤い点線のように横に切る位置を変えると、クラスタ数が変わります。高い位置で切れば2クラスタ、低い位置で切れば3, 4…と細かく分かれます。つまりクラスタ数を後から自由に決められるのがWard法の利点です。
  

    方針：最初に「K=2グループに分ける」と宣言してから、中心点を動かして調整する（トップダウン的）。
  

🌳 Ward法 = 木を育てる

1つずつくっつけて下から木を育てていく。

ボトムアップ
バラバラ → だんだん大きなグループに

過程がすべて記録されるので、後から「何クラスタがいいか」をデンドログラムを見て決められる。

🚩 K-Means法 = 旗を立てて集合

先に旗（中心）を立てて「集まれ！」と言う。

反復調整
中心を置く → 割当 → 中心を修正 → 繰り返し

最初にK（旗の数）を決めないと始められない。ただし処理は高速。

以下の3点が特に問われやすいです。

Ward法	階層的クラスタリングの代表。デンドログラムでクラスタ数を後から決められる
K-Means法	クラスタ数Kを事前に決める必要がある。初期値でブレる。高速
共通点	どちらも教師なし学習のクラスタリング手法