KKZ

概要

kmeansを改良した非階層型クラスタリング手法の一つ。kmeansは初期値依存で結果が悪くなりやすかったが、初期値を決めていく時に最も離れた点を選択していくことで改善。
Facebookシェア Twitterツイート LINEで送る このエントリーをはてなブックマークに追加
この章を学ぶ前に必要な知識
0
条件
  • クラスタ数kをあらかじめ決めておく必要あり
効果
  • kmeansの初期値依存問題を改善
ポイント
  • 外れ値に弱い
  • 初期値のクラスタを決めるときに最も離れた点を選択していく
  • kmeans++はこれをさらに改善

解 説

kmeans法での初期値依存問題を解決するために提案された非階層型クラスタリングの一つ。 kmeansで初期値を選択する時はランダムに行っていたが、 KKZではクラスタを選んでいくときに他のクラスタ中心から最も離れたものを選択する。 しかし、上記の方法では外乱データがあるときに影響されやすくなってしまうのが課題。
KKZ法とは
この章を学んで新たに学べる
Comments

Reasons
>>隠す