2011年10月31日月曜日

Repeated bisection 法とk平均法

bayonで使えるデータクラスタリング手法
1、Repeated bisection 法
2、k平均法




1、Repeated bisection 法
誰かの論文

抽出した特徴語を用いて情報を分類する.Repeated bisection はクラスタリングツールCLUTO で使用されているクラスタリング手法であり,情報を 2 分割していくことでクラスタリングを実行する.このクラスタリング手法はソートアルゴリズムの中でも高速かつ軽量なクイックソートアルゴリズムに類似している部分があり,大量の情報を高速に扱うことができる.Repeated bisection の概要を図 4.7 に示す.まず,情報集合の中からランダムに 2つ要素を選択し,それぞれを格納する情報集合を作成する.元の情報集合の全ての要素に対して,ランダムに選択した 2 つの要素との類似度を比較し,高い情報集合に格納する.さらに情報集合の中で類似度をそれぞれ比較し直し,情報の移動を行う.これらの一連の動作を
規定数繰り返すことによって,情報を分類する.




2、k平均法
k平均法
  1. 各点にランダムにクラスタを割り当てる
  2. クラスタの重心を計算する。
  3. 点のクラスタを、一番近い重心のクラスタに変更する
  4. 変化がなければ終了。変化がある限りは 2. に戻る。

0 件のコメント:

コメントを投稿