K 均值算法(K-means)

2023-08-02 14:49:28

K-means算法是最简单的一种聚类算法。算法的目的是使各个样本与所在类均值的误差平方和达到最小（这也是评价K-means算法最后聚类效果的评价标准）

K-means聚类算法的一般步骤：

1. 初始化。输入基因表达矩阵作为对象集X，输入指定聚类类数N，并在X中随机选取N个对象作为初始聚类中心。设定迭代中止条件，比如最大循环次数或者聚类中心收敛误差容限。

2. 进行迭代。根据相似度准则将数据对象分配到最接近的聚类中心，从而形成一类。初始化隶属度矩阵。

3. 更新聚类中心。然后以每一类的平均向量作为新的聚类中心，重新分配数据对象。

4. 反复执行第二步和第三步直至满足中止条件。

码农公寓