日期:2019-04-25 14:25
择 k 个数据作为初始质心,将数据对象根据其与各个类的质心距离进行划分,之后重新计算各个类的质心,循环执行直到目标函数最小为止[6]。类的质心为类内所有点的算术平均值,对象到质心的距离一般采用欧几里得距离,可由式(2)求出:
其中,(X1,Y1)为质心坐标,(X2,Y2)为样本数据。目标函数采用平方误差准则函数,可由式(3)求出:
其中,Ci为第i个簇,Ci为簇Ci的质心,K为簇的个数,X为数据对象,dist为标准欧几里得距离[7]。
5、分类算法
数据分类目的是通过构建一个分类模型,将数据集中的