日期:2019-04-25 14:25
数据类集中的位置,方便在不同分布的数据之间进行比较[3]。
4、聚类算法
聚类就是将数据对象分为多个类,类内数据点具有较高的相似 度 而 距 离 近,类 间 数 据 对 象 差 别 大 而 距 离 点远[4]。聚类技术可以将数据集划分成不同的子集集合,它们在空间上都是一个稠密的区域,能方便实现对数据的分析。K - Means 是最为经典的一种基于划分的聚类算法,它采用数据点之间的距离作为评价度量指标,也即将距离比较相近的对象组成类,以得到紧凑而独立的类作为最终目标[5]。K - Means 算法的基本工作过程:首先随机选