日期:2019-04-25 14:25
式(5)求出:
其中,s为数据子集,si为分割属性,c为数据子集样本数[7]。
6、离群点检测
离群点是数据集中与正常点有较大差异的那一类数据点,在数据点中找出异常点是离群点检测的主要任务。离群点检测在大数据分析中有重要应用,它采用基于距离的异常点检测算法,以欧式距离为衡量标准,找到脱离给定数据集的异常数据。离群点检测算法:根据分类结果选择该数据对象的质心,计算该数据对象到质心的欧氏距离,根据区间范围判断是否为离散点[7]。
二、大数据分析方法
1、城市照明管理相关数据
城市照明运行管理数据具有非常