日期:2019-04-25 14:25
数值区间范围较大、且不同时间段内变化快的问题,因此在大数据分析之前必须使用转换方法进行标准化处理。
数据标准化转换也是大数据分析中常见的转换措施之一,它通过将数据按照比例进行缩小,使之归入一个较小区间范围内,为数据分析建立相对平等的基础。标准分数(Z-score)是一种数据标准化的重要方法,能够真实地反应一个分数距离平均数的相对标准距离,标准分数可由式(1)求出:
其中,X为被标准化的数据,为数据集的平均值,为数据集的标准差。Z值代表着原始数据和数据集平均值之间的距离,它能表明原始数据在数