日期:2019-04-25 14:25
的所有项映射到给定类别中的某一项,用于归纳和描述重要数据的分类情况。判别决策树是用于数据分类和预测未来的主要技术,它基于从一类无规则的数据中推理出规律性模型的分类规则[8]。它采用自顶向下方法,在树的节点进行属性值的比较,并根据不同值判断向下分支,最后在树末端的叶节点得到结论。该算法主要基于信息论中的熵理论,把信息增益率作为节点分支属性选择的度量标准,获得最终的决策规则。各属性的信息增益率可由式(4)求出:
其中,S为数据集,A为分割属性,Gain为信息增益,SplitInfo为分裂信息量。分裂信息量可由