-
CRM数据挖掘算法与实现:ARFF-Decision-Tree-Toolkit
资源介绍
描述基于arff文件的决策树算法C4.5的Java实现。
作者:钢人队(第一队) 戴伟( ) 吴刚( ) ( ) 新( ) 田政( )
项目结构Attribute.java:存储类型、属性值集。 Data.java:在 arff 文件中存储一项数据。 DataSet.java:解析 arff 文件。 DecisionTree.java:生成决策树,打印树,对数据做出决策。 EntropyCalculator.java:计算离散和连续数据的熵和条件熵。 Main.java:用于输入数据和输出结果的脚本文件。
用法Main.java "filename.arff" [交叉验证折叠,默认= 5,可选] 例子: 1) Main.java trainProdIntro.binary.arff 控制台输出:交叉验证结果:94.29% 2) Main.java trainProdIntr