-
Python决策树分类:涵盖ID3、C4.5和CART算法
资源介绍
Decision_tree-python
决策树分类(ID3,C4.5,CART)
三种算法的区别如下:
(1) ID3算法以信息增益为准则来进行选择划分属性,选择信息增益最大的;
(2) C4.5算法先从候选划分属性中找出信息增益高于平均水平的属性,再从中选择增益率最高的;
(3) CART算法使用“基尼指数”来选择划分属性,选择基尼值最小的属性作为划分属性.
本次实验我的数据集如下所示:
共分为四个属性特征:年龄段,有工作,有自己的房子,信贷情况;
现根据这四种属性特征来决定是否给予贷款
为了方便,我对数据集进行如下处理:
在编写代码之前,我们先对数据集进行属性标注。
(0)年龄:0代表青年,1代表中年,2代表老年;
(1)有工作:0代表否,1代表是;
(2)有自己的房子:0代表否,1代表是;
(3)信贷情况:0代表一般,1代表好,2代表非常好;
(4)类别(是否给贷款):no代表否,