-
使用Java实现的大数据分析ID3算法
资源介绍
这个例子来源于Quinlan的论文。
假设,有种户外活动。该活动能否正常进行与各种天气因素有关。不同的天气因素组合会产生两种后果,也就是分成2类:能进行活动或不能。我们用P表示该活动可以进行,N表示该活动无法进行。
下表描述样本集合是不同天气因素对该活动的影响。
Attribute class
outlook temperature(温度) humidity (湿度) windy(风) Play
---------------------------------------------------------
sunny hot high false N
sunny hot high true N
sunny mild high false N
sunny cool normal false P
sunny mild normal true P
rain mild high false P
rain cool normal false P
rain cool normal true N
rain mild normal false P
rain mild high true N
overcast hot high false P
overcast cool normal true P
overcast mild high true P
overcast hot normal false P
分析如以上数据可得出如下决策树(横着看)
|--outlook --|--rainy --|--windy --|--TRUE --|--NO --
|--FALSE --|--YES --
|--sunny --|--humidity --|--high --|--NO --
|--normal --|--YES --
|--overcast --|--YES --
- 上一篇: ID3算法(java实现带训练集)
- 下一篇: 基于java实现的决策树代码