-
Python实现机器学习字母分类
资源介绍
打开网站链接http://archive.ics.uci.edu/ml/,点击链接 view all data sets,打开所有数据页面,点击Instances,按照研究实例由多到少排序,选择任务为Classification的数据集,最后我们小组选择了“Letter Recognition Data Set”字母识别数据集。
二、数据分析
字母识别数据集每个对象有16个特征,共包括20000个数据对象,每个特征的取值都为整数,于1991年1月1日提供,主要用来进行数据分类试验。分类的目标是识别由黑白像素组成矩形的图像,代表26英文字母哪个字母。这些图像基于20种不同字体,并经过随机变形生成的20000个模拟实例。每个实例转化成16个原始数字特征,其中10000用于训练,另外10000个用于字母预测。因为每个样本都有明确的类标识,所以这个一个监督学习过程。
- 上一篇: fvl.js-flv 测试 视频资源
- 下一篇: FLV视频文件测试样本片段