-
Python、R、Keras和PySpark中端到端Machine-Deep-Learning建模实例
资源介绍
机器学习和深度学习
端到端建模过程
数据加载和预处理:数据丢失,可视化,缩放,文本/图像预处理等
算法或架构选择
模型评估:训练测试拆分,交叉验证,指标等
超参数调整
最终模型保存到磁盘并加载
问题类别
回归
分类
聚类
降维
自然语言处理(NLP)
图像识别
时间序列预测
关联规则学习
使用Python scikit-learn库进行机器学习
回归/分类:线性回归,岭,套索,弹性网,逻辑回归,线性判别分析(LDA),朴素贝叶斯(NB),K最近邻(KNN),支持向量机(SVM),决策树,袋装树,额外的树,随机森林,AdaBoost,梯度提升,XGBoost,神经网络
聚类:K-Means聚类,分层聚类
降维:主成分分析(PCA),内核PCA,LDA
自然语言处理
时间序列预测:持续性模型,自回归综合移动平均值(ARIMA)模型
关联规则学习
使用R进行机器学习
回归/分类:线性回归,偏