-
Spark 2.x机器学习精通指南由Packt发行
资源介绍
使用Spark 2.x掌握机器学习
这是出版的的代码库。 它包含从头到尾完成本书所必需的所有支持项目文件。
关于这本书
这本书使您可以将数据转换为可操作的知识。 本书首先通过MLlib和H2O库定义机器学习原语开始。 您将学习如何使用二元分类法来检测CERN粒子对撞机产生的大量数据中的希格斯玻色子粒子,或使用集合方法对日常健康活动进行分类。
说明和导航
所有代码都组织在文件夹中。 每个文件夹均以数字开头,后跟应用程序名称。 例如,Chapter02。
该存储库包括以下章节:
第2章:检测暗物质-希格斯玻色子粒子
第三章:用于多类分类的集合方法
第4章:使用NLP和Spark流预测电影评论
第5章:用于预测和聚类的Word2Vec
第6章:从Clickstream数据中提取模式
第7章:使用GraphX进行图分析
第8章:贷款俱乐部贷款预测
注意:第01章不包含代码。
本书提供的代码