-
Spark权威指南的官方代码存储库
资源介绍
Spark:权威指南
这是与相关的所有材料的*资料库 Bill Chambers和Matei Zaharia撰写。
这个资料库目前仍在进行中,随着时间的推移会增加新的资料。
书中的代码
您可以从code子文件夹的书中找到代码,在该code中,可以按语言和章节对code进行细分。
如何运行代码
在本地计算机上运行
要在本地计算机上运行该示例,请将data子文件夹中的所有数据拉到计算机上的/data或指定本地计算机上该特定数据集的路径。
在Databricks上运行
要在Databricks上运行这些模块,您将需要做两件事。
注册新账号。 你可以在做。
导入单个笔记本以在平台上运行
Databricks是一个零管理云平台,可提供:
完全托管的Spark集群
一个用于探索和可视化的交互式工作区
生产管道调度程序
一个为您喜欢的基于Spark的应用程序提供动力的平台
导入说明
导航到您要