登录 注册
当前位置:主页 > 资源下载 > 10 > Hadoop权威指南 第2版中文版下载

Hadoop权威指南 第2版中文版下载

  • 更新:2024-07-09 16:37:50
  • 大小:23.34MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:其它 - 数据库
  • 格式:PDF

资源介绍

《hadoop权威指南(第2版)》从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;hadoop分布式文件系统;hadoop的i/o、 mapreduce应用程序开发;mapreduce的工作机制;mapreduce的类型和格式;mapreduce的特性;如何构建hadoop集群,如何管理hadoop;pig简介;hbase简介;hive简介;zookeeper简介;开源工具sqoop,最后还提供了丰富的案例分析。   《hadoop权威指南(第2版)》是hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行hadoop集群。    google帝国的基石是什么?mapreduce算法!开源项目hadoop作为它的一个具体实现,可以轻松用于构建和维护一个可靠性高、伸缩性强的分布式系统。   作者tomwhite作为hadoop的项目负责人,通过自己对hadoop和hadoop社区的理解,化繁为简,用浅显易懂的语言介绍了hadoop能做什么,怎么做才能充分发挥hadoop的优势,hadoop能够和哪些开源工具结合使用。这是一本主题丰富、讲解透彻的权威参考书,可帮助程序员了解分析海量数据集的细枝末节,帮助管理员掌握搭建和运行hadoop集群的具体过程。   经过修订和更新的第2版概述了hadoop的最新动态,例如hive、sqoop和avro等。书中还提供了案例分析来帮助读者了解如何用hadoop来解决具体的问题。如果想充分利用数据,从中挖掘出有价值的见解或者观点,毫无疑问,这本书将是您不可或缺的重要参考。   使用hadoop分布式文件系统(hdfs)来存储大型数据集,然后用mapreduce对这些数据集执行分布式计算    hadoop的数据和i/o构建块(用子压缩、数据完整性、序列化和持久处理)   探究mapreducc应用开发中常见的陷阱和高级特性   设计,构建和管理门adoop专用集群或在云上运行hadoop   使用pig这种高级的查询语言来进行大规模数据处理   使用hive(hadoop的数据仓库系统)来分析数据集   使用hbase(hadoop的……