资源介绍
HDFS:类似Google GFS的分布式文件系统
MapRedce:并行计算架构,将计算任务拆分成大量可以独立运行的子任务,接着并行运算,另外会有一个系统调度的架构负责收集和汇总每个子任务的分析结果
HBase: 类似Google BigTable的分布式列式数据库,与Pig/Hive很好地集成
Pig:一种轻量级的脚本语言,在处理半结构化数据上拥有非常高的性能,为用户提供多种接口
Hive:数据仓库工具,在使用类SQL查询分析时显示是极高的性能,由Facebook贡献,定义了简单的类SQL查询语言
Sqoop:于在HADOOP与传统的数据库间进行数据的传递,方便从传统数据库导入数据到Hadoop数据集合(HDFS/Hive)