登录 注册
当前位置:主页 > 资源下载 > 21 > 培训大数据基础知识

培训大数据基础知识

  • 更新:2024-10-02 16:51:20
  • 大小:9.92MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Hadoop - 大数据
  • 格式:PPTX

资源介绍

HDFS:类似Google GFS的分布式文件系统 MapRedce:并行计算架构,将计算任务拆分成大量可以独立运行的子任务,接着并行运算,另外会有一个系统调度的架构负责收集和汇总每个子任务的分析结果 HBase: 类似Google BigTable的分布式列式数据库,与Pig/Hive很好地集成 Pig:一种轻量级的脚本语言,在处理半结构化数据上拥有非常高的性能,为用户提供多种接口 Hive:数据仓库工具,在使用类SQL查询分析时显示是极高的性能,由Facebook贡献,定义了简单的类SQL查询语言 Sqoop:于在HADOOP与传统的数据库间进行数据的传递,方便从传统数据库导入数据到Hadoop数据集合(HDFS/Hive)