登录 注册
当前位置:主页 > 资源下载 > 9 > [Packt Publishing] Apache Kafka.pdf下载

[Packt Publishing] Apache Kafka.pdf下载

  • 更新:2024-08-21 23:18:50
  • 大小:2.11MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:统计分析 - 大数据
  • 格式:PDF

资源介绍

Kafka是一个消息系统,原本开发自LinkedIn,用作LinkedIn的活动流(activity stream)和运营数据处理管道(pipeline)的基础。现在它已为多家不同类型的公司 作为多种类型的数据管道(data pipeline)和消息系统使用。 活动流数据是所有站点在对其网站使用情况做报表时要用到的数据中最常规的部分。活动数据包括页面访问量(page view)、被查看内容方面的信息以及搜索情况等内容。这种数据通常的处理方式是先把各种活动以日志的形式写入某种文件,然后周期性地对这些文件进行统计分析。运营数据指的是服务器的性能数据(CPU、IO使用率、请求时间、服务日志等等数据)。运营数据的统计方法种类繁多。 近年来,活动和运营数据处理已经成为了网站软件产品特性中一个至关重要的组成部分,这就需要一套稍微更加复杂的基础设施对其提供支持。