登录 注册
当前位置:主页 > 资源下载 > 28 > 其他在线内容数据处理量分析-c_#与.net程序员面试宝典下载

其他在线内容数据处理量分析-c_#与.net程序员面试宝典下载

  • 更新:2024-08-29 21:50:32
  • 大小:2.01MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Hadoop - 大数据
  • 格式:PDF

资源介绍

(1)网站群用户访问行为数据处理量分析 以每天 725 万个客户端访问(包括 500 万 PV、100万 Session、 125 万 Cookie)并发计算,结合在线行为数据的接收主要集中在工 作时间,7250000/8小时/60分钟/60 秒=251个/秒,日志接收服务 器接受每秒钟接收日志请求 251 个,远远低于系统的每秒接收到的 正常数(该值通常为 7000-9000)。 根据日志接收每秒钟的并发量为 251,因此系统的数据接收只 需要再用两台服务器做负载均衡即可。但是为了防止数据接收网站 的域名出现单点故障,因此系统的数据接收采用双域名备份,即每 个域名对应两台数据接收服务器,一共四台。 根据系统需要满足***网站智能分析系统诊断的需要,目前 系统的单台服务器的数据处理能力为 400 家左右,因此需要 4 台数 据库服务器,另外需要两台相同配置的数据库服务器作为备份。 (2)其他在线内容数据处理量分析 一是系统需要支持对不少于 108 万个数据采集点每天至少一次 轮询抓取,同时对抓取回的数据进行数据预处理和清洗入库工作, 二是需要实现对存量数据和增量数据的指标自动抽取和更新工作, 三是需要支持前台交互系统的交互分析挖掘需求。 结合以上几部分需求,预计所需的内容数据处理服务器约 50 台。其中较高性能处理服务器(单机 20 核服务器 CPU:2660*2 MEM:144G DISK:SSD 480G*2+SAS 4T*6,万兆网卡,远程管理,双电