封面
版权信息
作者简介
内容简介
前言
第一部分 大数据处理框架的基础知识
第1章 大数据处理框架概览
1.1 大数据及其带来的挑战
1.2 大数据处理框架
1.3 大数据应用及编程模型
1.4 大数据处理框架的四层结构
1.5 错误容忍机制
1.6 其他大数据处理框架
1.7 本章小结
- APP免费
1.8 扩展阅读
- APP免费
第2章 Spark系统部署与应用运行的基本流程
- APP免费
2.1 Spark安装部署
- APP免费
2.2 Spark系统架构
- APP免费
2.3 Spark应用例子
- APP免费
2.4 Spark编程模型
- APP免费
2.5 本章小结
- APP免费
第二部分 Spark大数据处理框架的核心理论
- APP免费
第3章 Spark逻辑处理流程
- APP免费
3.1 Spark逻辑处理流程概览
- APP免费
3.2 Spark逻辑处理流程生成方法
- APP免费
3.3 常用transformation()数据操作
- APP免费
3.4 常用action()数据操作
- APP免费
3.5 对比MapReduce,Spark的优缺点
- APP免费
3.6 本章小结
- APP免费
3.7 扩展阅读
- APP免费
第4章 Spark物理执行计划
- APP免费
4.1 Spark物理执行计划概览
- APP免费
4.2 Spark物理执行计划生成方法
- APP免费
4.3 常用数据操作生成的物理执行计划
- APP免费
4.4 本章小结
- APP免费
4.5 扩展阅读
- APP免费
第三部分 典型的Spark应用
- APP免费
第5章 迭代型Spark应用
- APP免费
5.1 迭代型Spark应用的分类及特点
- APP免费
5.2 迭代型机器学习应用SparkLR
- APP免费
5.3 迭代型机器学习应用——广义线性模型
- APP免费
5.4 迭代型图计算应用——PageRank
- APP免费
5.5 本章小结
- APP免费
第四部分 大数据处理框架性能和可靠性保障机制
- APP免费
第6章 Shuffle机制
- APP免费
6.1 Shuffle的意义及设计挑战
- APP免费
6.2 Shuffle的设计思想
- APP免费
6.3 Spark中Shuffle框架的设计
- APP免费
6.4 支持高效聚合和排序的数据结构
- APP免费
6.5 与Hadoop MapReduce的Shuffle机制对比
- APP免费
6.6 本章小结
- APP免费
第7章 数据缓存机制
- APP免费
7.1 数据缓存的意义
- APP免费
7.2 数据缓存机制的设计原理
- APP免费
7.3 与Hadoop MapReduce的缓存机制进行对比
- APP免费
7.4 本章小结
- APP免费
第8章 错误容忍机制
- APP免费
8.1 错误容忍机制的意义及挑战
- APP免费
8.2 错误容忍机制的设计思想
- APP免费
8.3 重新计算机制
- APP免费
8.4 checkpoint机制的设计与实现
- APP免费
8.5 checkpoint与数据缓存的区别
- APP免费
8.6 本章小结
- APP免费
第9章 内存管理机制
- APP免费
9.1 内存管理机制问题及挑战
- APP免费
9.2 应用内存消耗来源及影响因素
- APP免费
9.3 Spark框架内存管理模型
- APP免费
9.4 Spark框架执行内存消耗与管理
- APP免费
9.5 数据缓存空间管理
- APP免费
9.6 本章小结
- APP免费
参考文献
更新时间:2024-01-19 16:36:47