大数据Spark企业级实战PDF版完整免费版|百度网盘下载
小编点评:大数据Spark企业级实用PDF版
《大数据Spark企业级实践》详细分析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark架构设计、Spark集群搭建、Spark内核分析、Spark SQL、MLLib、GraphX、Spark Streaming 、Tachyon、SparkR、Spark多语言编程,有兴趣请下载
相关内容部分预览
简介
Spark 是当今大数据领域最活跃、最流行、最高效的大数据通用计算平台。它是 Apache 软件基金会旗下所有开源项目中的三个开源项目之一。
Spark在“One Stack to Rule them all”的理念指导下,成功构建了基于RDD的大数据处理集成解决方案,集成了MapReduce、Streaming、SQL、机器学习、图处理等大数据计算模型统一到一个技术堆栈中,
开发人员使用一致的 API 来操作 Spark 中的所有功能;更重要的是,Spark SQL、MLLib、GraphX、Spark Streaming等Spark的四个子框架可以在内存中无缝集成,并且可以互操作对方的数据,
这不仅创造了Spark在当今大数据计算领域任何其他计算框架中无可比拟的优势,也加速了Spark成为大数据处理中心的计算平台。
《大数据Spark企业级实践》详细分析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark架构设计、Spark集群搭建、Spark内核分析、Spark SQL、MLLib、GraphX、
p>/p>
Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等,并结合Spark源码详细分析Spark内核及四个子框架,最终提供Spark附录Scala中的开发语言是对实战内容的快速介绍。学完本书,可以胜任大部分企业级Spark开发需求。
《大数据星火企业级》从零开始,完全从企业处理大数据业务场景的角度出发,根据实战代码组织内容。对于大数据爱好者来说,《大数据Spark企业级》《实战》的内容可以帮助你一站式完成Spark从无到有到企业级开发的所有核心内容和实战需求。
目录
第 1 章 Spark 编程模型
第 2 章构建 Spark 分布式集群
第 3 章 Spark 开发环境与测试
第 4 章 Spark RDD 和编程 API
第 5 章 Spark 运行模式深入分析
第6章Spark内核分析
第7章GraphX大规模图计算与
第8章Spark SQL原理与实践
第9章机器学习上
第10章Tachyon文件系统
>第 11 章 Spark Streaming 原理
第 12 章 Spark 多语言编程
第 13 章 R 中的分布式编程
第 14 章 Spark 性能调优和
第 13 章 第 15 章 Spark 源代码分析
附录
第一部分是Scala的实践经验
第二部分是面向Scala的实践
第三部分是Scala函数式编程的实践
关于作者
Spark亚太研究院首席专家,中国移动互联网和云计算大数据大师。在Spark、Hadoop、Android等方面有丰富的源码、实践和性能优化经验。深入研究了Spark从0.5.0到0.9.1的13个版本的Spark源码,完成了发布的Spark 1.0源码研究2014 年 5 月 31 日。
Hadoop源码级专家,曾负责某知名公司类Hadoop框架开发,专注于提供一站式Hadoop解决方案,也是云计算分布式大数据最早的实践者之一加工。
Android 架构师、高级工程师、顾问、培训专家。
精通Spark、Hadoop、Android、HTML5,痴迷于英语广播和健美。