内容简介 Hadoop作为对大量数据进行分布式处理的软件框架,能够可靠、高效、可伸缩的方式进行数据处理,是谷歌实现云计算的重要基石。本书分10个章节,深入浅出地介绍了Hadoop的安装与配置、HDFSHA及解决方案、HDFS元数据解析、元数据备份方案、Backup Node方案、MapReduce设计理念与基本架、MapReduce编程模型、YARN设计理念与基本架构、YARN基础库。