内容简介 这是一本技术深度与企业实践并重的著作。本书使用、实现原理、运维和开发4个方面对Hadoop的核心技术进行了深入的讲解:详细讲解了HDFS存储系统、MapReduce计算框架,以及HDFS的命令系统;结合源代码,深度分析了MapReduce、HDFS、Streaming、Pipes、Hadoop作业调度系统等重要技术和组件的架构设计、工作机制和实现原理;结合百度的实际生产环境,详细讲解了Hadoo。