内容简介
Python 简洁易懂的语法、丰富的类库、以及与大数据组件的无缝集成等诸多特点,使得其成为当前数据工程师的首选编程语言。当然,只是掌握Python还完全不足以成为顶级的数据工程师,因此,本书介绍数据处理知识体系,并以Python实现相关代码示例,力求让读者能使用Python完成数据处理的各个环节。本书的第一章和第二章,简要说明了数据处理领域的基本概念,旨在让读者对数据处理工作有宏观的了解。第二章到第五章,主要讲述了数据分析理论。此处按照难易程度,将其划分成三个部分,即“基础分析”、“数据挖掘”、“深度学习”。第六章,针对大数据分析,介绍了在工程实施过程中的需要用到的“工程组件”、“架构模式”,并以一个具体的案例,说明整个数据工程的实施流程。