Python网络爬虫技术与实战

Python网络爬虫技术与实战
  • ISBN: 9787111674115
  • 出版日期:
  • 出版社: 机械工业出版社有限公司
  • 作者: 赵国生;王健 编著
  • 评分:
  • 类型: 计算机科学
  • 得到图书

内容简介

本书是一本系统、全面地介绍Python网络爬虫的实战宝典。作者融合自己丰富的工程实践经验,紧密结合演示应用案例,内容覆盖了几乎所有网络爬虫涉及的核心技术。在内容编排上,一步步地剖析算法背后的概念与原理,提供大量简洁的代码实现,助你从零基础开始编程实现深度学习算法。

全书按照学习爬虫所涉及的核心技术从易到难,再到应用的顺序分为14章。

第1章介绍Python的安装配置和基础语法;第2章介绍爬虫类型、抓取策略以及网络基础知识;第3章介绍Python常用库;第4章介绍正则表达式的语法、匹配规则;第5章讲解PIL库、Tesseract库和TensorFlow库的语法、类型和识别方法;第6章介绍抓包利器Fiddler;第7章介绍数据存储;第8章介绍Scrapy爬虫框架;第9章介绍多线程爬虫;第10章介绍动态网页爬虫;第11章介绍分布式爬虫;第12章介绍电商网站商品信息爬虫项目;第13章介绍生活娱乐点评类信息爬虫;第14章介绍图片信息类爬虫项目。