用Python写网络爬虫(第2版)

用Python写网络爬虫(第2版)
  • ISBN: 9787115479679
  • 出版日期:
  • 出版社: 人民邮电出版社
  • 作者: 【德】凯瑟琳·雅姆尔;【澳】理查德·劳森
  • 评分: ★★★☆
  • 类型: 科技
  • 得到图书

内容简介

书中主要内容包括网络爬虫简介,从页面中抓取数据的3种方法,提取缓存中的数据,使用多个线程和进程进行并发抓取,抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用Scarpy和Portia进行数据抓取,并在最后介绍了使用本书讲解的数据抓取技术对几个真实的网站进行抓取的实例,帮助你活学活用书中介绍的技术。

本书适合有一定Python编程经验而且对爬虫技术感兴趣的读者阅读。