Python网络爬虫从入门到实践 第2版
【作 者】唐松编著
【形态项】 279
【出版项】 北京:机械工业出版社 , 2019.06
【ISBN号】978-7-111-62687-9
【中图法分类号】TP311.561
【原书定价】69.00
【主题词】软件工具-程序设计
【参考文献格式】 唐松编著. Python网络爬虫从入门到实践 第2版. 北京:机械工业出版社, 2019.06.
内容提要:
使用Python编写网络爬虫程序获取互联网上的大数据是当前的热门专题。本书内容包括三部分:基础部分、进阶部分和项目实践。基础部分(第1-7章)主要介绍爬虫的三个步骤-获取网页、解析网页和存储数据,并通过诸多示例的讲解,让读者能够从基础内容开始系统性地学习爬虫技术,并在实践中提升Python爬虫水平。进阶部分(第8-13章)包括多线程的并发和并行爬虫、分布式爬虫、更换IP等,帮助读者进一步提升爬虫水平。项目实践部分(第14-17章)使用本书介绍的爬虫技术对几个真实的网站进行抓取,让读者能在读完本书后根据自己的需求写出爬虫程序。