Scrapy网络爬虫实战
【作 者】东郭大猫
【形态项】 241
【出版项】 北京:清华大学出版社 , 2019.10
【ISBN号】978-7-302-53620-8
【中图法分类号】TP311.561
【原书定价】59.00
【主题词】软件工具-程序设计
【参考文献格式】 东郭大猫. Scrapy网络爬虫实战. 北京:清华大学出版社, 2019.10.
内容提要:
随着大数据分析、大数据计算火热兴起,越来越多的企业发布了数据分析岗位,而数据分析的基础则是海量的数据。Python中的Scrapy框架就是为了抓取数据而设计的。本书是一本Scrapy爬虫框架零基础起步的实战图书。本书共分11章,第1-2章介绍Python环境的搭建、编辑器的使用、爬虫的一些基础知识(urllib、requests、Selenium、Xpath、CSS、正则表达式、BeautifulSoup库)等。第3-8章主要介绍Scrapy框架的原理与使用。第9-11章主要介绍Scrapy的优化,包括内置服务、组件优化等,最后通过一个完整的大型示例对全书的知识点做了应用总结。本书入门门槛低、浅显易懂,适合所有Scrapy爬虫和数据分析行业的入门读者学习,也适合高等院校和培训学校作为爬虫入门教材和训练手册。
下载地址