解析Python网络爬虫 核心技术、Scrapy框架、分布式爬虫
【作 者】黑马程序员编著
【丛书名】python应用编程丛书
【形态项】 263
【出版项】 北京:中国铁道出版社 , 2018.07
【ISBN号】978-7-113-24678-5
【中图法分类号】TP311.561
【原书定价】52.00
【主题词】软件工具-程序设计
【参考文献格式】 黑马程序员编著. 解析Python网络爬虫 核心技术、Scrapy框架、分布式爬虫. 北京:中国铁道出版社, 2018.07.
内容提要:
网络爬虫是一种按照一定的规则,自动请求万维网网站并提取网络数据的程序或脚本,它可以代替人力进行信息采集,能够自动采集并高效地利用互联网中的数据,在市场的应用需求中占据着重要的位置。本书以Windows为主要平台,系统全面地讲解了Python网络爬虫的相关知识。主要内容包括:初识爬虫、爬虫的实现原理和技术、网页请求原理、爬取网页数据、数据解析、并发下载、图像识别与文字处理、存储爬虫数据、初识爬虫框架Scrapy、Scrapy终端与核心组件、自动爬取网页的爬虫CrawSpider、Scrapy-Redis分布式爬虫。本书适合作为高等院校计算机相关专业程序设计课程教材,也可作为Python网络爬虫的培训教材,以及广大编程开发者的爬虫入门级教材。
下载地址