书目

中公Python高效开发指南Python网络爬虫综合开发

内容简介

《中公版·Python高效开发指南:Python网络爬虫综合开发》共分为十二章,涵盖了Python网络爬虫综合开发的相关知识,对重难点内容进行了针对性讲解。本书面向Python网络爬虫开发的初学者,按照由浅入深、循序渐进的规律,从讲解网络爬虫开发基础知识,到讲解如何开发单个.py文件的Python爬虫程序,后讲解基于Scrapy爬虫框架的网络爬虫开发。●网络爬虫概述(章)介绍了网络爬虫的基础知识,包括定义、分类、原理和搜索策略等概念性内容。●Python网络爬虫开发基础(第二章)介绍了Python开发环境的搭建,重点介绍了PyCharm的使用。另外,还详细介绍了HTTP协议的相关知识,并介绍了HTML、JavaScript和XPath。●开发单个.py文件的爬虫程序(第三章、第四章)介绍了如何开发单个.py文件的Python爬虫程序,该程序采用Request模块获取数据,并采用XPath、BeautifulSoup4和PyQuery模块进行解析。●开发Python网络爬虫相关技术(第五章至第十章)介绍了Python网络爬虫开发中广泛应用的技术,包括正则表达式、数据接口、数据库的使用、表单的使用、模拟登录、反反爬虫方法和Selenium模拟浏览器等,并结合丰富的小案例来展示知识点。●Scrapy爬虫框架(第十一章、第十二章)介绍了基于Scrapy爬虫框架的爬虫开发和分布式爬虫框架scrapy-redis,以及爬虫的部署。

目录

—  END  —