为什么写这本书 · · · · · ·
网络爬虫其实很早就出现了,最开始网络爬虫主要应用在各种搜索引擎中。在搜索引擎中,主要使用通用网络爬虫对网页进行爬取及存储。 随着大数据时代的到来,我们经常需要在海量数据的互联网环境中搜集一些特定的数据并对其进行分析,我们可以使用网络爬虫对这些特定的数据进行爬取,并对一些无关的数据进行过滤,将目标数据筛选出来。对特定的数据进行爬取的爬虫,我们将其称为聚焦网络爬虫。
在大数据时代,聚焦网络爬虫的应用需求越来越大。 目前在国内Python网络爬虫的书籍基本上都是从国外引进翻译的,国内的本版书籍屈指可数,故而我跟华章的副总编杨福川策划了这本书。本书的撰写过程中各方面的参考资料非常少,因此完成本书所花费的精力相对来说是非常大的。
本书从系统化的视角,为那些想学习Python网络爬虫或者正在研究Python网络爬虫的朋友们提供了一个全面的参考,让读者可以系统地学习Python网络爬虫的方方面面,在理解并掌握了本书的实例之后,能够独立编写出自己的Python网络爬虫项目,并且能够胜任Python网络爬虫工程师相关岗位的工作。
同时,本书的另一个目的是,希望可以给大数据或者数据挖掘方向的从业者一定的参考,以帮助这些读者从海量的互联网信息中爬取需要的数据。所谓巧妇难为无米之炊,有了这些数据之后,从事大数据或者数据挖掘方向工作的读者就可以进行后续的分析处理了。
本书是一本系统介绍Python网络爬虫的书籍,全书注重实战,涵盖网络爬虫原理、如何手写Python网络爬虫、如何使用Scrapy框架编写网络爬虫项目等关于Python网络爬虫的方方面面。
本书的主要特色如下: 系统讲解Python网络爬虫的编写方法,体系清晰。 结合实战,让读者能够从零开始掌握网络爬虫的基本原理,学会编写Python网络爬虫以及Scrapy爬虫项目,从而编写出通用爬虫及聚焦爬虫,并掌握常见网站的爬虫反屏蔽手段。 有配套免费视频,对于书中的难点,读者可以直接观看作者录制的对应视频,加深理解。 拥有多个爬虫项目编写案例,比如博客类爬虫项目案例、图片类爬虫项目案例、模拟登录爬虫项目等。除此之外,还有很多不同种类的爬虫案例,可以让大家在理解这些案例之后学会各种类型爬虫的编写方法。
总之,在理解本书内容并掌握书中实例之后,读者将能胜任Python网络爬虫工程师方向的工作并学会各种类型网络爬虫项目的编写。此外,本书对于大数据或数据挖掘方向的从业者也非常有帮助,比如可以利用Python网络爬虫轻松获取所需的数据信息等。
本书面向的读者
Python网络爬虫初学者
网络爬虫工程师
大数据及数据挖掘工程师
高校计算机专业的学生
其他对Python或网络爬虫感兴趣的人员
作者简介 · · · · · ·
重庆韬翔网络科技有限公司董事长兼CEO,51CTO、CSDN讲师,《知道日报》特约作者,国家工信部高级网络营销师,蜻蜓FM独家签约主播。 多年IT技术实战开发经验,曾做过程序员,也做过技术总监,现在运营一家专注于中大型软件开发与IT技术服务的公司。 曾出品发行过多门IT类课程,包括但不限于《Python系列实战教程》、《Python GUI系列实战教程》、《Python数据分析与挖掘实战教程》、《Nginx运维实战教程》。
补充说明 · · · · · ·
本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。如需删除,请联系 kefu@yanxishe.com
AI 研习社已经和阿里大文娱、旷视、搜狗搜索、小米等知名公司达成联系,帮助大家更好地求职找工作,一键投递简历至 HR 后台,准备了一些内推渠道群。
欢迎大家添加研习社小学妹微信(aiyanxishe),小学妹拉你加入(备注求职)。
雷锋网雷锋网雷锋网
相关文章:
资料 | 图灵程序设计丛书:深度学习入门:基于Python的理论与实现
资料 | 数字图像处理与机器视觉Visual C++与Matlab实现 作者张铮
资料 | Python强化学习实战:应用OpenAI Gym和TensorFlow精通强化学习和深度强化学习
资料 | O'Reilly精品图书系列:算法精解 C 语言描述 (简体中文)
资料 | 1800页33章数学方法精要笔记 —深入数学建模, 机器学习和深度学习的数学基础
资料 | 算法(第4版)【图灵程序设计丛书】算法领域的经典参考书
资料 | 《人工智能编程范式:通用Lisp中的案例研究》1048页PDF免费下载