导语


大数据时代,爬虫是一个重要的基本技能。想要学会爬虫,需要具有一个完整的技术体系,并动手实践。为了帮助学生真正学会爬虫,集智学园联合西安交通大学应用数学博士、现为南京审计大学讲师的卢燚老师精心设计了一个 8 小时系列爬虫课程,用简短的代码、精短的课时,讲解 3 种 Python 爬虫的基本方法,给你一个较为完整的爬虫技术体系。


课程总计 8 节,计划从 10 月 10 日开始,每周 2 节。欢迎苦于数据获取,希望拥有爬虫技能的你,扫描文中二维码加入课程!


关键词:Python、requests、BeautifulSoup4、Selenium、Scrapy、HTML、DOM



在一个用数据说话的时代,学会一种高效的数据采集技术,能更好地帮助我们的学习、工作、科研等。模型验证需要数据支撑、产品开发与设计需要匹配潜在客户的使用场景、响应客户真实需求最快迭代相应产品获得双赢等情景都离不开一份具有说服力的数据,而这时,如果你拥有一项爬虫技能,那么你对基于数据给出的决策、结论、方案或许更有底气。

互联网上有很多爬虫课,从B站、中国大学慕课的免费视频到培训机构几千元的系列课程,然而对于大多数人来说,爬虫总是那个想拥有却又被劝退的技能。从入门到放弃只需要一个实际的业务需求场景,跟着老师敲完代码得到输出结果,以为学会了爬虫。可一到真实使用场景却发现对实际的 bug 束手无策,面向谷歌寻求解决方案,尝试几次之后便没了下文。根本原因是课程没有提供系统的数据采集策略。

集智学园与卢燚老师开发的系列课程将使用Python编程语言讲授三种编写爬虫的基本方法,分别运用requests+BeautifulSoup4、Selenium测试框架、Scrapy框架编写爬虫,并提供实际的使用策略。既包含一些爬虫环境配置、网页基础、API调用原理等基础技能、也包含爬取数据失败后如何回溯增量爬取,定期更新数据等高级技能,教你如何应对更复杂的场景。

课程中的这三种数据采集方法,他们各有千秋、互相补充,给你一个较为完整的爬虫技术体系。用简短的代码和较短的时长,让你较为舒适地上手并学会数据采集。

如果你懂一点编程、想要点亮爬虫的技能树,那就加入我们吧!




课程简介




本系列课程将用简短的代码和精短的课时,讲授三种爬虫基本方法,分别运用Python编程语言的requests+BeautifulSoup4、Selenium测试框架、Scrapy框架采集数据。三种方法各有千秋、互相补充,构建一个较为完整的爬虫技术体系。代码简短便于上手,适合各领域各阶段人群学习。

课程使用的工具为Anaconda+Pycharm的Python编程软件,Chrome浏览器及其webdriver,Postman等发送请求的软件。这些工具易获取,可以在网上免费获得,便于上手,学习曲线平坦。




课程大纲与时间安排




本系列课程分为 8 节,每节课程包括 60 分钟的内容分享与 30 分钟的答疑。





课程讲师




卢燚,西安交通大学应用数学博士,现为大学讲师,曾在华为工作三年,拥有多年编程实战经验和一线教学经验,熟练掌握Python和NetLogo语言,对函数式编程有着浓厚的兴趣。讲授爬虫课两年,积累了大量的案例。




课程目的




本系列系统讲述当前流行的三种爬虫思路,三种思路内容互相补充,基本覆盖大多数爬虫使用场景。帮助你:

  1. 从零到一,系统建立爬虫技术体系;

  1. 由易到难,学会三种数据采集思路;

  1. 课堂内外,即学即用快速上手获取数据。





对学员的基础要求




  1. 具有一定的python编程基础(使用python3)

  1. 懂一点算法和网络知识(可选)





课程适用对象




  1. 算法工程师

  2. 从事数据相关工作的研究者

  3. 有编程基础,对爬虫感兴趣的开发人员




课程特色




  1. 线上直播,示例丰富

  1. 只讲基本框架,代码简洁有效

  1. 代码可拓展,实用性强

  2. 三种方法互相补充,覆盖大多数爬虫场景




    课程内容框架








    报名加入课程




    课程价格 199,早鸟报名仅需 169 元,优惠于2022年10月14日截止。

    扫码付费报名课程

    第一步:扫码付费
    第二步:在课程详情页面,填写“学员信息登记表”
    第三步:扫码添加助教微信,入群
    本课程可开发票。


    点击“阅读原文”,报名课程