当前位置:首页 > 学生天地 > 学生活动

网络信息追逐者:网络爬虫初步——创意程序设计兴趣小组第三次活动报道

2021-03-31   来源:创意程序设计兴趣小组   作者:政教处
       2021年3月28日周日上午,尚行楼三楼微机室,杭玉柱老师和彭卓老师带领同学们继续学习本学期第三课时内容——网络爬虫初步。
       随着网络的迅速发展,如何有效地提取并利用信息已经成为一个巨大的挑战。为了更高效地获取指定信息,需定向抓取并分析网页资源,从而促进了网络爬虫的发展,本课介绍的网络爬虫(Web Spider)又称网络蜘蛛或网络机器人,是一段用来实现自动采集网站数据的程序,不仅能够为搜索引擎采集网络信息,而且还可以作为定向信息采集器,定向采集某些网站中的特定信息。
       本课先介绍了网络爬虫的基本操作流程,掌握通过requests库进行数据抓取的方法,再掌握通过正则表达式进行数据解析的方法,最后介绍了运用Beautifulsoup4库解析和处理数据的方法,重点介绍了对静态网页的抓取过程。
       为了帮助学生们理解,本课的知识点都辅以网页信息获取实例进行介绍,通过学习,学生们都感受到了大数据时代善用网络爬虫程序的方便和快捷,掌握了除了搜索引擎之外的又一信息获取方式,也培养了对信息获取的敏感性和主动性。
(责任编辑:孟晓雨)

安徽省颍上第一中学 版权所有 CopyRight © www.ahsysyz.com All Reserved

皖ICP备09001057号-1 皖公网安备 34122602000309号,本站内属颍上一中,未经授权请勿复制转载 电话热线:0558-4427970 传真:0558-4427952

邮编:236200 Email:ahsysyz.com@163.com 学校地址:安徽省颍上县城北新区颍阳大道101号