院士(academician)一词源自古希腊传说中的英雄academy,这位英雄为了拯救雅典而牺牲,是科学及学术界的最高荣誉头衔。要了解中国院士的分布情况,我们可以借助python爬虫来获取详细信息。
背景调研
目前,中国院士总数超过1500人,其中科学院院士799人,工程院院士875人。
- 科学院院士名单:https://www.php.cn/link/077efd55c94e1ea0c4e4583c8ea1c7f6
- 工程院院士名单:https://www.php.cn/link/d543ca8a30aea952046a5e6827cb1b73
本文将以工程院院士信息的抓取为例进行详细讲解。
工程院士出生地分布图
立即学习“Python免费学习笔记(深入)”;

必备模块
通过pip安装以下模块:
- scrapy爬虫框架模块
- jieba分词模块
- win32api
如果遇到ImportError: DLL load failed: 找不到指定的模块错误,请将D:Python27_64Libsite-packagespywin32_system32下的所有文件复制到C:WindowsSystem32目录下。
爬虫流程
-
建立爬虫项目:在E盘下创建project_scrapy文件夹,进入该文件夹并打开cmd窗口,运行以下命令搭建爬虫框架:
scrapy startproject engaca_spider
登录后复制
文章来自互联网,只做分享使用。发布者:,转转请注明出处:https://www.dingdanghao.com/article/891754.html
