Python大佬批量爬取中国院士信息,告诉你哪个地方人杰地灵

院士(academician)一词源自古希腊传说中的英雄academy,这位英雄为了拯救雅典而牺牲,是科学及学术界的最高荣誉头衔。要了解中国院士的分布情况,我们可以借助python爬虫来获取详细信息。

背景调研

目前,中国院士总数超过1500人,其中科学院院士799人,工程院院士875人。

  • 科学院院士名单:https://www.php.cn/link/077efd55c94e1ea0c4e4583c8ea1c7f6
  • 工程院院士名单:https://www.php.cn/link/d543ca8a30aea952046a5e6827cb1b73

本文将以工程院院士信息的抓取为例进行详细讲解。

工程院士出生地分布图

立即学习“Python免费学习笔记(深入)”;

Python大佬批量爬取中国院士信息,告诉你哪个地方人杰地灵

必备模块

通过pip安装以下模块:

  • scrapy爬虫框架模块
  • jieba分词模块
  • win32api

如果遇到ImportError: DLL load failed: 找不到指定的模块错误,请将D:Python27_64Libsite-packagespywin32_system32下的所有文件复制到C:WindowsSystem32目录下。

爬虫流程

  1. 建立爬虫项目:在E盘下创建project_scrapy文件夹,进入该文件夹并打开cmd窗口,运行以下命令搭建爬虫框架:

    scrapy startproject engaca_spider

    登录后复制

    文章来自互联网,只做分享使用。发布者:,转转请注明出处:https://www.dingdanghao.com/article/891754.html

(0)
上一篇 2025-05-15 16:05
下一篇 2025-05-15 16:05

相关推荐

联系我们

在线咨询: QQ交谈

邮件:442814395@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信公众号