python 爬取疫情
在全球遭受新冠疫情的冲击期间,人们对疫情的关注非常高。为了更好地了解疫情的发展情况,很多人开始研究怎么从网络中获得相关数据。本文将介绍使用Python来爬取疫情数据。
import requests from bs4 import BeautifulSoup url = 'https://news.qq.com/zt2020/page/feiyan.htm' r = requests.get(url) soup = BeautifulSoup(r.content, 'html.parser') tags = soup.select('script') for tag in tags: if 'window.DATA' in tag.text: data = tag.text.split('=')[1].strip()[:⑴] break data = eval(data) print('确诊:', data['chinaTotal']['confirm']) print('死亡:', data['chinaTotal']['dead']) print('治愈:', data['chinaTotal']['heal'])
在这个例子中,我们使用requests库来发送GET要求,并使用BeautifulSoup库来解析HTML,通过选择script标签定位到存储数据的script标签,然后从中提取数据。最后使用eval()函数将字符串格式的数据转换成字典格式,从中提取所需数据并输出。
使用Python爬取疫情数据可以方便地自动化数据收集进程,下降了人工操作的工作量。但是,需要注意的是,通过爬取数据的方式来获得疫情数据对疫情信息的真实性需要较高的评估,由于网页上的数据可能会存在误差。
文章来源:丸子建站
文章标题:python 爬取疫情
https://www.wanzijz.com/view/74952.html