python 爬取疫情

管理员 2023-08-29 08:00:53 软件开发 0 ℃ 0 评论 1317字收藏

python 爬取疫情

在全球遭受新冠疫情的冲击期间，人们对疫情的关注非常高。为了更好地了解疫情的发展情况，很多人开始研究怎么从网络中获得相关数据。本文将介绍使用Python来爬取疫情数据。

import requests
from bs4 import BeautifulSoup
url = 'https://news.qq.com/zt2020/page/feiyan.htm'
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
tags = soup.select('script')
for tag in tags:
if 'window.DATA' in tag.text:
data = tag.text.split('=')[1].strip()[:⑴]
break
data = eval(data)
print('确诊：', data['chinaTotal']['confirm'])
print('死亡：', data['chinaTotal']['dead'])
print('治愈：', data['chinaTotal']['heal'])

在这个例子中，我们使用requests库来发送GET要求，并使用BeautifulSoup库来解析HTML，通过选择script标签定位到存储数据的script标签，然后从中提取数据。最后使用eval()函数将字符串格式的数据转换成字典格式，从中提取所需数据并输出。

使用Python爬取疫情数据可以方便地自动化数据收集进程，下降了人工操作的工作量。但是，需要注意的是，通过爬取数据的方式来获得疫情数据对疫情信息的真实性需要较高的评估，由于网页上的数据可能会存在误差。

文章来源：丸子建站

文章标题：python 爬取疫情

https://www.wanzijz.com/view/74952.html

python 爬取疫情

相关文章

随机看看

热门文章

热门标签