python 爬图片假的
如果你是一位爱好技术的人,相信你对Python这门编程语言其实不陌生。下面,我们将教大家用Python来爬取网页上的图片。
首先,我们需要安装Python的第三方库——BeautifulSoup4,用于解析网页。具体操作以下:
pip install beautifulsoup4
以后,我们需要选择一个网站或一个网页,来尝试爬取其中的图片。我们这里以“蝙蝠侠”的百度百科页面为例。对这个页面,我们需要调用Python的requests库,获得到网页的HTML文本内容。具体代码以下:
import requests url = "https://baike.baidu.com/item/%E8%9D%99%E8%9D%A0%E4%BE%A0" response = requests.get(url) html = response.text
一旦我们得到网页的HTML内容,我们就能够用BeautifulSoup库,解析出所有图片的URL地址了。具体代码以下:
from bs4 import BeautifulSoup soup = BeautifulSoup(html, 'html.parser') img_tags = soup.findAll('img') urls = [img['src'] for img in img_tags]
最后,我们需要将图片下载到本地。具体代码以下:
for url in urls: img_name = url.split("/")[⑴] img_data = requests.get(url).content with open(img_name, 'wb') as handler: handler.write(img_data)
我们将代码保存在文件中,命名为“spider.py”,在终端中运行它,便可在当前目录下看到所有蝙蝠侠图片的下载结果了。
文章来源:丸子建站
文章标题:python 爬图片假的
https://www.wanzijz.com/view/74584.html