python 短网址还原
短网址是现代社会中愈来愈经常使用的功能,Python具有强大的网络爬虫和正则表达式的处理能力,可以极大简化短网址还原的进程。
import requests
import re
def get_real_url(short_url):
try:
response = requests.get(short_url, allow_redirects=False, timeout=3)
if response.status_code == 301 | response.status_code == 302:
real_url = response.headers['Location']
return real_url
except:
pass
reg_url = r''
reg_res = re.findall(reg_url, response.text)
if reg_res:
real_url = reg_res[0]
return real_url
return short_url
以上代码实现了短网址还原的功能,首先根据短网址要求网站,如果返回301或302状态码,则获得Location信息,即真实网址;如果不返回重定向状态码,则使用正则表达式寻觅真实网址。
使用该函数进行短网址还原只需要调用get_real_url函数,便可获得真实的网址。在大范围短网址还原的情况下,可使用多线程或多进程的方式提高效力。
文章来源:丸子建站
文章标题:python 短网址还原
https://www.wanzijz.com/view/76926.html