python requests返回中文乱码
2021-06-21 20:04
标签:没有 技术分享 soscw class color get 乱码 res .com 最近在使用python爬取高考分数线时,获得的response里面输出了中文乱码: 解决方案是:将response设置编码格式,一般的如果网页中没有标明type格式,一般默认的都是‘ISO-8859-1‘编码,我们只需要把编码格式转为 ‘gb2312‘ 即可 添加一行代码:下面标红的,这样就可以解决。 python requests返回中文乱码 标签:没有 技术分享 soscw class color get 乱码 res .com 原文地址:https://www.cnblogs.com/zll20153246/p/9683002.htmlfrom bs4 import BeautifulSoup
import requests
def get_provice_link(url):
response=requests.get(url)
print(response.text)
soup=BeautifulSoup(response.text,‘lxml‘)
print(soup.title)
def main():
url=‘http://www.gaokao.com/beijing/fsx/‘
get_provice_link(url)
if __name__ == ‘__main__‘:
main()
response=requests.get(url)
response.encoding = ‘gb2312‘
print(response.text)