Python记录

2021-04-18 14:29

阅读：717

标签：span split gb2312 爬虫乱码字节码编码记录字符

content和text的区别

content中间存的是字节码，而text中存的是Beautifulsoup根据猜测的编码方式将content内容编码成字符串。直接输出content，会发现前面存在b‘这样的标志，这是字节字符串的标志，而text是，没有前面的b,对于纯ascii码，这两个可以说一模一样，对于其他的文字，需要正确编码才能正常显示。注意：大部分情况建议使用.text，因为显示的是汉字，但有时会显示乱码，这时需要用r.content.decode(‘utf-8‘)，中文常用utf-8和GBK，GB2312等。这样可以手工选择文字编码方式。

列表还可以这样赋值

list=[1,‘x‘]
a,b=list
print(a，b)
一般应与与复制到字典中，爬虫脚本cookie赋值时可以用到

str=‘cookie‘
str2=str.split(‘;‘)
for i in str2:
key, value=i.split(‘=‘)

Python记录

标签：span split gb2312 爬虫乱码字节码编码记录字符

原文地址：https://www.cnblogs.com/zzhoo/p/13293242.html

上一篇：关于python中的transpose

下一篇：《Java9模块化开发核心原则与实践》——第四五章

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：Python记录
文章链接：http://soscw.com/index.php/essay/76293.html

亲，登录后才可以留言！

Python记录

content和text的区别

列表还可以这样赋值

评论

热门文章

推荐文章

最新文章

置顶文章