用urllib库几行代码实现最简单爬虫
2021-01-18 18:20
阅读:748
YPE html>
标签:pre 格式 viewport env urllib ram 读取 网站 lld
"""
使用urllib.request()请求一个网页内容,并且把内容打印出来。
"""
from urllib import request
import chardet
if __name__ == ‘__main__‘:
# 有的网站url使用不了
url = "https://www.cnblogs.com/gshelldon/p/13332798.html"
# 打开url把内容赋值给rsp
rsp = request.urlopen(url)
# 存取到内存当中是bytes流,使用read方法把rsp的内容读取出来,赋值给变量html。
html = rsp.read()
# 使用decode解码成我们能够看懂的格式。
# print(type(html)) # 查看返回的格式
html = html.decode(‘utf-8‘) # 默认的是utf-8
print(html)
?```python
返回的内容是html格式的文本
D:\ProgramData\Anaconda3\envs\spider\python.exe D:/爬虫/v1-最简单的爬虫.py
省略。。。。。。。
用urllib库几行代码实现最简单爬虫
标签:pre 格式 viewport env urllib ram 读取 网站 lld
原文地址:https://www.cnblogs.com/gshelldon/p/13340990.html
上一篇:JSP数据交互(一)
文章来自:搜素材网的编程语言模块,转载请注明文章出处。
文章标题:用urllib库几行代码实现最简单爬虫
文章链接:http://soscw.com/index.php/essay/43766.html
文章标题:用urllib库几行代码实现最简单爬虫
文章链接:http://soscw.com/index.php/essay/43766.html
评论
亲,登录后才可以留言!