用urllib库几行代码实现最简单爬虫

2021-01-18 18:20

阅读：887

YPE html>

标签：pre 格式 viewport env urllib ram 读取网站 lld

"""
使用urllib.request()请求一个网页内容，并且把内容打印出来。

"""

from urllib import request

import chardet

if __name__ == ‘__main__‘:

    # 有的网站url使用不了
    url = "https://www.cnblogs.com/gshelldon/p/13332798.html"

    # 打开url把内容赋值给rsp
    rsp = request.urlopen(url)

    # 存取到内存当中是bytes流，使用read方法把rsp的内容读取出来，赋值给变量html。
    html = rsp.read()

    # 使用decode解码成我们能够看懂的格式。
    # print(type(html))         # 查看返回的格式

    html = html.decode(‘utf-8‘)  # 默认的是utf-8
    print(html)

?```python

返回的内容是html格式的文本

D:\ProgramData\Anaconda3\envs\spider\python.exe D:/爬虫/v1-最简单的爬虫.py





 
省略。。。。。。。

用urllib库几行代码实现最简单爬虫

标签：pre 格式 viewport env urllib ram 读取网站 lld

原文地址：https://www.cnblogs.com/gshelldon/p/13340990.html

上一篇：JSP数据交互(一)

下一篇：Andriod服务Web服务器摘要

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：用urllib库几行代码实现最简单爬虫
文章链接：http://soscw.com/index.php/essay/43766.html

亲，登录后才可以留言！

用urllib库几行代码实现最简单爬虫

返回的内容是html格式的文本

评论

热门文章

推荐文章

最新文章

置顶文章