Python urllib3模块详解

2021-02-03 10:18

阅读：815

标签：log manager 文件的 load for ssl 操作线程开始

Urllib3是一个功能强大，条理清晰，用于HTTP客户端的Python库，许多Python的原生系统已经开始使用urllib3。Urllib3提供了很多python标准库里所没有的重要特性：

　 1、线程安全

　　2、连接池

　　3、客户端SSL/TLS验证

　　4、文件分部编码上传

　　5、协助处理重复请求和HTTP重定位

　　6、支持压缩编码

　　7、支持HTTP和SOCKS代理

　　8、 100%测试覆盖率

　　　Urllib3功能非常强大，但是用起来却十分简单：

　　技术图片

安装：

　　Urllib3 能通过pip来安装：

　　　　　　　　　$pip install urllib3

　　你也可以在github上下载最新的源码，解压之后进行安装：

　　　　　　　　　$git clone git://github.com/shazow/urllib3.git

　　　　　　　　　$python setup.py install

urllib3的使用：

生成请求(request)：

　　　首先，你必须导入urllib3模块：

　　技术图片

　　　然后你需要一个PoolManager实例来生成请求,由该实例对象处理与线程池的连接以及线程安全的所有细节，不需要任何人为操作：

　　技术图片

　　　通过request()方法创建一个请求：

　　技术图片

　　　request()方法返回一个HTTPResponse对象。

　　　你还可以通过request()方法向请求(request)中添加一些其他信息，如：

　　技术图片

　　　请求(request)中的数据项(request data)可包括：

Headers:

　　　在request()方法中，可以定义一个字典类型(dictionary),并作为headers参数传入：

　　技术图片

Query parameters:

　　　对于GET、HEAD和DELETE请求，可以简单的通过定义一个字典类型作为fields参数传入即可：

　技术图片

　　　对于POST和PUT请求(request),需要手动对传入数据进行编码，然后加在URL之后：

　　技术图片

Form data:

　　　对于PUT和POST请求(request),urllib3会自动将字典类型的field参数编码成表格类型.

JSON:

　　　在发起请求时,可以通过定义body 参数并定义headers的Content-Type参数来发送一个已经过编译的JSON数据：

　技术图片

Files & binary data:

　　　使用multipart/form-data编码方式上传文件,可以使用和传入Form data数据一样的方法进行,并将文件定义为一个元组的形式　　　　　(file_name,file_data):

　　技术图片

　　　文件名(filename)的定义不是严格要求的,但是推荐使用,以使得表现得更像浏览器。同时，还可以向元组中再增加一个数据来定义文件的　MIME类型：

　　技术图片

　　　如果是发送原始二进制数据，只要将其定义为body参数即可。同时，建议对header的Content-Type参数进行

stream流式响应的处理

>>> import urllib3
>>> http = urllib3.PoolManager()
>>> r = http.request(‘GET‘, ‘http://httpbin.org/bytes/1024‘, preload_content=False)
>>> for chunk in r.stream(32):
... print(chunk)
...
>>> r.release_conn()
注意：preload_content=False表示流式处理响应数据。

处理stream()方法读取响应数据之外，还可以使用read()方法，示例如下：

>>> import urllib3
>>> http = urllib3.PoolManager()
>>> r = http.request(‘GET‘, ‘http://httpbin.org/bytes/1024‘, preload_content=False)
>>> r.read(4)
b‘\x88\x1f\x8b\xe5‘	
>>> r.release_conn()

设置：

　　技术图片