[Python3网络爬虫开发实战] 1.3.2-Beautiful Soup的安装

2021-07-02 23:08

阅读：948

标签：over 文件名 use 开发 hub data seo 1.3 war

Beautiful Soup是Python的一个HTML或XML的解析库，我们可以用它来方便地从网页中提取数据。它拥有强大的API和多样的解析方式，本节就来了解下它的安装方式。

1. 相关链接

Beautiful Soup的HTML和XML解析器是依赖于lxml库的，所以在此之前请确保已经成功安装好了lxml库，具体的安装方式参见上节。

目前，Beautiful Soup的最新版本是4.x版本，之前的版本已经停止开发了。这里推荐使用pip来安装，安装命令如下：

1	pip3 install beautifulsoup4

命令执行完毕之后即可完成安装。

当然，我们也可以从PyPI下载wheel文件安装，链接如下：https://pypi.python.org/pypi/beautifulsoup4

然后使用pip安装wheel文件即可。

安装完成之后，可以运行下面的代码验证一下：

from bs4 import BeautifulSoup

soup = BeautifulSoup(‘

Hello

‘, ‘lxml‘)

print(soup.p.string)

运行结果如下：

Hello

如果运行结果一致，则证明安装成功。

注意，这里我们虽然安装的是beautifulsoup4这个包，但是在引入的时候却是bs4。这是因为这个包源代码本身的库文件夹名称就是bs4，所以安装完成之后，这个库文件夹就被移入到本机Python3的lib库里，所以识别到的库文件名就叫作bs4。

因此，包本身的名称和我们使用时导入的包的名称并不一定是一致的。

[Python3网络爬虫开发实战] 1.3.2-Beautiful Soup的安装

标签：over 文件名 use 开发 hub data seo 1.3 war

原文地址：https://www.cnblogs.com/palace/p/9627638.html

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：[Python3网络爬虫开发实战] 1.3.2-Beautiful Soup的安装
文章链接：http://soscw.com/index.php/essay/101008.html

亲，登录后才可以留言！