一段Python爬虫代码的分析

2021-05-01 13:29

阅读：799

标签：样式爬取 open pre 字符 htm 相关三方 bsp

import re
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
from openpyxl.styles import Alignment

requests：网页爬取的第三方库

re：内容解析模块，用于正则表达式，处理字符串的模块。

BeautifulSoup=bs4：内容解析库，用于提取HTML和XML里的数据。

通常，Beautiful Soup库的使用：

from bs4 import BeautifulSoup     #主要使用BeautifulSoup类

　一个是库，一个是库里边的类。　

openpyxl是读写 Excel 文件的 Python 库

workbook：

在刚开始使用openpyxl的时候，不需要直接在文件系统中创建一个文件，仅仅需要导入Workbook类并开始使用它：

from openpyxl import Workbook
wb = Workbook()

openpyxl模块中与字体，颜色，背景，边框，字体，行宽，行高，单元格格式等相关的内容都放在了styles模块中；

styles能够提供的样式有以下几块：

Font：来设置文字的大小，颜色和下划线等

PatternFill：填充图案和渐变色

Border：单元格的边框

Alignment：单元格的对齐方式等

protection：写保护

一段Python爬虫代码的分析

标签：样式爬取 open pre 字符 htm 相关三方 bsp

原文地址：https://www.cnblogs.com/2016-11-13/p/13203113.html

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：一段Python爬虫代码的分析
文章链接：http://soscw.com/index.php/essay/80885.html

亲，登录后才可以留言！