一段Python爬虫代码的分析
2021-05-01 13:29
标签:样式 爬取 open pre 字符 htm 相关 三方 bsp requests:网页爬取的第三方库 re:内容解析模块,用于 正则表达式,处理字符串的模块。 BeautifulSoup=bs4:内容解析库,用于提取HTML和XML里的数据。 通常,Beautiful Soup库的使用: 一个是库,一个是库里边的类。 openpyxl是读写 Excel 文件的 Python 库 workbook: 在刚开始使用openpyxl的时候,不需要直接在文件系统中创建一个文件,仅仅需要导入Workbook类并开始使用它: openpyxl模块中与字体,颜色,背景,边框,字体,行宽,行高,单元格格式等相关的内容都放在了styles模块中; styles能够提供的样式有以下几块: Font:来设置文字的大小,颜色和下划线等 PatternFill:填充图案和渐变色 Border:单元格的边框 Alignment:单元格的对齐方式等 protection:写保护 一段Python爬虫代码的分析 标签:样式 爬取 open pre 字符 htm 相关 三方 bsp 原文地址:https://www.cnblogs.com/2016-11-13/p/13203113.htmlimport re
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
from openpyxl.styles import Alignment
from bs4 import BeautifulSoup #主要使用BeautifulSoup类
from openpyxl import Workbook
wb = Workbook()