Python网络爬虫的基本流程与准备
2021-03-17 12:25
标签:rgb xlwt bs4 path 通过 分析 from 获取 request Python网络爬虫的基本流程与准备 标签:rgb xlwt bs4 path 通过 分析 from 获取 request 原文地址:https://www.cnblogs.com/zq-zq/p/13974713.html
# 解析网页
from bs4 import BeautifulSoup as bf
# 正则表达式
import re
# Excel表格操作
import xlwt
# 获取URL得到html文件
import urllib.request as req
# 进行SQLite数据库操作
import sqlite3
# 相对路径,../表示定位到上一级目录
path1 = "../excel/hello.txt"
# 相对路径,当前目录下寻找
path2 = "hello.txt"
# 绝对路径,r""表示不转义字符
path3 = r"C:\Users\a最简单\Desktop\hello.txt"
# 换成/也行,连转义字符都不用考虑了
path4 = "C:/Users/a最简单/Desktop/hello.txt"
文章标题:Python网络爬虫的基本流程与准备
文章链接:http://soscw.com/index.php/essay/65298.html