Python爬虫教程-25-数据提取-BeautifulSoup4(三)
2021-07-04 23:06
标签:content 提取 tps sele http alt 技术分享 net 笔记 本篇介绍 BeautifulSoup 中的 css 选择器 获取tag内容:tag.get_text Python爬虫教程-25-数据提取-BeautifulSoup4(三) 标签:content 提取 tps sele http alt 技术分享 net 笔记 原文地址:https://www.cnblogs.com/xpwi/p/9600964.htmlPython爬虫教程-25-数据提取-BeautifulSoup4(三)
css 选择器
案例
# BeautifulSoup 的使用案例
# css 选择器
from urllib import request
from bs4 import BeautifulSoup
url = ‘http://www.baidu.com/‘
rsp = request.urlopen(url)
content = rsp.read()
soup = BeautifulSoup(content, ‘lxml‘)
# bs 自动解码
content = soup.prettify()
print("=="*12)
titles = soup.select("title")
print(titles[0])
print("=="*12)
meta = soup.select("meta[content=‘always‘]")
print(meta[0])
运行结果
- 本笔记不允许任何个人和组织转载
文章标题:Python爬虫教程-25-数据提取-BeautifulSoup4(三)
文章链接:http://soscw.com/essay/101905.html