Python分析豆辨电影
2021-01-27 07:15
标签:良好的 into mac 资料 ofo apple 工作 解答 http 注意: 代码实现流程分析 import requests url = "https://movie.douban.com/j/search_subjects" headers = { for page_start in range(0, 100, 20): 以上所述是小编给大家介绍的python里的命名规范,希望对大家有所帮助,看下图可免费领取python学习资料适合在校大学生,小白,想转行,想通过这个找工作的加入。裙里有大量学习资料,有大神解答交流问题,每晚都有免费的直播课程想要了解python或学习Python的可直接点击链接即可领取相关学习福利包:小白学python:详解python里的命名规范 Python分析豆辨电影 标签:良好的 into mac 资料 ofo apple 工作 解答 http 原文地址:https://blog.51cto.com/14646124/2493197
分析流程图
分析结果
结果概要
请求头一般都是先放User-Agent,如果爬取失败再补Referer,还是失败就再补Cookie,如果喜欢稳一点的,可以每次都加上
请求参数分析
先完成一次请求的抓取
再完成多次请求的爬取
总结:
循序渐进养成良好的习惯
代码
#!/usr/bin/python3-- coding: utf-8 --
import json定义请求url
定义请求头
"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36"
}循环构建请求参数并且发送请求
params = {
"type": "movie",
"tag": "热门",
"sort": "recommend",
"page_limit": "20",
"page_start": page_start
}
response = requests.get(
url=url,
headers=headers,
params=params
)方式一:直接转换json方法
# results = response.json()
# 方式二: 手动转换
# 获取字节串
content = response.content
# 转换成字符串
string = content.decode(‘utf-8‘)
# 把字符串转成python数据类型
results = json.loads(string)
# 解析结果
for movie in results["subjects"]:
print(movie["title"], movie["rate"])
总结