python爬虫使用requests请求无法获取网页元素时终极解决方案

2021-05-13 21:30

阅读：1348

标签：div cos 内容 png 页面 element quit 打开百度 tom

　　　　爬取数据时，有时候会出现无法通过正常的requests请求获取网页内容，导致数据无法抓取到，遇到这种情况时，可以换种思路去爬取数据，使用PhantomJS，即爬虫终极解决方案去获取页面元素。

#!/usr/local/bin/python3.7

from selenium import webdriver
import time

# phantomJS路径
path = ‘/Users/mozili/Documents/PhantomJS/phantomjs-2.1.1-macosx/bin/phantomjs‘
# 创建浏览器对象
browser = webdriver.PhantomJS(path)

# 打开百度并操作
url = ‘https://www.baidu.com‘
browser.get(url)
time.sleep(1)
# 截图
browser.save_screenshot(‘Reptile/phantomjs_img/baidu.png‘)
# 定位搜索框
search = browser.find_element_by_id(‘kw‘)
time.sleep(1)
# 在搜索框输入内容
search.send_keys(‘美女‘)
time.sleep(1)
# 截图
browser.save_screenshot(‘Reptile/phantomjs_img/meinv.png‘)
# 关闭浏览器
browser.quit()

python爬虫使用requests请求无法获取网页元素时终极解决方案

标签：div cos 内容 png 页面 element quit 打开百度 tom

原文地址：https://www.cnblogs.com/lxmtx/p/13126534.html

上一篇：数组转为树形结构以及树形结构平铺成数组

下一篇：【算法与数据结构】－－栈的应用－逆波兰计算器完整版代码

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：python爬虫使用requests请求无法获取网页元素时终极解决方案
文章链接：http://soscw.com/essay/85321.html

亲，登录后才可以留言！

python爬虫使用requests请求无法获取网页元素时终极解决方案

评论

热门文章

推荐文章

最新文章

置顶文章