Selenium保存网页为mhtml方法
2021-03-30 04:25
标签:pytho 开发 port 内容 一个 ref alt driver github MHTML即MIME HTML,归档网页,将样式和脚本全部集成到一个文件中。 保存结果,如下图,可以使用浏览器打开。 更多的cdp方法可以参考 (chrome-devtools-protocol)[https://chromedevtools.github.io/devtools-protocol/] Selenium保存网页为mhtml方法 标签:pytho 开发 port 内容 一个 ref alt driver github 原文地址:https://www.cnblogs.com/superhin/p/12600358.html
Chrome Devtools Protcal API中包含了Page.captureSnapshot方法,可以获取到网页的mhtml格式内容。
我们使用Selenium的driver.execute_cdp_cmd()执行该命令后,将结果写入文件即可,示例代码如下。from selenium import webdriver
driver = webdriver.Chrome()
driver.get(‘https://www.qq.com/‘)
# 1. 执行 Chome 开发工具命令,得到mhtml内容
res = driver.execute_cdp_cmd(‘Page.captureSnapshot‘, {})
# 2. 写入文件
with open(‘qq.mhtml‘, ‘w‘) as f:
f.write(res[‘data‘])
driver.quit()
文章标题:Selenium保存网页为mhtml方法
文章链接:http://soscw.com/index.php/essay/69822.html