使用Urllib爬虫(1)--简单的将数据爬到内存或硬盘中
2021-03-21 10:24
标签:http -- 爬取 code 作用 网页数据 ons 解码 细节 使用Urllib爬虫(1)--简单的将数据爬到内存或硬盘中 标签:http -- 爬取 code 作用 网页数据 ons 解码 细节 原文地址:https://www.cnblogs.com/u-damowang1/p/12724139.html
import urllib
import urllib.request
import re
#打开京东网页并且进行读取,解码格式utf-8,ignore小细节自动略过,大大减少出错率
#将数据爬到内存中
#http://www.jd.com
url = "http://www.jd.com"
data = urllib.request.urlopen(url).read().decode("utf-8","ignore")
pat = "
import urllib
import urllib.request
import re
url = "http://www.jd.com"
#urlretrieve(网址,文件名filename),由于\有转义的作用所以改用为/或者\\
res = urllib.request.urlretrieve(url,filename="D:\\pythonstudy\\pachong\\jd1.html")
print(res)
上一篇:9种原生js动画效果(转)
下一篇:php tostring用法
文章标题:使用Urllib爬虫(1)--简单的将数据爬到内存或硬盘中
文章链接:http://soscw.com/index.php/essay/67123.html