通过rcurl抓取网页数据
2020-12-13 03:21
标签:style blog class code c java 获取数据有多种方式,例如从txt、excel、curl、数据库等,我比较喜欢curl和数据库,先介绍下rcurl
一 下载rcurl包 二 安装 三 试运行 出错,发现缺少另外一个包,bitops
四 安装bitops 运行 五 安装XML包 下载地址:http://cran.r-project.org/web/packages/XML/index.html 傻了,命名可以直接在R下输入install命令的 六
安装了RJSONIO包
七 实例 运行成功 通过rcurl抓取网页数据,搜素材,soscw.com 通过rcurl抓取网页数据 标签:style blog class code c java 原文地址:http://www.cnblogs.com/jiamei/p/3725688.html
http://cran.r-project.org/web/packages/RCurl/index.html
sudo R CMD INSTALL RCurl_1.95-4.1.tgz
http://cran.r-project.org/web/packages/bitops/index.htmlsudo R CMD INSTALL bitops_1.0-6.tgz
从网上看到的实例都需要这个包,怎么 办?安吧
命令行输入:sudo R CMD INSTALL XML_3.98-1.1.tgz
使用R内置的install命令安装失败,继续老办法安装后,成功
获取豆瓣里冰雪奇缘影片的评分,代码如下:
library(RCurl)
library(XML)
library(RJSONIO)
movieScoreapi
api
"https://api.douban.com/v2/movie/search?q={"
url
"}"
, sep =
""
)
res
reslist
name
score
return
(list(name = name, score = score)) }
movieScoreapi(‘冰雪奇缘’)