如何解决审查R中的代码,基于特定名称从网站下载图片的问题
在 R
中,我尝试根据 ICO 的 URL 和 CEO 的姓名从 ICOBench.com 网站下载 CEO 的个人资料图片。
我在 excel file (5Cx5L)
中有基本信息,如下所示:
col1 = ref col2 = nameICO col3 = token col4 = URL col5 = CEO
第一行的示例:
1
Max Crowdfund
MPG
https://icobench.com/ico/max-crowdfund
mark lloyd
我在这里尝试做的是:
在 excel
文件中查找 ICO URL,进入团队网页,找到 CEO(根据文件中的名称),然后将其图片下载到我的计算机上。
我尝试了下面的 code
(我应该说是混合代码:-),我访问了网页并“检查” 以查找参数。但也许我错过了 "href" 参数?
虽然它似乎没有“错误”,但它并没有那么清楚地下载任何图片,这不是我想让他做的:-/
您将在下面看到,不是每次都告诉 R
去查找每一行的名称,而是将其缩小到与 CEO Mark Lloyd 合作的第一个 ICO。主要是因为我还没到名字的查找部分...
请问,有人可以帮忙吗?
我采用了这种方法,但我认为还有其他方法可以做到这一点,所以真的
欢迎任何提示,也在 Python
(如果更好?)
谢谢!
icoss <- read_excel(input_file)
for(i in 1:nrow(icoss)){
dir.create(paste("file_path_computer",icoss[i,1],"/",sep = ""))
urls <- as.character(icoss[i,4])
teamm <- read_html(paste(urls,"/team",sep = ""))
teamm <- html_nodes(teamm,".row")
a <- paste(((as.character(teamm[3:length(teamm)-2]))),collapse = " ")
b <- strsplit(a,"title")
for(j in 1:length(b[[1]])){
if( grepl("Mark Lloyd",tolower(b[[1]][j])) == T){
ceo<-"CEO"
ppersonname <- gsub("class.*","",b[[1]][j])
ppersonname <- gsub("\\(.*",gsub(">",trimws(gsub("[\"]",gsub("=",ppersonname)))))
ppersonname <- gsub("[^[:alnum:][:blank:]?&/\\-]",ppersonname)
ppersonname <- gsub("/",ppersonname)
vvurl <- paste("icobench.com",gsub("[']",gsub("[(]",gsub(".*url",gsub(");.*",b[[1]][j])))),sep = "")
eextension <- gsub(".*\\.",b[[1]][j])))))
GET(vvurl,write_disk(paste(paste("file_path",sep = ""),ppersonname,"_",ceo,founder,paste(".",eextension,sep="")))
}
}
}
print(i)
}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。