微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

审查R中的代码,基于特定名称从网站下载图片的问题

如何解决审查R中的代码,基于特定名称从网站下载图片的问题

R 中,我尝试根据 ICO 的 URL 和 CEO 的姓名从 ICOBench.com 网站下载 CEO 的个人资料图片。 我在 excel file (5Cx5L) 中有基本信息,如下所示:

col1 = ref col2 = nameICO col3 = token col4 = URL col5 = CEO 
第一行的

示例

1 
Max Crowdfund
MPG
https://icobench.com/ico/max-crowdfund
mark lloyd

在这里尝试做的是:

excel 文件中查找 ICO URL,进入团队网页,找到 CEO(根据文件中的名称),然后将其图片下载到我的计算机上。

我尝试了下面的 code(我应该说是混合代码:-),我访问了网页并“检查” 以查找参数。但也许我错过了 "href" 参数?

虽然它似乎没有错误,但它并没有那么清楚地下载任何图片,这不是我想让他做的:-/

您将在下面看到,不是每次都告诉 R 去查找每一行的名称,而是将其缩小到与 CEO Mark Lloyd 合作的第一个 ICO。主要是因为我还没到名字的查找部分...

请问,有人可以帮忙吗? 我采用了这种方法,但我认为还有其他方法可以做到这一点,所以真的 欢迎任何提示,也在 Python(如果更好?)

谢谢!

代码

icoss <- read_excel(input_file)

 for(i in 1:nrow(icoss)){
 dir.create(paste("file_path_computer",icoss[i,1],"/",sep = ""))

  urls <- as.character(icoss[i,4])
 teamm <- read_html(paste(urls,"/team",sep = ""))
 teamm <- html_nodes(teamm,".row")

  a <- paste(((as.character(teamm[3:length(teamm)-2]))),collapse =  " ")
  b <- strsplit(a,"title")

    for(j in 1:length(b[[1]])){
     if( grepl("Mark Lloyd",tolower(b[[1]][j])) == T){
     ceo<-"CEO"
     ppersonname <- gsub("class.*","",b[[1]][j])
     ppersonname <- gsub("\\(.*",gsub(">",trimws(gsub("[\"]",gsub("=",ppersonname)))))
     ppersonname <- gsub("[^[:alnum:][:blank:]?&/\\-]",ppersonname)
     ppersonname <- gsub("/",ppersonname)
  
  vvurl <- paste("icobench.com",gsub("[']",gsub("[(]",gsub(".*url",gsub(");.*",b[[1]][j])))),sep = "")
  eextension <- gsub(".*\\.",b[[1]][j])))))
  
  GET(vvurl,write_disk(paste(paste("file_path",sep = ""),ppersonname,"_",ceo,founder,paste(".",eextension,sep="")))
      }
    }
  }
  print(i)
}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。