微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用R的制表器从多个pdf提取表

如何解决使用R的制表器从多个pdf提取表

我是一个新手,试图从多个pdf中提取同一张表并将每个表另存为数据框。 到目前为止,这是我的代码



##Locating table
area<- locate_areas("~filepathhere/nameYear.pdf",pages = 1)

#extracting table
call_pdf<-list.files(path="~filepathhere",pattern="*.pdf",all.files=T,full.names=T)

  for (i in call_pdf){
                      call<-extract_tables(i,pages = 1,area=list(c(114,53,376,667)),column=list(c(53,120,121,184,185,250,251,316)),guess= FALSE,output="data.frame")
                      for (k in 2002:2020){
                        call[k]<-call[[i]][c(4:15),c(2,4,6,8)]
                        names(call[k])[1]<-"Year"
                        names(call[k])[2]<-"Month"
                        names(call[k]])[3]<-"Unit (10^3m^3)"
                        names(call[k]])[4]<-"Unit (bbls)"
                        call[k]$Year<-sub("^$",paste(k),call[[k]]$Year)
  }
}

我一直在找不到错误对象'call'。

我认为提取数据时并没有存储每个单独的数据帧。

非常感谢您的帮助。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。