如何解决如何解析R中的XML文件可能是使用SRSS生成的?
在我的工作中,我必须对外部组织通过Web门户授予的用户访问权限共享的数据进行一些分析。那里有各种报告,我可以以多种格式查看和下载。这些格式中的两种非常有用,即MS Excel和“带有报告数据的XML文件”。 Excel文件通常经过严格格式化(带有小计,合并的单元格等),以适合Excel用户的目的。将这些Excel文件转换为数据框/表通常很麻烦。因此,我更喜欢下载“ xml”文件,然后通过->对其进行解析,然后将其保存在csv中,然后在R
中进行分析。
但是,每当我尝试将xml
文件直接解析为R时(为了避免干预转换为csv步骤),我都不会成功。到目前为止,我已经在R中尝试了XML
xml2
个库,但无济于事。
最近我尝试了这段代码。
library("XML")
library("methods")
setwd("C:\\Users\\Administrator\\Desktop\\")
res <- xmlParse("Skil.xml")
> res <- xmlParse("Skil.xml")
xmlns: URI RptSancDig_VoucherCompilationSheet is not absolute
rootnode <- xmlRoot(res)
rootsize <- xmlSize(rootnode)
> rootsize
[1] 2
xmldataframe <- xmlToDataFrame("Skil.xml")
> xmldataframe <- xmlToDataFrame("Skil.xml")
xmlns: URI RptSancDig_VoucherCompilationSheet is not absolute
> xmldataframe
TextBox24 TextBox63 DDOName_Collection
1 <NA> <NA> <NA>
2
仅提及Skil.xml
的文件大小约为12.1 Mb,并且已在Excel中成功解析。
我也尝试了read_xml()
的{{1}}功能,但无济于事。
我本来很乐意共享一个示例文件来尝试,但我无法这样做。而且,我也无法生成这种xml格式的示例文件。
有人可以帮忙吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。