微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何仅从 xml 文件中提取特定部分并合并它们?

如何解决如何仅从 xml 文件中提取特定部分并合并它们?

我有许多 xml 文件,我想将它们合并到一个文件中。我不想从根合并它们,而是从其中一个孩子合并。 如何使用 grep/sed/awk 语句进行处理?

XML 1:

<root>
   <version>AB</version>
   <Data>
       <Title>MyTitle</Title>
       <SubTitle>Mysub</SubTitle>
   </Data>
   <file author="JXJX" name="MyFile1">
       <desc>File1</desc>
       <field>Random Field</field>
   </file>
<root>

XML 2:

<root>
   <version>AB</version>
   <Data>
       <Title>MyTitle 2</Title>
       <SubTitle>Mysub 2</SubTitle>
   </Data>
   <file author="HIGH" name="MyFile2">
       <desc>File2</desc>
       <field>Random Field</field>
   </file>
<root>

我想要以下 XML 文件

<root>
    <file author="JXJX" name="MyFile1">
       <desc>File1</desc>
       <field>Random Field</field>
    </file>
    <file author="HIGH" name="MyFile2">
       <desc>File2</desc>
       <field>Random Field</field>
    </file>
</root>

解决方法

don't parse XML with regex,但请改用像 这样的正确解析器:

$ xidel -s --xquery '
  serialize(
    <root>{
      doc("1.xml")//file,doc("2.xml")//file
    }</root>,{"indent":true()}
  )
'
<root>
  <file author="JXJX" name="MyFile1">
    <desc>File1</desc>
    <field>Random Field</field>
  </file>
  <file author="HIGH" name="MyFile2">
    <desc>File2</desc>
    <field>Random Field</field>
  </file>
</root>
,

对于像示例这样简单的文件,您可以使用简短的 sed 命令来打印第一行、从 <file</file> 的所有行以及最后一行:

sed -n '1p;/<file/,/<\/file>/p;$p' XML1 XML2

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。