我正在寻找一种有效的方法来比较和获得两个基于
XML的解析树之间的差异.
您认为存储这些差异的最佳方式是什么?我会这样做的:
XML A:
<w:p> <w:pPr> <w:spacing w:after="1"/> </w:pPr> <w:r> <w:t>World</w:t> </w:r> </w:p>
XML B:
<w:p> <w:pPr> <w:spacing w:after="1"/> </w:pPr> <w:r> <w:t>ASDF</w:t> </w:r> </w:p>
该算法确定“World”已更改为“ASDF”,然后存储:
div: <w:p><w:r><w:t>World</w:t> -> <w:p><w:r><w:t>ASDF</w:t>
这足以涵盖可能发生的所有情况吗?
有人知道这样做的好方法吗?真的很感激任何帮助!
解决方法
它可能会变得更难.看看这个例子:
<w:p> <w:pPr> <w:spacing w:after="1"/> </w:pPr> <w:r> <w:t>World</w:t> <-- Case 1: this changes to <w:t>ASDF</w:t> <w:t>World</w:t> <-- Case 2: this changes to <w:t>ASDF</w:t> </w:r> </w:p>
为了能够识别这两种情况,你必须将其存储为
div: <w:p><w:r><w:t>World</w:t> -> <w:p><w:r><w:t>ASDF</w:t>
另一个是
div: <w:p><w:r><w:t>World</w:t><w:t>World</w:t> -> <w:p><w:r><w:t>World</w:t><w:t>ASDF</w:t>
或类似的东西(你可能还想为它们两者添加“w:p”结束标记,以使它们成为有效的XML子树).
一般来说,这样的程序可能会变得非常复杂,所以我不建议你创建一些全新的东西,但是要么使用一些现有的diff算法(即使不解析XML结构,大多数也会很好),或者将其中一个修改为适合您的需求.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。