如何解决使用Javascript查找PDF中的结构元素
我在一个试图解决PDF可访问性的项目中。我想在PDF的StructRootTree中的每个元素周围创建一个边框。因此,我需要一种将PDF中的元素链接到标签树中的元素的方法。
有没有办法...
a)在属于StructElem的PDF中找到元素(位置,宽度,高度)吗? (StructElem-> PDF元素)
或
b)找到PDF中的所有元素,然后找到周围的StructElem? (PDF元素->结构元素)
我已经可以使用PDFassemlber库读取StructureTree。我可以看到元素属于哪个页面,但是看不到哪个元素。这显示了StructRootTree的所有叶子:
我还可以使用PDF.js阅读文本内容。但是我似乎找不到如何将它们与Struct Elements对齐的方法。
我知道一个叶子StructElem包含一个整数(在['/ K']中包含PDF周围元素的MCID。但是要找到它,我需要解析页面的内容流。麻烦且容易出错。是否有API可以简化这一过程?
任何帮助表示赞赏:)
我使用了this PDF
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。