微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

pdftron 复制错误的文本

如何解决pdftron 复制错误的文本

我想使用 pdftron 并且一切正常,但是当我从 pdf 复制文本时,某些字符会转换为空白方块和问号,有什么想法吗?

here 是我的 pdf。

如下图所示:

enter image description here

我写了这段代码

WebViewer({
    path: '/assets/plugins/pdftron',initialDoc: '/practical.pdf',fullAPI: true,disableLogs: true
},document.getElementById('pdf')).then((instance) => {
    // PDFNet is only available with full API enabled
    const { PDFNet,docViewer } = instance;

    let Feature = instance.Feature;
    instance.disableFeatures([Feature.NotesPanel]);

    docViewer.on('documentLoaded',() => {
        // call methods relating to the loaded document
    });


    instance.textPopup.add({
        type: 'actionButton',img: '/language.svg',onClick: () => {
            const quads = docViewer.getSelectedTextQuads(docViewer.getCurrentPage());
            const text = docViewer.getSelectedText();
            $("#out-pdf").html(text);
            console.log(quads);
        },});
});

解决方法

文档似乎确实导致不正确的提取。 PDF 规范未定义提取,因此每个查看者处理案例的方式都略有不同。我的情况是文档中可能包含格式错误或不完整的字体或 unicode 映射。我们为我们的核心组件添加了多个修复程序,并且这些修复程序的提取可以正确进行。不幸的是,当前版本的 WebViewer 尚未包含这些修复程序。我们无法给出修复将登陆 WebViewer 的确切时间表,但至少应该是我们下一个主要版本的一部分。现在我会尝试看看您是否可以重新创建文档,看看是否有帮助。我们看到和测试的大部分文档都没有提取问题。

,

您能否通过我们的支持 https://www.pdftron.com/form/request/ 创建票证并将发生这种情况的文档附加到票证,以便我可以仔细查看并更快地解决问题。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。