微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

pdftron中的句子提取

如何解决pdftron中的句子提取

我想通过鼠标悬停在 pdf 文档中该句子的每个单词上突出显示句子,我尝试了一些方法,但无法实现此目标。

pdftron 有没有办法做到这一点?

我想完成这个事件处理程序:

            WebViewer({
                path: '/assets/plugins/pdftron',initialDoc: '/practical.pdf',fullAPI: true,disableLogs: true
            },document.getElementById('pdf'))
                .then((instance) => {
                    const { PDFNet,docViewer } = instance;

                    const Tools = instance.Tools;

                    docViewer.on('mouseMove',(e) => {
                        console.log(e);
                    });
                    
                });

解决方法

您也许可以使用文本提取器从页面中获取文本,然后对其进行迭代以找到与鼠标位置相对应的部分 https://www.pdftron.com/documentation/web/guides/extraction/text-extract/#advanced-text-extraction-from-a-page-region

您可能需要将鼠标坐标转换为窗口坐标 https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-mouse-locations-and-window-coordinates,将窗口坐标转换为页面坐标 https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-window-and-viewer-page-coordinates,最后将页面坐标转换为 PDF 页面坐标 https://www.pdftron.com/documentation/web/guides/coordinates/#converting-between-pdf-and-viewer-coordinates 以与值进行比较来自文本提取器

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。