微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用 fontsize 计算文本长度npm - pdf2json 库

如何解决使用 fontsize 计算文本长度npm - pdf2json 库

我正在使用 pdf2json library 来解析 pdf。

它以 json 格式返回解析后的数据,我附上了一些示例数据。

需要注意的主要变量是

高度 - 以 PAGE_UNITS 为单位的 pdf 高度

Width - 以 PAGE_UNITS 为单位的 pdf 宽度

sw - (字体的空格宽度)在 pd2json 库的 README.md 中定义

索引 1 处的 TS - pt 中的字体大小

w - 我的困惑发生在哪里。 W 应该代表文本行的宽度。但是,我的文本行的宽度大于页面的宽度,这没有任何意义。

我需要获取文本的长度。 我试过做(文本中的字符数 * sw)/pagewidth 来获得线相对于 pdf.Tp 测试的比率然后我在我的前端使用这个比率来绘制相同 pdf 的图像具体线路。

但这似乎没有给我正确的线长。通常它太短了。

如果有人可以帮忙,那将不胜感激。我一直在研究 pd2json 问题,寻找类似的东西,但是没有答案,而且库似乎也没有得到很好的支持

"Pages": [
  {
    "Height": 49.5,"HLines": [],"VLines": [],"Fills": [
      {
        "x": 0,"y": 0,"w": 0,"h": 0,"clr": 1
      },{
        "x": 9.001,"y": 19.271,"w": 5.372,"h": 0.038,"clr": 35
      }
    ],"Texts": [
      {
        "x": 4.252,"y": 45.981,"w": 96.648,"sw": 0.32553125,"clr": 0,"A": "left","R": [
          {
            "T": "Hello%20World%20","S": -1,"TS": [
              0,15,0
            ]
          }
        ]
      },"Width": 38.25
...

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。