微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在nodejs中下载tesseract的预处理图像

如何解决如何在nodejs中下载tesseract的预处理图像

根据我的理解,tesseract.js 在尝试处理上传的图像之前会对其应用过滤器。但是,图像质量可能仍然很差。为了确保图像看起来不错,tesseract 提供了一个选项,可以在应用过滤器后下载图像。 在文档中它指出:

您可以看到 Tesseract 如何通过使用 配置变量 tessedit_write_images 为 true

这就是问题所在。我似乎找不到将 tessedit_write_images 设置为 true 的方法。我到处查看如何在 nodejs 中执行此操作,但找不到答案。

我尝试通过向其中添加 tessedit_write_images = true修改文档(在下面发布)中提供的示例代码,但没有奏效:

const { createWorker } = require('tesseract.js');

const worker = createWorker();

(async () => {
  await worker.load();
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  await worker.setParameters({
    tessedit_char_whitelist: '0123456789',tessedit_write_images : true // added this but typescript gives an error
  });
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png');
  console.log(text);
  await worker.terminate();
})();



版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。