如何解决从多个图像中提取文本
我想从多张图片中提取文本。
我想在colab中做。
我知道如何用一张图片做到这一点:https://github.com/bhadreshpsavani/ExploringOCR/blob/master/OCRusingTesseract.ipynb
但是怎么做一个循环呢,因为我有一百多张图?
提前致谢!
解决方法
我将图片上传到根目录的 colab.research 中,并使用以下代码解决了此任务:
image_ext = ['.jpg','.png','.jpeg']
directory = '/'
for file in os.listdir(directory):
ext = os.path.splitext(file)[-1].lower()
if ext not in image_ext:
continue
filename = os.path.join(directory,file)
extracted_information = pytesseract.image_to_string(Image.open(filename))
print(extracted_information)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。