如何解决如何从pdf文件中提取几行?
我有一个 PDF文件,如下所示:
Q1。那里有几颗行星? A.1 B.3 C.8 D. 9
答案:8
说明:bla bla bla
第二季度。那里有几颗卫星? A.1 B.3 C.8 D. 9
答案:1
说明:bla bla bla
Q3。亚历克斯的朋友是谁? A.亚当 唐纳德 乔 D.杰克
答案:乔
说明:bla bla bla
依此类推,直到Q100
如何删除答案和解释并仅获取问题,即采用以下格式
Q1。那里有几颗行星? A.1 B.3 C.8 D. 9
第二季度。那里有几颗卫星? A.1 B.3 C.8 D. 9
Q3。亚历克斯的朋友是谁? A.亚当 唐纳德 乔 D.杰克
....依此类推,直到Q100
解决方法
好的,经过反复尝试,安倍晋三 首先,我将PDF转换为txt文件 然后使用了代码(附带图片)
基本上将文件转换为列表,并使用正则表达式仅附加所需的输出。 (输入文件为UTF)。一种非常愚蠢的方法,但是有效!!!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。