如何解决使用`pathlib.Path().glob()`迭代文件时如何将文件名提取为字符串?
import pandas as pd
from pathlib import Path
Reports = Path('path/text').glob('*.txt')
for report in Reports:
raw_text = open(report).read()
TAB = pd.read_csv('path/tables/*.ann')
我使用 pathlib.Path().glob()
遍历 text 目录下的所有 .txt
文件。对于每一个path/text/file_name.txt
,tables目录下都有一个对应的.ann
文件path/tables/file_name.ann
(同名文件),我需要这个表来处理原始文本因此。有没有方便的方法打开对应的.ann
文件?
我可以将每个 .txt
文件的文件路径提取为字符串 S
,然后
S = # extract a path-to-file string from report
file = S.replace('text','tables').replace('txt','ann')
TAB = pd.read_csv(file)
希望有更好的方法。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。