微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

从word文档中提取表格

如何解决从word文档中提取表格

是否有任何工具可以从word文档中提取所有表格并使用python或vba将它们转换为csv文件或任何excel扩展文件

请注意,word 文件包含文本和表格。

解决方法

您可以将 pandaspython-docx 一起使用。根据 this 答案,您可以从文档中提取所有表格并将它们放入列表中:

from docx import Document
import pandas as pd
document = Document('test.docx')

tables = []
for table in document.tables:
    df = [['' for i in range(len(table.columns))] for j in range(len(table.rows))]
    for i,row in enumerate(table.rows):
        for j,cell in enumerate(row.cells):
            if cell.text:
                df[i][j] = cell.text
    tables.append(pd.DataFrame(df))

然后您可以通过遍历列表将表保存到 csv 文件:

for nr,i in enumerate(tables):
    i.to_csv("table_" + str(nr) + ".csv")

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。