微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

将错误的网页/Excel 转换为正确的 Excel

如何解决将错误的网页/Excel 转换为正确的 Excel

我有一个应用程序可以自动处理一系列 Excel 文件,但我有一个问题。对于某些文件,我似乎有一个带有 .xls 文件扩展名的 html 文件(在 excel 中打开会给出损坏警告,重新保存显示它想要另存为 html)。

使用 Apachi POI 时:

try (Workbook wkbk = WorkbookFactory.create(myCorruptFile)) {
//myCorruptFile is of type File

这无法处理 apache poi NotOLE2FileException 错误如下

Invalid header signature; read 0x0A0D3E6C6D74683C,expected 0xE11AB1A1E011CFD0 - Your file appears not to be a valid OLE2 document,{ }

如果我手动重新保存为 .xls 文件,该文件将得到适当处理,但是有没有办法通过 java 11 检测和重新保存/转换此文件?与自动转换相比,手动转换文件对我来说不是一种选择。

myCorruptFile.getContentType()内容类型指定为:

application/vnd.ms-excel

并且使用 Apache Tika 检测到的类型为:

tika.detect(myCorruptFile.getBytes())

文本/html

(我的 maven pom 没有过滤)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。