如何解决从保存的 HTML 文件返回日期 *如果* 日期存在
我有一组格式不一致的 HTML 文件,即它们来自不同的地方。我需要返回更新 HTML 的日期。我有这个python代码:
from htmldate import find_date
import os
import pandas as pd
master_df = pd.DataFrame()
for file in os.listdir(r'D:\URLtoDateTest'):
date_for_file = file.split('_')[-1].split('.')[0]
date_for_file = find_date(date_for_file,"%d%m%Y").date()
df = pd.read_csv(file)
df['Updated_Date'] = date_for_file
master_df = pd.concat([master_df,df])
master_df.to_csv('Url-to-date.csv')
但我返回以下错误:
Traceback (most recent call last):
File "C:\Users\Merrie\Desktop\AgaveJan\UrlToDate.py",line 15,in <module>
date_for_file = find_date(date_for_file,"%d%m%Y").date()
AttributeError: 'nonetype' object has no attribute 'date'
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。