如何解决Python-子集-当关键字再次出现在第1列中时,通过巨大的日志文件创建新的数据框?分别保存每个数据框
我有一个带有20000个数据行的长日志文件,由KEyword表分隔。每当关键字表再次出现时,我都可以创建一个新的数据框吗?
我目前的修复开始和结束方法无法满足以下要求:
def create_dataframe(df):
start = 16920
end = 17632
df = df.iloc[start:end,:].reset_index(drop=True)
return df
我的数据集如下表:
0 0 0 0 0 0 0
Table COST
REAL REAL REAL REAL
IDnxska52P 154564564 421564564 364564564 456456 35635
Table Instruments 421564564 364564564 456456 53536
STRING REAL REAL REAL REAL REAL REAL
IDnxska52P 3,5 50 3,5 50
IDnxska53P 6,5 7,5 6,5
IDnxska54P 3,5 50
IDnxska55P 6,5
IDnxska56P 3,5 50 6,5
Table PC 50 6,5
STRING REAL REAL REAL REAL REAL REAL
HTZ30 0.000000000000000E+00 0.000000000000000E+00 0.000000000000000E+00 0.000000000000000E+00 0.000000000000000E+00 0.000000000000000E+00
HTZ31 0.000000000000000E+01 0.000000000000000E+01 0.000000000000000E+00 0.000000000000000E+01 0.000000000000000E+01 0.000000000000000E+01
HTZ30 0.000000000000000E+02 0.000000000000000E+02 0.000000000000000E+00 0.000000000000000E+02 0.000000000000000E+02 0.000000000000000E+02
HTZ31 0.000000000000000E+03 0.000000000000000E+03 0.000000000000000E+00 0.000000000000000E+03 0.000000000000000E+03 0.000000000000000E+03
HTZ32 0.000000000000000E+04 0.000000000000000E+04 0.000000000000000E+00 0.000000000000000E+04 0.000000000000000E+04 0.000000000000000E+04
HTZ33 0.000000000000000E+05 0.000000000000000E+05 0.000000000000000E+00 0.000000000000000E+05 0.000000000000000E+05 0.000000000000000E+05
HTZ34 0.000000000000000E+06 0.000000000000000E+06 0.000000000000000E+00 0.000000000000000E+06 0.000000000000000E+06 0.000000000000000E+06
HTZ35 0.000000000000000E+07 0.000000000000000E+07 0.000000000000000E+00 0.000000000000000E+07 0.000000000000000E+07 0.000000000000000E+07
HTZ36 0.000000000000000E+08 0.000000000000000E+08 0.000000000000000E+00 0.000000000000000E+08 0.000000000000000E+08 0.000000000000000E+08
HTZ37 0.000000000000000E+09 0.000000000000000E+09 0.000000000000000E+00 0.000000000000000E+09 0.000000000000000E+09 0.000000000000000E+09
HTZ38 0.000000000000000E+10 0.000000000000000E+10 0.000000000000000E+00 0.000000000000000E+10 0.000000000000000E+10 0.000000000000000E+10
HTZ39 0.000000000000000E+11 0.000000000000000E+11 0.000000000000000E+00 0.000000000000000E+11 0.000000000000000E+11 0.000000000000000E+11
HTZ40 0.000000000000000E+12 0.000000000000000E+12 0.000000000000000E+00 0.000000000000000E+12 0.000000000000000E+12 0.000000000000000E+12
HTZ41 0.000000000000000E+13 0.000000000000000E+13 0.000000000000000E+00 0.000000000000000E+13 0.000000000000000E+13 0.000000000000000E+13
HTZ42 0.000000000000000E+14 0.000000000000000E+14 0.000000000000000E+00 0.000000000000000E+14 0.000000000000000E+14 0.000000000000000E+14
HTZ43 0.000000000000000E+15 0.000000000000000E+15 0.000000000000000E+00 0.000000000000000E+15 0.000000000000000E+15 0.000000000000000E+15
HTZ44 0.000000000000000E+16 0.000000000000000E+16 0.000000000000000E+00 0.000000000000000E+16 0.000000000000000E+16 0.000000000000000E+16
您能帮我分离所有数据框并将其保存为唯一数据框吗? df1,df2,df3等。
我想使用的关键字是TABLE ,但我不知道如何。
访问数据文件:http://www.filedropper.com/sample_172
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。