微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 熊猫提取注释行

我有一个数据文件,其中包含前几行注释,然后是实际数据.

#param1 : val1
#param2 : val2
#param3 : val3
12
2
1
33
12
0
12
...

我可以将数据读取为pandas.read_csv(filename,comment =’#’,header = None).但是我也希望单独阅读注释行以提取读取参数值.到目前为止,我只是跳过或删除注释行,但如何单独提取注释行?

解决方法:

在read_csv的调用中你不能真的.如果您只是处理标题,则可以打开文件,提取注释行并处理它们,然后在单独的调用中读入数据.

from itertools import takewhile
with open(filename, 'r') as fobj:
    # takewhile returns an iterator over all the lines 
    # that start with the comment string
    headiter = takewhile(lambda s: s.startswith('#'), fobj)
    # you may want to process the headers differently, 
    # but here we just convert it to a list
    header = list(headiter)
df = pandas.read_csv(filename)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐