如何解决使用固定宽度拆分字符串类型的 Pandas 列类似于具有固定宽度的 Excel 文本到列功能
当前日期范围:
d = {'CCYPair': ['EURUSD','USDJPY'],'Spot': [1.2,109]}
df = pd.DataFrame(data=d)
我希望将 CCYPair 列拆分为 CCY1 和 CCY2。这可以在 Excel 中使用 Text-to-columns 或通过 Left 和 Right 函数轻松实现。然而,即使搜索了一段时间,我还是发现在 Pandas 数据框中实现相同的结果非常棘手。
我只能找到 pandas.read_fwf 但那是为了从文件中读取。我已经有了一个数据框,并且希望根据固定宽度拆分其中一列。
我确定我在这里遗漏了一些基本的东西 - 就是不知道是什么。
我尝试过 df['CCY1'] = df['CCYPair'][0:3]
但这适用于列上的 [0:3] 而不是列中的每个条目。所以我最终得到了前三个 CCYPair 值,然后是 NaN。
预期结果:
d = {'CCY1': ['EUR','USD'],'CCY2': ['USD','JPY'],109]}
df = pd.DataFrame(data=d)
解决方法
你可以试试extract
:
df[['CCY1','CCY2']] = df.CCYPair.str.extract('(.{3})(.*)')
输出:
CCYPair Spot CCY1 CCY2
0 EURUSD 1.2 EUR USD
1 USDJPY 109.0 USD JPY
,
您也可以使用 str.slice 方法:
df['CCY1'] = df['CCYPair'].str.slice(stop=3)
df['CCY2'] = df['CCYPair'].str.slice(start=3)
输出:
CCYPair Spot CCY1 CCY2
0 EURUSD 1.2 EUR USD
1 USDJPY 109.0 USD JPY
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。