微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

使用固定宽度拆分字符串类型的 Pandas 列类似于具有固定宽度的 Excel 文本到列功能

如何解决使用固定宽度拆分字符串类型的 Pandas 列类似于具有固定宽度的 Excel 文本到列功能

我有一个 CCYPair 的数据框和类似于下面的相应点值:

当前日期范围:

d = {'CCYPair': ['EURUSD','USDJPY'],'Spot': [1.2,109]}
df = pd.DataFrame(data=d)

我希望将 CCYPair 列拆分为 CCY1 和 CCY2。这可以在 Excel 中使用 Text-to-columns 或通过 Left 和 Right 函数轻松实现。然而,即使搜索了一段时间,我还是发现在 Pandas 数据框中实现相同的结果非常棘手。

我只能找到 pandas.read_fwf 但那是为了从文件中读取。我已经有了一个数据框,并且希望根据固定宽度拆分其中一列。

我确定我在这里遗漏了一些基本的东西 - 就是不知道是什么。

我尝试过 df['CCY1'] = df['CCYPair'][0:3] 但这适用于列上的 [0:3] 而不是列中的每个条目。所以我最终得到了前三个 CCYPair 值,然后是 NaN。

预期结果:

d = {'CCY1': ['EUR','USD'],'CCY2': ['USD','JPY'],109]}
df = pd.DataFrame(data=d)

解决方法

你可以试试extract

df[['CCY1','CCY2']] = df.CCYPair.str.extract('(.{3})(.*)')

输出:

  CCYPair   Spot CCY1 CCY2
0  EURUSD    1.2  EUR  USD
1  USDJPY  109.0  USD  JPY
,

您也可以使用 str.slice 方法:

df['CCY1'] = df['CCYPair'].str.slice(stop=3)
df['CCY2'] = df['CCYPair'].str.slice(start=3)

输出:

    CCYPair   Spot  CCY1  CCY2
0    EURUSD    1.2   EUR   USD
1    USDJPY  109.0   USD   JPY

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。