如何解决SAS/Python:查找任何后跟非空格字符串的空格并用不同的值替换空格
我有这样的数据:
1937 Paredes 3-1
1939 Suazo 2-0
1941 Fernandez 4-0
1944 Wilchez 2-1
…
2017 Miralles 5-7
我想将每一行作为一行文本阅读。查找后跟数字、字符或任何非空格符号的空格的任何实例。用“|”替换该数字、字符或任何非空格符号之前的空格方式如下:
1937 |Paredes |3-1
1939 |Suazo |2-0
1941 |Fernandez |4-0
1944 |Wilchez |2-1
...
2017 |Miralles |5-7
知道如何在 SAS 或 Python 中做到这一点吗?
解决方法
您可以使用 re.sub 匹配空格并在右侧断言非空白字符:
import re
test_str = ("1937 Paredes 3-1\n\n"
"1939 Suazo 2-0\n\n"
"1941 Fernandez 4-0\n\n"
"1944 Wilchez 2-1")
result = re.sub(r" (?=\S)","|",test_str)
if result:
print (result)
输出
1937|Paredes|3-1
1939|Suazo|2-0
1941|Fernandez|4-0
1944|Wilchez|2-1
或者找到多个没有换行符的空白字符
result = re.sub(r"[^\S\r\n]+(?=\S)",test_str)
,
我不明白保留其他空间的必要性。为什么不把它们全部删除?
data _null_;
infile 'have.txt' truncover;
file 'want.txt' dsd dlm='|';
input (var1-var3) (:$100.);
put var1-var3;
run;
结果
1937|Paredes|3-1
1939|Suazo|2-0
1941|Fernandez|4-0
1944|Wilchez|2-1
2017|Miralles|5-7
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。