如何解决Python:如何在不导入模块的情况下删除两个定界符之间的文本
我搜索了很多线程,但是它们都需要导入(BeautifulSoup,正则表达式)。输入是一个带有多个定界符('')的LARGE字符串,我听说配对标签是一种很好的技术,但我不确定如何去做。
示例(非常小)输入: 实际输入是完整的HTML代码。
<!DOCTYPE html>
<html>
example
<head>
hello
<meta charset="utf-8">
example2
<meta/>
所需的输出:
example hello example2
解决方法
这是一个使用简单循环的简单易懂的方法:
s = df['Series'].ne(df['Series'].shift()).cumsum() #s is a unique identifier group
df['IsShade'] = (df.groupby(s,group_keys=False)
.apply(lambda x: x['Shading'].sample(x['Shading'].iloc[0])) > 0)
df['IsShade'] = df['IsShade'].fillna(False).astype(int)
df
Out[1]:
Sr Series Parallel Shading Total Cell IsShade
0 0 3 2 2 6 1 0
1 1 3 2 2 6 2 0
2 2 3 2 2 6 3 0
3 3 3 2 2 6 4 0
4 4 3 2 2 6 5 1
5 5 3 2 2 6 6 1
6 6 4 2 5 8 1 1
7 7 4 2 5 8 2 1
8 8 4 2 5 8 3 0
9 9 4 2 5 8 4 0
10 10 4 2 5 8 5 1
11 11 4 2 5 8 6 1
12 12 4 2 5 8 7 1
13 13 4 2 5 8 8 0
14 14 5 1 3 5 1 1
15 15 5 1 3 5 2 0
16 16 5 1 3 5 3 0
17 17 5 1 3 5 4 1
18 18 5 1 3 5 5 1
,
将Item2
变量初始化为零。
一次遍历字符串一个字符。如果看到tag_depth
字符,请递增<
,如果看到tag_depth
字符,请递减。如果看到任何其他字符并且>
为零,则输出该字符。
tag_depth
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。