如何解决考虑顺序如何检查列表字符串是否包含另一个列表字符串
我有两个列表(或字符串):一个大,另一个小。 我想检查大的(A)是否包含小的(B)。
我的期望如下:
情况 1. B 是 A 的子集
A = [1,2,3]
B = [1,2]
contains(A,B) = True
情况 2. B 不是 A 的子集,但顺序 [1,2] 保持在 A 中
A = [1,3,2]
B = [1,2]
contains(A,B) = True
情况 3. 错误,因为 4 不是 A
A = [1,4]
contains(A,B) = False
情况 4. 错误,因为顺序 [2,1] 未在 A 中维护,即使 A 包含 1 和 2。
A = [1,2]
B = [2,1]
contains(A,B) = False
A 和 B 可以是字符串。
解决方法
直接命令式方法
我很确定检查一个列表是否是另一个列表的子列表是一种经典的贪婪算法。我们可以扫描较大的列表,尝试按顺序找到较小列表中的每个项目。我们永远不需要回溯,因为每个元素第一次出现就可以了。
def contains(larger,smaller):
# Take an iterator so that we always pick up where we left off.
larger_iter = iter(larger)
for s in smaller:
for l in larger_iter:
if s == l:
break
else:
# We'll enter the else block if we *didn't* break in the loop,# in which case we never found a match for s.
return False
return True
这将在较大列表的大小上线性运行,因为我们最多迭代一次。
函数式方法
编辑。昨晚我想知道是否有一个更小的(逐行)仍然是线性的解决方案,现在我有一个我喜欢的解决方案。
def contains(larger,smaller):
larger_iter = iter(larger)
return all(s in larger_iter for s in smaller)
这遵循与上面完全相同的算法,只是使用更高级别的函数来处理一些簿记。 s in larger_iter
对应于带有 else 块的内部 for 循环,带有生成器的 all
对应于外部 for 循环。
我相信 this answer 应该可以工作,如果您只是不从子列表中删除不在测试列表中的内容。所以对于那里提供的第一种方法的情况
def contains(testList,subList):
shared = [x for x in testList if x in subList]
return shared == subList
您还可以将子列表转换为使用非列表输入。
def contains(testList,subList):
shared = [x for x in testList if x in subList]
return shared == list(subList)
,
您可以将列表转换为 set()
组。示例:
A = set(A)
B = set(B)
print(A <= B)
您可以子集 a <= b
方法。干得好
您可以将 collections.deque
用于 O(n)
解决方案:
from collections import deque
def contains(a,b):
b = deque(b)
for i in a:
if b and i == b[0]:
_ = b.popleft()
return not bool(b)
data = [([1,2,3],[1,2]),([1,3,2],4]),[2,1])]
print([contains(*i) for i in data])
输出
[True,True,False,False]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。