高效计算序列之间的重叠

如何解决高效计算序列之间的重叠

给定两个序列s1s2s1s2超序列是另一个长度小于两个序列之和的序列s1s2 的长度并包含它们。例如,对于 s1=[1,2,4,4]s2=[4,9,7],超序列可能是 [1,7],也可能是 [1,7]

我试图找到一个函数 f 的有效实现,它的输入是两个序列 s1s2,它执行以下操作:首先,计算可能的超序列的数量和然后返回发生重叠的位置(为简单起见,我们假设 s1 总是首先出现在超序列中)。

例如,以前面的示例为例,f([1,4],[4,7]) 应返回 23,即第二个序列在两个现有超序列中开始的索引。

解决方法

您可以通过基于左侧列表的枚举的列表理解来获取潜在的重叠位置。

idx = [ i for i,v1 in enumerate(s1) if v1==s2[0] ]

# [2,3]

但是,我建议使用递归生成器来生成所有超序列的不同总体策略。

def superpose(s1,s2,inverted=False):
    if s1 and not inverted and s1[0] in s2:
        yield from superpose(s2,s1,True)
    if not s2: return
    if inverted and s2[0] not in s1:
        yield s1+s2;return
    for i,v1 in enumerate(s1):
        if v1 != s2[0]: continue
        yield from (s1[:i+1] + sp for sp in superpose(s1[i+1:],s2[1:],True))

输出:

s1=[1,2,4,4]
s2=[4,9,7]

for sp in superpose(s1,s2): print(sp)

[1,7]
[1,7]

for sp in superpose(s2,s1): print(sp) # insensitive to parameter order

[1,7]

s1 = [1,3]
s2 = [2,1,6,2]
for sp in superpose(s1,3,2]
[2,3]

如果您需要找到最短的,可以轻松地将生成器馈送到 min 函数:

min(superpose(s1,s2),key=len)    

[1,7]
,

我想不出比这更简单的解决方案:

def f(s1,s2):
    indexes = []
    for i in range(len(s1)):
        seq_len = len(s1) - I
        if seq_len < len(s2) and s1[i:] == s2[:seq_len]:
            indexes.append(i)
    return indexes
        

单线,如果你喜欢生活在边缘:

indexes = [i for i in range(len(s1)) if len(s1)-i>len(s2) and s1[i:]==s2[:len(s1)-i]]

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?