微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在 Python 中生成和压缩两个列表的最干净和有效的方法

如何解决在 Python 中生成和压缩两个列表的最干净和有效的方法

给定这两个列表

zeros = [2,3,1,2]
ones = [3,4,5]

(条件总是len(zeros) == len(ones) + 1

我想创建一个列表,其中 0 和 1 交替出现在列表中提到的量级。我可以通过以下方式实现:

zeros_list = [[0]*n for n in zeros]
ones_list = [[1]*n for n in ones]
output = [z for x in zip(zeros_list,ones_list) for y in x for z in y]
output += [0]*zeros[-1]
print(output)
> [0,0]

这是最有效/最干净的方式吗?我得到了 2.66 µs ± 78.8 ns 的性能,但我仍然认为这可以在单行中完成,而且效率可能更高

解决方法

两个明显更快的解决方案,使用“技巧”对第一个零而不是最后一个进行特殊处理,用它来初始化 output

def superb_rain(zeros,ones):
    zeros = iter(zeros)
    output = [0] * next(zeros)
    for o in ones:
        output += (1,) * o
        output += (0,) * next(zeros)
    return output
def superb_rain2(zeros,ones):
    z = iter(zeros).__next__
    output = [0] * z()
    for o in ones:
        output += (1,) * z()
    return output

(正如@schwobaseggl 指出的,元组使它快了大约 30%。)

基准测试结果:

0.14 us  0.13 us  0.13 us  baseline
3.04 us  3.02 us  2.98 us  original
3.27 us  3.19 us  3.29 us  chepner_1
5.03 us  5.12 us  5.25 us  chepner_2
4.66 us  4.74 us  4.68 us  chepner_2__superb_rain
2.52 us  2.53 us  2.47 us  Alain_T
3.35 us  3.27 us  3.42 us  python_user
1.02 us  0.99 us  1.04 us  superb_rain
1.07 us  1.11 us  1.09 us  superb_rain2

基准代码:

import timeit
from itertools import zip_longest,cycle,islice,repeat,chain

def baseline(zeros,ones):
    pass

def original(zeros,ones):
    zeros_list = [[0]*n for n in zeros]
    ones_list = [[1]*n for n in ones]
    output = [z for x in zip(zeros_list,ones_list) for y in x for z in y]
    output += [0]*zeros[-1]
    return output

def chepner_1(zeros,ones):
    return list(chain.from_iterable(chain.from_iterable(zip_longest((repeat(0,x) for x in zeros),(repeat(1,x) for x in ones),fillvalue=[]))))

def roundrobin(*iterables):
    "roundrobin('ABC','D','EF') --> A D E B F C"
    # Recipe credited to George Sakkis
    num_active = len(iterables)
    nexts = cycle(iter(it).__next__ for it in iterables)
    while num_active:
        try:
            for next in nexts:
                yield next()
        except StopIteration:
            # Remove the iterator we just exhausted from the cycle.
            num_active -= 1
            nexts = cycle(islice(nexts,num_active))
def chepner_2(zeros,ones):
    zero_groups = (repeat(0,x) for x in zeros)
    one_groups = (repeat(1,x) for x in ones)    
    return list(chain.from_iterable(roundrobin(zero_groups,one_groups)))
def chepner_2__superb_rain(zeros,ones):
    return list(chain.from_iterable(map(repeat,cycle([0,1]),roundrobin(zeros,ones))))

def Alain_T(zeros,ones):
    return [B for N,P in zip(zeros+[0],ones+[0]) for B in ([0]*N+[1]*P)]

def python_user(zeros,ones):
    res = [None] * (len(ones) + len(zeros))

    res[::2] = ([0]*n for n in zeros)
    res[1::2] = ([1]*n for n in ones)

    res = [y for x in res for y in x]
    return res

def superb_rain(zeros,) * next(zeros)
    return output

def superb_rain2(zeros,) * z()
    return output

funcs = [
    baseline,original,chepner_1,chepner_2,chepner_2__superb_rain,Alain_T,python_user,superb_rain,superb_rain2,]

zeros = [2,3,1,2]
ones = [3,4,5]
number = 10**5

expect = original(zeros,ones)
for func in funcs:
    print(func(zeros,ones) == expect,func.__name__)
print()

tss = [[] for _ in funcs]
for _ in range(4):
    for func,ts in zip(funcs,tss):
        t = min(timeit.repeat(lambda: func(zeros,ones),number=number)) / number
        ts.append(t)
        print(*('%.2f us ' % (1e6 * t) for t in ts[1:]),func.__name__)
    print()
,

带有列表理解的 Zip 应该可以解决问题。

int

注意 int_least32_t 是为了确保您不会在 zip 操作中删除零列表中的最后一个值。

,

您可以使用 itertools.chainzip_longestitertools.repeat 来创建一个不太混乱的单行。

>>> list(chain.from_iterable(chain.from_iterable(zip_longest((repeat(0,fillvalue=[]))))
[0,0]

在我的机器上,这需要 3.34 微秒。更重要的是,它是 list 的包装器需要这个时间。迭代器本身会根据需要生成元素,如果您实际上一次不需要它们。


list(chain.from_iterable(
        chain.from_iterable(zip_longest((repeat(0,fill_value=[]))))
  • (repeat(0,x) for x in zeros) 创建一系列 repeat 对象,代表您的 0 运行;同样创建 1 组。
  • zip_longest 将它们压缩成对的序列,添加一个什么都不做的空列表来平衡 zeros 中的额外值
  • chain.from_iterable 将该序列展平(从 (a,b),(c,d)(a,b,c,d)
  • 外部 chain.from_iterable 然后将 repeat 对象展平为单个序列,该序列 list 变成一个列表。

您还可以使用 roundrobin 文档中的 itertools 配方简化单行,该配方处理合并零组和一组以及第一轮展平。>

from itertools import cycle,chain

zeros = [2,5]

# From the itertools documentation
def roundrobin(*iterables):
    "roundrobin('ABC',num_active))


zero_groups = (repeat(0,x) for x in zeros)
one_groups = (repeat(1,x) for x in ones)
    
print(list(chain.from_iterable(roundrobin(zero_groups,one_groups))))

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?