为什么这个 Python 函数对包含为字符串的整数进行排序比这个慢?

如何解决为什么这个 Python 函数对包含为字符串的整数进行排序比这个慢?

我有两个 Python 函数,用于对包含为字符串的整数列表进行排序。它们如下:

import random

n = 10000000
unsorted = [str(x) for x in range(n)]
random.shuffle(unsorted)

def sort_alg1(unsorted):
    unsorted.sort(key = lambda x: int(x))
    return unsorted

def sort_alg2(unsorted):
    l=list(map(int,unsorted))
    l.sort()
    s=list(map(str,l))
    return s

print(sort_alg1(unsorted))
print(sort_alg2(unsorted))

两者都按预期工作。但是,根据我的分析器(我使用的是 Robert Kern 广受欢迎的 line_profiler),第一个函数,即 sort_alg1 的执行速度比 sort_alg2 慢 3 倍以上。现在,如果我能查明原因,那不会是一个大问题,但我不能。我曾尝试查找内置 sort() 方法map() 函数、lambda 等中的差异,但都无济于事。如果有人能告诉我为什么会发生这种情况,那就太好了!

解决方法

做一些基准测试:

from timeit import timeit
import random

n = 1_000_000
unsorted = [str(x) for x in range(n)]
random.shuffle(unsorted)


def sort_alg1(unsorted):
    unsorted.sort(key=lambda x: int(x))
    return unsorted


def sort_alg2(unsorted):
    l = list(map(int,unsorted))
    l.sort()
    s = list(map(str,l))
    return s


t1 = timeit(lambda: sort_alg1(unsorted),number=1)
t2 = timeit(lambda: sort_alg2(unsorted),number=1)

print(t1)
print(t2)

打印:

0.4568827738985419
0.2486396620515734

所以 sort_alg2 似乎更快。但原因是 sort_alg2sort_alg1 接收已经排序的数组。如果您稍微更改基准:

t1 = timeit(lambda: sort_alg1(unsorted),number=1)
random.shuffle(unsorted)                      # <---- shufle again the array
t2 = timeit(lambda: sort_alg2(unsorted),number=1)

print(t1)
print(t2)

打印:

0.456114097032696
0.5958397497888654

所以第一个函数更快。

, 函数 unsorted.sort 中的

sort_alg1 对列表进行原地排序,这样 sort_alg2 就不会从完全相同的 unsorted 列表版本开始。此外,一旦 sort_alg2 执行语句 l = list(map(int,unsorted)),如果我们按整数值排序,l 现在是一个完全排序的列表。所以 l.sort() 将在微不足道的时间内运行。

注意 assert 函数中的 sort_alg2 语句:

import random

n = 10000000
unsorted = [str(x) for x in range(n)]
random.shuffle(unsorted)

def sort_alg1(unsorted):
    unsorted.sort(key = lambda x: int(x))
    return unsorted

def sort_alg2(unsorted):
    l=list(map(int,unsorted))
    # make a copy of l:
    l2 = l.copy()
    l.sort()
    assert(l == l2) # proof!
    s=list(map(str,l))
    return s

sort_alg1(unsorted)
sort_alg2(unsorted)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?