微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python开发的10个小贴士

  下面是十个Python中很有用的贴士和技巧。其中一些是初学这门语言常常会犯的错误

  注意:假设我们都用的是Python 3

 1. 列表推导式

  你有一个list:bag = [1,2,3,4,5]

  现在你想让所有元素翻倍,让它看起来是这个样子:[2,6,8,10]

  大多初学者,根据之前语言的经验会大概这样来做

bag = [1,5]  
for i in range(len(bag)):  
    bag[i] = bag[i] * 2

  但是有更好的方法

bag = [elem * 2 for elem in bag]

  很简洁对不对?这叫做Python的列表推导式。

  点击Trey Hunner’s tutorial查看更多关于列表推导式的介绍。

 2. 遍历列表

  继续,还是上面的列表。

  如果可能尽量避免这样做:

bag = [1,5]  
for i in range(len(bag)):  
    print(bag[i])

  取而代之的应该是这样:

bag = [1,5]  
for i in bag:  
    print(i)

  如果x是一个列表,你可以对它的元素进行迭代。多数情况下你不需要各元素的索引,但如果你非要这样做,那就用enumerate函数。它像下边的样子:

bag = [1,5]  
for index,element in enumerate(bag):  
    print(index,element)

  非常直观明了。

 3. 元素互换

  如果你是从java或者C语言转到Python来,可能会习惯于这样:

a = 5  
b = 10

# 交换 a 和 b
tmp = a  
a = b  
b = tmp

  但Python提供了一个更自然更好的方法

a = 5  
b = 10  
# 交换a 和 b
a,b = b,a

  够漂亮吧?

 4. 初始化列表

  假如你要一个是10个整数0的列表,你可能首先想到:

bag = []  
for _ in range(10):  
    bag.append(0)

  换个方式吧:

bag = [0] * 10

  看,多优雅。

  注意:如果你列表包含了列表,这样做会产生浅拷贝。

  举个例子:

bag_of_bags = [[0]] * 5 # [[0],[0],[0]]  
bag_of_bags[0][0] = 1 # [[1],[1],[1]]

  Oops!所有的列表都改变了,而我们只是想要改变第一个列表。

  改一改啦:

bag_of_bags = [[0] for _ in range(5)]  
# [[0],[0]]

bag_of_bags[0][0] = 1  
# [[1],[0]]

  同时记住:

“过早优化是万恶之源”
问问自己,初始化一个列表是必须的吗?

 5. 构造字符串

  你会经常需要打印字符串。要是有很多变量,避免下面这样:

name = Raymond  
age = 22  
born_in = Oakland,CA  
string = Hello my name is  + name + and I'm  + str(age) +  years old. I was born in  + born_in + .  
print(string)

  额,这看起来多乱呀?你可以用个漂亮简洁的方法来代替,.format。

  这样做:

name = Raymond  
age = 22  
born_in = Oakland,CA  
string = Hello my name is {0} and I'm {1} years old. I was born in {2}..format(name,age,born_in) 
print(string)

  好多了!

 6. 返回tuples(元组

  Python允许你在一个函数中返回多个元素,这让生活更简单。但是在解包元组的时候出出线这样的常见错误

def binary():  
    return 0,1

result = binary()  
zero = result[0]  
one = result[1]

  这是没必要的,你完全可以换成这样:

def binary():  
    return 0,1

zero,one = binary()

  要是你需要所有的元素被返回,用个下划线_:

zero,_ = binary()

  就是这么高效率!

 7. 访问Dicts(字典)

  你也会经常给dicts中写入key,pair(键,值)。

  如果你试图访问一个不存在的于dict的key,可能会为了避免KeyError错误,你会倾向于这样做:

countr = {}  
bag = [2,1,5,7,9,7]  
for i in bag:  
    if i in countr:
        countr[i] += 1
    else:
        countr[i] = 1

for i in range(10):  
    if i in countr:
        print(Count of {}: {}.format(i,countr[i]))
    else:
        print(Count of {}: {}.format(i,0))

  但是,用get()是个更好的办法。

countr = {}  
bag = [2,7]  
for i in bag:  
    countr[i] = countr.get(i,0) + 1

for i in range(10):  
    print(Count of {}: {}.format(i,countr.get(i,0)))

  当然你也可以用setdefault来代替。

  这还用一个更简单却多费点开销的办法:

bag = [2,7]  
countr = dict([(num,bag.count(num)) for num in bag])

for i in range(10):  
    print(Count of {}: {}.format(i,0)))

  你也可以用dict推导式。

countr = {num: bag.count(num) for num in bag}

  这两种方法开销大是因为它们在每次count被调用时都会对列表遍历。

 8 使用库

  现有的库只需导入你就可以做你真正想做的了。

  还是说前面的例子,我们建一个函数来数一个数字在列表中出现的次数。那么,已经有一个库就可以做这样的事情。

from collections import Counter  
bag = [2,7]  
countr = Counter(bag)

for i in range(10):  
    print(Count of {}: {}.format(i,countr[i]))

  一些用库的理由:

  • 代码是正确而且经过测试的。
  • 它们的算法可能会是最优的,这样就跑的更快。
  • 抽象化:它们指向明确而且文档友好,你可以专注于那些还没有被实现的。
  • 最后,它都已经在那儿了,你不用再造轮子了。

 9. 在列表中切片/步进

  你可以指定start的点和stop点,就像这样list[start:stop:step]。我们取出列表中的前5个元素:

bag = [0,9]  
for elem in bag[:5]:  
    print(elem)

  这就是切片,我们指定stop点是5,再停止前就会从列表中取出5个元素。

  要是最后5个元素怎么做?

bag = [0,9]  
for elem in bag[-5:]:  
    print(elem)

  没看明白吗?-5意味着从列表的结尾取出5个元素。

  如果你想对列表中元素间隔操作,你可能会这样做:

bag = [0,9]  
for index,elem in enumerate(bag):  
    if index % 2 == 0:
        print(elem)

  但是你应该这样来做:

bag = [0,9]  
for elem in bag[::2]:  
    print(elem)

# 或者用 ranges
bag = list(range(0,10,2))  
print(bag)

  这就是列表中的步进。list[::2]意思是遍历列表同时两步取出一个元素。

  你可以用list[::-1]很酷的翻转列表。

 10. tab键还是空格键

  长时间来看,将tab和空格混在一起会造成灾难,你会看到IndentationError: unexpected indent。不管你选择tab键还是空格键,你应该在你的文件和项目中一直保持使用。

  一个使用空格而不是tab的原因是,tab不是在所有编辑器中都一样的。视呢所用的编辑器,tab可能会被当作2到8个空格。

  你也可以在写代码时用空格来定义tab。这样你可以自己选择用几个空格来当做tab。大多数Python用户是用4个空格。

  英文原文:The Python Way: 10 Tips

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


使用爬虫利器 Playwright,轻松爬取抖查查数据 我们先分析登录的接口,其中 url 有一些非业务参数:ts、he、sign、secret。 然后根据这些参数作为关键词,定位到相关的 js 代码。 最后,逐步进行代码的跟踪,发现大部分的代码被混淆加密了。 花费了大半天,来还原这些混淆加密的代码
轻松爬取灰豚数据的抖音商品数据 调用两次登录接口实现模拟登录 我们分析登录接口,发现调用了两次不同的接口;而且,需要先调用 https://login.huitun.com/weChat/userLogin,然后再调用 https://dyapi.huitun.com/userLogin 接口。 登
成功绕过阿里无痕验证码,一键爬取飞瓜数据 飞瓜数据的登录接口,接入了阿里云的无痕验证码;通过接口方式模拟登录,难度比较高。所以,我们使用自动化的方式来实现模拟登录,并且获取到 cookie 数据。 [阿里无痕验证码] https://help.aliyun.com/document_detail/1
一文教你从零开始入门蝉妈妈数据爬取,成功逆向破解数据加密算法 通过接口进行模拟登录 我们先通过正常登录的方式,分析对应的登录接口。通过 F12 打开谷歌浏览器的调试面板,可以看到登录需要传递的一些参数;其中看到密码是被加密了。 不过我们通过经验可以大概猜测一下,应该是通过 md5 算法加密了。 接下
抽丝剥茧成功破解红人点集的签名加密算法 抽丝剥茧破解登录签名算法,成功实现模拟登录 headers = {} phone_num = "xxxx" password = "xxxx" md5_hash = hashlib.md5() md5_hash.upda
轻松绕过 Graphql 接口爬取有米有数的商品数据 有米有数数据的 API 接口,使用的是一种 API 查询语言 graphql。所有的 API 只有一个入口,具体的操作隐藏在请求数据体里面传输。 模拟登录,获取 sessionId 调用登录接口,进行模拟登录。 cookies = {} head
我最近重新拾起了计算机视觉,借助Python的opencv还有face_recognition库写了个简单的图像识别demo,额外定制了一些内容,原本想打包成exe然后发给朋友,不过在这当中遇到了许多小问题,都解决了,记录一下踩过的坑。 1、Pyinstaller打包过程当中出现warning,跟d
说到Pooling,相信学习过CNN的朋友们都不会感到陌生。Pooling在中文当中的意思是“池化”,在神经网络当中非常常见,通常用的比较多的一种是Max Pooling,具体操作如下图: 结合图像理解,相信你也会大概明白其中的本意。不过Pooling并不是只可以选取2x2的窗口大小,即便是3x3,
记得大一学Python的时候,有一个题目是判断一个数是否是复数。当时觉得比较复杂不好写,就琢磨了一个偷懒的好办法,用异常处理的手段便可以大大程度帮助你简短代码(偷懒)。以下是判断整数和复数的两段小代码: 相信看到这里,你也有所顿悟,能拓展出更多有意思的方法~
文章目录 3 直方图Histogramplot1. 基本直方图的绘制 Basic histogram2. 数据分布与密度信息显示 Control rug and density on seaborn histogram3. 带箱形图的直方图 Histogram with a boxplot on t