Anders Wang


我所认识的每个人都是榜样,都有值得我去尊敬和学习的地方。


Python标准库itertools模块

我们知道,迭代器在Python中是一种非常高效又好用的数据结构,迭代器的特点是可以做到惰性求值(lazy evaluation的概念) ,什么意思呢?就是只有当迭代到某个值的时候它才会被计算产生,比如要遍历一个大文件或者庞大的数据集时,使用传统的遍历就需要将它们一次性全部储存在内存中,而使用迭代器显而易见的好处则是每次只从对象中读取一条数据,不会造成内存的过大开销。

itertools中的函数大多是返回各种迭代器对象,其中很多函数的作用我们平时要写很多代码才能达到,而在运行效率上反而更低,所以直接使用现有系统库才是明智之选。

来看看几个非常有用的itertools库里的方法。

accumulate()

accumulate()方法是用于计算累积的值,简单的说就是累加:

from itertools import accumulate

for item in accumulate([1, 2, 3, 4, 5]):  
    print(item)

# 输出如下:
# 1
# 3
# 6
# 10
# 15
# 1

combinations()

combinations()方法可以返回允许重复的元素组合,第一个参数输入可迭代iterable类型,第二个参数输入预期组合的个数。

from itertools import combinations

for i in combinations([1,2,3], 2):  
    print(i)

# 输出如下:
# (1, 2)
# (1, 3)
# (2, 3)

如上例子可以发现,我们在1,2,3元素中,可以获得(1,2)和(1,3)和(2,3)组合,这里面顺序组合是无关的。

cycle()

cycle()方法是无限的将它的参数之间循环迭代,直到人为停止。

from itertools import cycle

for item in cycle([1, 2, 3]):  
    print(item)

# 输出如下:
# 1
# 2
# 3  
# 1
# 2
# 3 
# ......
# 1
# 2
# 3  

chain()

chain()方法可以连接多个列表或者迭代器。

from itertools import chain

for item in chain([1,2,4,'a'], range(0,5)):  
    print(item)

# 输出如下:
# 1
# 2
# 4
# a
# 0
# 1
# 2
# 3
# 4

itertools库中还有不少方法函数,但是只有经常使用才能够熟练,如上是一些比较常用的函数。

最近的文章

numpy.where的用法

在用Python处理大量数据时,Python的数据科学库极为有用,这里要提到的就是Numpy库。在Numpy库里有个where函数,它是Python中三元表达式 x if condition else…

Python, 技术博文详细阅读
更早的文章

Python另类格式化f-strings特性

我们都知道在Python中字符串格式化常用的有百分号操作符(%)和 str.format()方式,前者最早是在Python 2.5版本以前所支持的,之后便推出了后者。而在Python3.6发布之后,在…

Python, 技术博文详细阅读
comments powered by Disqus