Python标准库itertools模块
我们知道,迭代器在Python中是一种非常高效又好用的数据结构,迭代器的特点是可以做到惰性求值(lazy evaluation的概念) ,什么意思呢?就是只有当迭代到某个值的时候它才会被计算产生,比如要遍历一个大文件或者庞大的数据集时,使用传统的遍历就需要将它们一次性全部储存在内存中,而使用迭代器显而易见的好处则是每次只从对象中读取一条数据,不会造成内存的过大开销。
itertools中的函数大多是返回各种迭代器对象,其中很多函数的作用我们平时要写很多代码才能达到,而在运行效率上反而更低,所以直接使用现有系统库才是明智之选。
来看看几个非常有用的itertools库里的方法。
accumulate()
accumulate()方法是用于计算累积的值,简单的说就是累加:
from itertools import accumulate
for item in accumulate([1, 2, 3, 4, 5]):
print(item)
# 输出如下:
# 1
# 3
# 6
# 10
# 15
# 1
combinations()
combinations()方法可以返回允许重复的元素组合,第一个参数输入可迭代iterable类型,第二个参数输入预期组合的个数。
from itertools import combinations
for i in combinations([1,2,3], 2):
print(i)
# 输出如下:
# (1, 2)
# (1, 3)
# (2, 3)
如上例子可以发现,我们在1,2,3元素中,可以获得(1,2)和(1,3)和(2,3)组合,这里面顺序组合是无关的。
cycle()
cycle()方法是无限的将它的参数之间循环迭代,直到人为停止。
from itertools import cycle
for item in cycle([1, 2, 3]):
print(item)
# 输出如下:
# 1
# 2
# 3
# 1
# 2
# 3
# ......
# 1
# 2
# 3
chain()
chain()方法可以连接多个列表或者迭代器。
from itertools import chain
for item in chain([1,2,4,'a'], range(0,5)):
print(item)
# 输出如下:
# 1
# 2
# 4
# a
# 0
# 1
# 2
# 3
# 4
itertools库中还有不少方法函数,但是只有经常使用才能够熟练,如上是一些比较常用的函数。