第39天: Python itertools 模块

简介

在 Python 中,迭代器是一种非常好用的数据结构,其最大的优势就是延迟生成,按需使用,从而大大提高程序的运行效率。而 itertools 作为 Python 的内置模块,就为我们提供了一套非常有用的用于操作可迭代对象的函数。

常用功能

count 功能详解

count(start=0,step=1) 函数有两个参数,其中 step 是默认参数,可选的,默认值为 1。该函数返回一个新的迭代器,从 start 开始,返回以 step 为步长的均匀间隔的值。

import itertoolsx = itertools.count(1,2)for k in x:print(k, end=", ")
# 输出结果如下 无穷无尽1, 3, 5, 7, 9, 11, 13, 15, ...

cycle 功能详解

cycle(iterable) 该函数会把接收到的序列无限重复下去。

import itertoolsx = itertools.cycle("XYZ")for k in x:print(k, end = ", ") # 输出结果如下 无穷无尽X, Y, Z, X, Y, Z, X, Y, Z, ...

注意,该函数可能需要相当大的辅助空间(取决于 iterable 的长度)。

repeat 功能详解

repeat(object, times) 该函数创建一个迭代器,不断的重复 object,当然如果指定 times 的话,则只会重复 times 次。

import itertoolsx = itertools.repeat("XYZ")for k in x:print(k, end = ", ") # 输出结果如下 无穷无尽XYZ, XYZ, XYZ, XYZ, XYZ, XYZ, ...
import itertoolsx = itertools.repeat("XYZ", 3)print(list(x))
# 输出结果如下 只会输出三次['XYZ', 'XYZ', 'XYZ']

注意:无限循环迭代器只有在 for 循环中才会不断的生成元素,如果只是创建一个迭代器对象,则不会事先生成无限个元素。

chain 功能详解

chain(*iterables) 该函数创建一个新的迭代器,会将参数中的所有迭代器全包含进去。

import itertoolsx = itertools.chain("abc", "xyz")print(list(x))
# 输出结果如下['a', 'b', 'c', 'x', 'y', 'z']

groupby 功能详解

groupby(iterable, key=None) 分组函数,将 key 函数作用于序列的各个元素。根据 key 函数的返回值将拥有相同返回值的元素分到一个新的迭代器。类似于 SQL 中的 GROUP BY 操作,唯一不同的是该函数对序列的顺序有要求,因为当 key 函数的返回值改变时,迭代器就会生成一个新的分组。因此在使用该函数之前需要先使用同一个排序函数对该序列进行排序操作。

import itertoolsdef sortBy(score):if score > 80:return "A"elif score >= 60:return "B"else:return "C"
scores = [81, 82, 84, 76, 64, 78, 59, 44, 55, 89]for m, n in itertools.groupby(scores, key=sortBy):print(m, list(n))
# 输出结果如下A [81, 82, 84]B [76, 64, 78]C [59, 44, 55]A [89]

我们可以看到,该函数根据我们自定义的排序函数 sortBy 将列表中的元素进行了分组操作,只是我们发现最后一个怎么多了一个 A 的分组呢,这就是我们上面说所得「当 key 函数的返回值改变时,迭代器就会生成一个新的分组」。所以,我们需要事先对列表用 sortBy 函数排一下序。

scores = [81, 82, 84, 76, 64, 78, 59, 44, 55, 89]scores = sorted(scores, key=sortBy)for m, n in itertools.groupby(scores, key=sortBy):print(m, list(n))
# 输出结果如下A [81, 82, 84]B [76, 64, 78]C [59, 44, 55]A [89]

compress 功能详解

compress(data, selectors) 该函数功能很简单,就是根据 selectors 中的值判断是否保留 data 中对应位置的值。

import itertoolsdata = [81, 82, 84, 76, 64, 78]tf = [1,1,0,1,1,0]print(list(itertools.compress(data, tf)))
# 输出结果如下[81, 82, 76, 64]

dropwhile 功能详解

dropwhile(predicate, iterable) 创建一个迭代器,从 predicate 首次为 false 时开始迭代元素。

import itertoolsx = itertools.dropwhile(lambda x: x < 5, [1,3,5,7,4,2,1])print(list(x))
# 输出结果如下[5, 7, 4, 2, 1]

由以上得知,即使 predicate 首次为 false 后面的元素不满足 predicate 也同样会被迭代。

filterfalse 功能详解

filterfalse(predicate, iterable) 创建一个迭代器,返回 iterable 中 predicate 为 false 的元素。

import itertoolsx = itertools.filterfalse(lambda x: x < 5, [1,3,5,7,4,2,1])print(list(x))
# 输出结果如下[5, 7]

islice 功能详解

islice(iterable, start, stop[, step]) 对 iterable 进行切片操作。从 start 开始到 stop 截止,同时支持以步长为 step 的跳跃。

import itertoolsprint(list(itertools.islice('123456789', 2)))print(list(itertools.islice('123456789', 2, 4)))print(list(itertools.islice('123456789', 2, None)))print(list(itertools.islice('123456789', 0, None, 2)))
# 输出结果如下['1', '2']['3', '4']['3', '4', '5', '6', '7', '8', '9']['1', '3', '5', '7', '9']

starmap 功能详解

starmap(function, iterable) 从可迭代对象中获取参数来执行该函数。

import itertoolsprint(list(itertools.starmap(pow,[(2,10), (3,3)])))
# 输出结果如下[1024, 27]

takewhile 功能详解

takewhile(predicate, iterable) 创建一个迭代器,遇到 predicate 为 false 则停止迭代元素。与 dropwhile 完全相反。

import itertoolsx = itertools.takewhile(lambda x: x < 5, [1,3,5,7,4,2,1])print(list(x))
# 输出结果如下[1, 3]

product 功能详解

product(*iterables, repeat=1) 输出可迭代对象的笛卡尔积,有点类似于嵌套循环。其中 repeat 可以设置循环次数。

import itertoolsprint(list(itertools.product("ab", "12")))print(list(itertools.product("ab", "ab")))print(list(itertools.product("ab", repeat=2)))
# 输出结果如下[('a', '1'), ('a', '2'), ('b', '1'), ('b', '2')][('a', 'a'), ('a', 'b'), ('b', 'a'), ('b', 'b')][('a', 'a'), ('a', 'b'), ('b', 'a'), ('b', 'b')]

permutations 功能详解

permutations(iterable, r=None) 返回 iterable 中长度为 r 的所有排列。默认值 r 为 iterable 的长度。即使元素的值相同,不同位置的元素也被认为是不同的。

import itertoolsprint(list(itertools.permutations("aba", r=2)))
# 输出结果如下[('a', 'b'), ('a', 'a'), ('b', 'a'), ('b', 'a'), ('a', 'a'), ('a', 'b')]

combinations 功能详解

combinations(iterable, r=None) 返回 iterable 中长度为 r 的有序排列。默认值 r 为 iterable 的长度。与 permutations 操作不同的是该函数严格按照 iterable 中元素的顺序进行排列。

import itertoolsprint(list(itertools.combinations("abc", r=2)))
# 输出结果如下[('a', 'b'), ('a', 'c'), ('b', 'c')]

combinations_with_replacement 功能详解

combinations_with_replacement(iterable, r=None) 返回 iterable 中长度为 r 的有序排列。默认值 r 为 iterable 的长度。与 combinations 操作不同的是该函数允许每个元素重复出现。

import itertoolsprint(list(itertools.combinations_with_replacement("abc", r=2)))
# 输出结果如下[('a', 'a'), ('a', 'b'), ('a', 'c'), ('b', 'b'), ('b', 'c'), ('c', 'c')]

itertools 总结

本文总结了 itertools 模块的常规操作,学习并掌握这些极为便利的操作非常有助于提高自己的编码效率。

示例代码:Python-100-days-day039

参考资料

https://docs.python.org/zh-cn/3/library/itertools.html

系列文章

   第38天:Python decimal 模块

   第37天:Python math 模块
   第36天:Python calendar 模块
   第35天:pathlib 模块
   第34天:Python json&pickle

   第33天:Python 枚举

第32天:Python logging 模块详解

第31天:Python random 模块详解

第30天:Python collections 模块详解

第29天:Python queue 模块详解

第28天:Python sys 模块详解

第27天:Python shutil 模块

第26天:Python os 模块详解

第25天:Python datetime 和 time

第24天:Python Standard Library 02

第23天:Python Standard Library 01

第22天:Python NameSpace & Scope

第21天:Web开发 Jinja2模板引擎

第0-20天:从 0 学习 Python 0-20 天合集

(0)

相关推荐

  • 读itertools源码,学会耶熬的yield

    itertools 想必大家也很困惑yield功用,这次可以阅读内置的itertools库中的函数实现方式,了解yield用法.并且在这过程中熟悉itertools库常用的一些用法. itertool ...

  • Python学习——内置函数与变量

    本节主要讲述python的内置函数.变量以及常用内置模块的函数. abs:求数值的绝对值 divmod:返回两个数值的商和余数,以元组形式返回 max:返回可迭代对象中的元素中的最大值或者所有参数的最 ...

  • 第一次把 Python 的切片理解得如此透彻

    来源:Python猫 作者:豌豆花下猫 众所周知,我们可以通过索引值(或称下标)来查找序列类型(如字符串.列表.元组-)中的单个元素,那么,如果要获取一个索引区间的元素该怎么办呢? 切片(slice) ...

  • python笔记46-史上最强大最好用的python日志模块nb_log

    前言 python的日志模块如何封装一值都是一个头疼的问题,封装的不好总是会出现重复打印等头疼问题. 现在终于找到一个最好用的日志模块nb_log,此日志模块由这位大佬开发的https://www.c ...

  • python random模块

    本篇介绍比较常用的一个标准模块,random. 这是一个随机数模块,可以用来随机生成随机数,经常被用于数学.游戏.算法等等上面. 1.导入random模块 要使用此模块,要先导入. import ra ...

  • python logging模块的几点总结

    http://www.voidcn.com/article/p-ctmbnbwp-bbo.html 关于使用python logging模块的几点总结 使用python的标准日志模块logging可以 ...

  • 第26天:Python os 模块详解

    第26天:Python os 模块详解

  • 第27天:Python shutil 模块

    shutil 可以看作 sh + util,即 shell 工具之意,该模块提供了一些针对文件和文件夹的高级操作,如:拷贝.删除.移动等,shutil 模块是对 os 模块的补充. 1 文件和文件夹操 ...

  • 第29天:Python queue 模块详解

    queue 模块即队列,特别适合处理信息在多个线程间安全交换的多线程程序中.下面我们对 queue 模块进行一个详细的使用介绍. 1 queue 模块定义的类和异常 queue 模块定义了以下四种不同 ...

  • 第30天:Python collections 模块

    第30天:Python collections 模块

  • 第31天:Python random 模块

    在本节中继续介绍 Python 提供的常用模块 random 模块,它的主要功能是用来生成伪随机数的. random 模块 Python 提供的 random 模块实现了各种分布式的伪随机数生成器.该 ...

  • 第32天:Python logging 模块详解

    This module defines functions and classes which implement a flexible event logging system for applic ...