使用Python Pandas模块操作Excel数据

2024-05-19 02:24:43

如何示例 Excel 数据

我们以Python Pandas数据加载类型表格为例，演示Python Pandas Excel操作。

本文将使用Pandas中 read_excel 函数来读取 Excel 文件，并存储成DataFrame格式，本文将介绍如何使用 iloc 、loc 方法获取 DataFrame中对应的数据，实现Execl数据的获取。

read_excel的主要参数

io: excel文档路径。
sheetname : 读取的excel指定的sheet页，若多个则为列表。
header ：设置读取的excel第一行是否作为列名称。
skiprows：省略指定行数的数据。
skip_footer：省略从尾部数的int行数据。
index_col：设置读取的excel第一列是否作为行名称。
names：设置每列的名称，数组形式参数。
usecols：读取指定的列, 也可以通过名字或索引值。

读取Excel文件

根据上述参数介绍，我们通过指定表单名和指定列的方式来读取文件

如下，我们可以看到读取的Excel数据类型为DataFrame类型：

使用 iloc 从DataFrame中筛选数据

iloc 语法

data.iloc[<row selection>, <column selection>]

iloc 在Pandas中是用来通过数字来选择数据中具体的某些行和列。可以设想每一行都有一个对应的下标（0,1,2，...)，通过 iloc 我们可以利用这些下标去选择对应的行数据。同理，对于行也一样，通过这些下标也可以选择对应的列数据。

需要注意的是0表示第一行，但不包含表头。

选择单行或单列

选择数据中的第一行。

选择数据中的最后一行。

选择数据中的第一列。

选择数据中的最后一列。

行列混合选择

选择数据中的第 1-3 行的所有列。

选择数据中的前2列的所有行。

选择第 0, 2, 4行和第 1,3 列。

选择第0 到第3行的第0 到第2列。

使用 iloc 仅选择了单独的一行或一列，返回的数据为 Series 类型。若选择了多行数据则会返回 DataFrame 类型，若只选择了一行，但需要要返回 DataFrame 类型，可以传入一个单值列表，如[1]，如下：

使用 loc 从DataFrame中筛选数据

data.loc[<row selection>, <column selection>]

ioc 用于以下两种场景：

使用下标查找
使用条件查找

使用下标查找

选择数据中的第一行。

选择数据中的前二行。

选择第1到3行的 READER、WRITER列。

选择第1、2行的 DATA DESCRIPTION 到 WRITER列。

需要注意 excel.loc[[1]] 不等价于 excel.iloc[[1]] ，前者是选择索引为1的行，而后者是选择第1行，DataFrame的索引可以是数字或者是字符串。

使用逻辑判断选择数据

选择WRITER列等于to_json的 DATA DESCRIPTION列到 WRITER列。

同样，如果只选择了某一列，返回的数据是 Series 类型，若只选择了一行，但需要要返回 DataFrame 类型，可以传入一个单值列表，如[1]。

选择 READER的值中是以 'read' 开头的行的所有列。

选择'WRITER' 等于['to_csv', 'to_json']值的行。

选择READER = 'read_csv' 并且 READER 是以 'read'开头的行。

利用apply的lambda函数判断符合条件的行，如下选择READER由“_”链接的行的所有列。

利用apply的lambda函数判断符合条件的行的'DATA DESCRIPTION', 'READER' 列。

Pandas中 apply、 applymap、 map 的区别

map仅是Series中的函数，map将函数应用于Series中的每一个元素。
apply和applymap是仅是DataFrame 中的函数。
apply 将函数作用于DataFrame中的每一个行或者列。
applymap将函数作用于DataFrame中的每一个元素。

赞 (0)

(3条消息) 【学习笔记】python实现excel数据处理

概述 Excel固然功能强大,也有许多函数实现数据处理功能,但是Excel仍需大量人工操作,虽然能嵌入VB脚本宏,但也容易染上宏病毒.python作为解释性语言,在数据处理方面拥有强大的函数库以及第三 ...
Pandas数据处理方法（包括数据库数据和普通文件数据）

pandas是一个强大的分析结构化数据的工具集:它的使用基础是Numpy(提供高性能的矩阵运算):用于数据挖掘和数据分析,同时也提供数据清洗功能. Pandas中常见的数据结构有两种: Series ...
（附代码）Pandas必会的方法汇总，用Python做数据分析更加如鱼得水！

编者荐语用Python做数据分析光是掌握numpy和matplotlib可不够,Pandas是必须要掌握的一个重点,numpy虽然能够帮我们处理处理数值型数据,但是这还不够,很多时候,我们的数据除了数 ...
Selenium2+python自动化58-读取Excel数据（xlrd）

前言当登录的账号有多个的时候,我们一般用excel存放测试数据,本节课介绍,python读取excel方法,并保存为字典格式. 一.环境准备 1.先安装xlrd模块,打开cmd,输入pip inst ...
pandas如何操作Excel？还不会的，看此一篇足矣

Python 操作Excel操作总结,包括Series和Data Frame的互转.使用pandas读取Excel表格.python读取多个数据表.python合并多个工作表以及写入Excel文件 p ...
python 读取多个excel数据写入同一个excel中

一.将excel数据源存储到同一个excel的不同sheet 中例如A.xlsx 中有test1,test2 两张sheet.B.xlsx中有test3 一张sheet,存储到C.xlsx中后,C有 ...
怎么在word文档中动态操作excel数据

如何在word文档中动态操作excel数据在excel中可以完美高效的操作数据提高工作效率,制作好表格,复制到word文档中. 解决方法:将excel数据复制到我认得文档中的具体操作方法如下: ...
大话 Python：python 操作 excel 系列 -- 数据汇总与统计

原创 Sir 老王 Python 集中营 1周前在完成了前面系列的数据整理.数据清洗.数据提取与筛选之后,我们需要对进行进一步的汇总与统计使数据变成我们的可用信息. 1,数据分类汇总 # 对指定列分 ...
Python操作Excel制作可视化数据图，实现自动化办公

前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于IT入门安装操作一个简单的Excel文档操作注释及代码: 操作完成后,数 ...
Python pandas合并Excel多个Sheet表数据

Python pandas合并Excel多个Sheet表数据
Python利用pandas处理Excel数据的应用详解

最近迷上了高效处理数据的pandas,其实这个是用来做数据分析的,如果你是做大数据分析和测试的,那么这个是非常的有用的!!但是其实我们平时在做自动化测试的时候,如果涉及到数据的读取和存储,那么而利用p ...
Python 中利用Pandas处理复杂的Excel数据

关于Excel数据处理,很多同学可能使用过Pyhton的pandas模块,用它可以轻松地读取和转换Excel数据.但是实际中Excel表格结构可能比较杂乱,数据会分散不同的工作表中,而且在表格中分布很 ...