使用Python将数据保存到Excel文件
前面,我们已经学习了如何从Excel文件中读取数据,参见:
接下来,要知道的另一件重要事情是如何使用Python将数据保存回Excel文件。为什么要再回到Excel?嗯,因为我们大多数人只熟悉Excel,所以我们必须说他们的语言。但是,这并不妨碍我们使用另一种语言来简化我们的工作
保存数据到Excel文件
使用pandas将数据保存到Excel文件也很容易。最简单的方法如下:df.to_excel(),它将数据框架保存到Excel文件中。与df.read_excel()类似,这个to_excel()方法也有许多可选参数。这里我们只看其中几个参数,如果你想了解完整的参数列表,建议你阅读pandas官方文档。
让我们看一个例子,首先我们需要准备好一个用于保存的数据框架。我们将使用与read_excel()示例相同的文件。你可以在到知识星球完美Excel社群找到这个文件。
图1:由Python创建Excel文件代码
注:根据网友的建议,换成了jupyter,看起来更好些了。
在执行上述代码之后,我们将有一个名为“保存_用户.xlsx”的新文件,它是由Python创建的,结果如下:
图2:Python保存一个Excel文件
让我们打开文件,看看里面是否有相同的数据。
图3:由Python保存的Excel文件
我们会发现,列A包含一些看起来像从0开始的列表。如果你不想要这额外增加的列,可以在保存为Excel文件的同时删除该列。
使用pandas保存Excel文件时删除起始索引
.to_excel()方法提供了一个可选的参数index,用于控制我们刚才看到的额外添加的列表。我们可以通过以下方式从Excel输出文件中删除该列表:
df.to_excel('D:\保存_用户.xlsx’, index = False)
其他有用的可选参数
sheet_name:如果不喜欢默认的“Sheet1”,可以命名工作表。
na_rep:替换数据框架中“Null”值的值,默认情况下这是一个空字符串“”。但是,如果数据框架包含数字,则可能需要将其设置为np_rep=0。
columns:选择要输出的列。可能通常不使用此选项,因为在保存到文件之前,可以在数据框架中删除列。
保存数据到CSV文件
我们可以使用df.to_csv()将相同的数据框架保存到csv文件中。这些参数类似于to_excel(),因此不会在这里重复介绍它们。只是指出一个细微的区别,但这确实是Excel和CSV文件之间的区别:
CSV文件基本上是一个文本文件,它只包含一张工作表,所以我们不能重命名该工作表。
注:本文学习整理自pythoninoffice.com。