dataframe的一些用法

pandas中Dataframe的一些用法

pandas读取excel文件

  • pd.read_excel 前提是安装xlrd库

dataframe,numpy,list之间的互相转换

  • dataframe转numpy :dataframe对象.values
  • dataframe转list:dataframe对象.values.tolist()
  • list转numpy:np.array(list对象)
  • list转dataframe:pd.DataFrame(list对象)
  • numpy转list:numpy对象.tolist()
  • numpy转dataframe:pd.DataFrame(numpy对象)

dataframe 按行遍历,按列遍历

  • 按行遍历:

    常用df.iterrows()

    import pandas as pd
    demo_list = [[1,2],
                 [3,4]]
    #用list构建dataframe
    demo_df = pd.DataFrame(demo_list)
    print(demo_df)
    
    
#接上
for row in demo_df.iterrows():
print(type(row))
    print(row[0])
    print(row[1])

可以看到每个row的类型是tuple元组类型,元组长度为2,元组第0个元素为index,第1个元素为横向的series。**值得注意的是,在遍历过程中如果取每一行的某个值,通过对row[1]进行切片即可。 **

  • 按列遍历

    经常使用df.columns获取列名然后访问

    #接上
    print(demo_df.columns)
    for column in demo_df.columns:
        print(demo_df[column])
    

dataframe之使用iloc切片

  • 先构建dataframe
import numpy as np
import pandas as pd
##list构建5x5的dataframe,由于dataframe没有reshape,因此需要借助numpy
demo_list = [i for i in range(25)]
demo_np = np.array(demo_list).reshape(5,5)
demo_df = pd.DataFrame(demo_list)
print(demo_df)
  • iloc[start:end ,start :end ]表示按行列取出dataframe的值。其中逗号前面表示行,逗号后面表示列。冒号左侧表示开始,冒号右侧表示结束(遵循左闭右开原则)。例如,demo_df.iloc[2:4,1:3]表示切片第二行到第三行 第一列到第二列数据。 切片返回的数据类型还是dataframe。
  • iloc[start: end :step,start:end :step]是在上一个切片的基础上加上了步长。表示从start到end每step步取一次值。

dataframe 中缺失值的处理

  • 均值填充

    通常使用fillna()

    ##获取存在缺失值的列名列表
    null_columns=list(file_df.columns[file_df.isnull().sum() > 0])
    for column in null_columns :
        #计算每一列的均值
    mean_val = file_df[column].mean()
    #使用fillna进行均值填充
        file_df[column].fillna(mean_val, inplace=True)
    
(0)

相关推荐

  • Python实现量化选股

    什么是选股? 选股(stock selection)是一种主动性投资策略,先按照某种规则或算法分析单只股票的前景,然后构建一个投资组合,长期持有.一般情况下要求组合的股票具有低相关性,这样才能对冲系统 ...

  • EXCEL Range用法集

    来源:博客园 网址:https://www.cnblogs.com/aademeng/articles/12952659.html 标签:Execl,Range,用法 收藏:株野 作者:天涯海角路 日 ...

  • 地支藏干用法

    地支藏干歌诀 子宫癸水在其中,丑癸辛金己土同: 寅宫甲木兼丙戊,卯宫乙木独一苗, 辰藏乙戊三分癸,巳中庚金丙戊丛: 午宫丁火己土同,未宫乙己丁共宗: 申位庚金壬水戊,酉宫辛金独丰隆: 戌宫辛金及丁戊, ...

  • 身和体的定义及用法

    ​易山/文 盲派命法,身旺不旺无所谓,体旺就行,体旺也能做事. 身:指日干. 体:指印比食伤禄(除财官以外的神). 身和体是取得财官的工具. 我的体能制住财官,我能踏实干事,能担当.制不住财官,偷奸耍 ...

  • 中学英语16种时态完美精讲(每一种用法配一例句)

    中学英语时态共有16种,分别是一般现在.一般过去.一般将来.过去将来时,以及这四者的进行时.完成时和完成进行时. 在不同的时态中,动词都会发生相应变化,时间状语的运用也会有所不同.究竟怎样区分不同时态 ...

  • 附子理中丸、桂附理中丸、枳实理中丸有什么区别?用法都在这了

    附子理中丸、桂附理中丸、枳实理中丸有什么区别?用法都在这了

  • 2.6 多条件“或”函数or的用法

    多条件"或"函数or的用法

  • 解题技巧:梳理总结高考导数的十四种用法

    文章行文思路如下: ..... 备考策略:高考数学最后一课(共8篇) 普通中学拔尖创新人才培养的关键路径与现实思考 数学编题那点事?--以教材为起点的试题设计

  • 初天麟:秘传算命术之八字胎元、命宫的用法,请珍惜(有口诀)

    在命理学中,胎元和命宫也是两个非常重要的方面,在具体论命看事时常常如有神助.但我们常见的八字著作中,却不见提及.在<三命通会>有较详细的描述,但绕弯弯太多,很容易晕圈了.在各种排盘网站上也 ...

  • 关于BOLL布林带用法释疑补充

    大凡忽悠小白的嗜血分析师,很少有不爱BOLL布林带的,为何:轨迹用法形象生动,英文中译名高端大气,内在玄妙抬头不见阳春白雪,低头不见下里巴人.实乃迷惑弑杀小白的第一暗器. 关于BOLL的用法,我们已经 ...