什么是变量?

什么是变量?

用于描述一组数字性数据的工具是变异(variation)。变异是分散或者散布的量,以作为样本或者一个总体的一系列数据的形式。三个常用的衡量变异的方式是极差(range)、方差(variance)以及标准差(standard deviation)。

1、极差

极差是描述变异的最简单形式。极差等于最大值减去最小值:

极差=最大值-最小值

在早晨准备时间中,使用与时间有关的数据:

极差=最大值-最小值

极差=52-29=23(分钟)

这一数值意味着两天里在早晨准备时间差上最大是23分钟。

在表1、图1里订单的完成时间数据中,极差是54.3分钟。也就是说在两个订单的完成时间上最大的差值是54.3分钟。

表1 使用Minitab计算完成时间的描述性统计

图1 使用JMP计算完成时间的描述性统计量

2、方差和标准差

尽管极差可以衡量总的离散程度,但是极差并没有考虑变量值是如何围绕均值分布的。两个常用的衡量所有变量值是如何绕均值分布的方法是方差和标准差。这两个统计变量能衡量变量值是如何绕均值波动的。

一个简单的对均值考察的方式是考虑每个值与均值的差异,然后把这些差异加起来。但是,如果我们这样做的话会发现,因为均值是一系列数据的平衡点,对任何一个系列数据而言如果把这些差异加起来它们的和为零。一种衡量变异的方式是将每个值与均值的差值进行平方,再将平方和相加。在统计上这个数据叫做平方和,这一平方和除以变量个数减一(对样本数据)就可以得到样本方差。样本方差的平方根就是样本标准差(S)。这一统计方法是对于变异的最常用衡量方法。计算样本方差和样本标准差的步骤如下。

计算样本均值S2步骤如下:

1、计算每个值与均值之间的差值;

2、对每个差值进行平方;

3、将差值的平方进行相加;

4、将所得的和除以n-1。

取样本方差的平方根就是样本标准差。

表2介绍了计算样本方差和标准差的步骤,使用这一步骤计算早上准备时间数据(见表2)。我们可以发现个体值和均值间差值的总和是零。

表2 早上准备时间

计算样本方差S2可以通过差值平方和(412.4)除以样本个数(10)减1:

样本方差(S2)=412.4/9=45.82

因为差值是以平方的形式,计算样本标准差可以用样本方差的平方根,因此:

对于表1和图1中的订单完成时间数据,标准差是10.411分钟。怎样去理解这个值呢?标准差可以帮助我们去知道一组数据是如何分布在均值周围的。对于几乎所有系列数据都有一个简单的模型。大多数数据在均值的加减3标准差区间里面。因此知道均值和标准差通常可以帮助我们定义极差。对于订单的完成时间数据,认为大多数完成时间在69.637±(3)×10.411或者38.404分钟和100.87分钟。

我们可以对极差、方差、标准差的性质做如下表述:

1、数据分布越分散,极差、方差、标准差的值越大;

2、数据分布越集中,极差、方差、标准差的值越小;

3、如果数据值相同(数据间没有方差),数据分布越分散,极差、方差、标准差的值都为零;

4、极差、方差、标准差都会大于或者等于零。

(0)

相关推荐

  • 不要再问统计学了!

    大家好,我是宝器! 昨天在知乎看到一个问题:从零开始学数据分析,什么程度可以找工作,如何计划学习方案? 提问者背景是:在coursera 上面学data science 中的R programming ...

  • 【自动保存】python...

    ​题型: 1.单项选择题(1分*20= 20分) 2.算法基础(15+10+15分,,共40分) 3.算法实现(20分*2=40分) 重点 1.常见的数据的类型 关系数据库 事务数据库 数据仓库 高级 ...

  • 《人生感悟荟萃:婚姻是一场变量的叠加,结婚并不意味着一辈子的承诺和保险》

    婚姻是一场变量的叠加.结婚并不意味着一辈子的承诺和保险. 而是,步入了一场不确定的变量中. 你会拥有爱和被爱的关系,也会历经矛盾和冲突的考验. 你会有如意.钟意和爱意,也会有忍无可忍.无法再忍的时候. ...

  • 学会这两招,PLC编程也可以批量化定义变量-数组、结构

    数组 简单的说,就是多个相同类型数据一定顺序排列的集合,使用一个名字命名,并通过编号的方式对这些数据统一管理. 在PLC编程过程中,我们也经常遇到同类型的变量需要定义,例如10台电机的电流值,如果不使 ...

  • 批量改名:Stata变量名称变身大法

    批量改名:Stata变量名称变身大法

  • PLC高手编程都会用Slice方式对变量进行寻址

    编程S7-1200可以选择包含所声明变量的特定地址区域,可以访问宽为 1 位.8 位.16 位或 32 位的区域,这种访问类型称之为"片段访问"(Slice access).通过 ...

  • 4.1人教版数学八年级下册《变量》

    4.1人教版数学八年级下册《变量》

  • 数据库:分布式数据库•新变量

    数据库行业:行业螺旋上升,分布式数据库时代到来 数据库发展需要关注增量市场,分布式数据库或成新机遇 数据库的发展与计算载体紧密相关.数据库是计算机行业的基础核心软件,所有应用软件的运行和数据处理都要与 ...

  • CNC | M8共变量中文注释功能设置方法

    共变量中文注释,先来了解下 共变量是宏程序的重要组成部分,它能够在宏程序中任意位置通用.在不同类型的数控系统中,共变量的组数因规格而异,可设定其中200点变量名称(#100-#199.#500-#59 ...

  • 有趣的工具变量

    一.内生性与工具变量 当回归方程中的解释变量内生时,直接使用 OLS估计的系数是有偏的.工具变量法是处理内生性问题的主要方法,为此我们寻找内生变量X的工具变量Z进行2SLS回归: 首先利用OLS估计: ...

  • 使用SPSS对有序变量进行回归分析

    作为一款专业的数据分析软件,SPSS问世以来就是各行各业数据分析的重要工具,无论是医学领域,还是做金融和市场分析,SPSS的分析功能都十分强大且实用. 下面就和大家分享一下如何使用SPSS对有序变量进 ...

  • 你确定找到一个好的工具变量了吗? 这将是一篇最值得你看的文章!

    上方配图与下方内容无关,只为更新一些信息,"洪永淼教授履新后首发文"概率论与统计学在经济学中的应用"! 前沿和经典方法应有尽有!". Source: 沪港发展联 ...