单因素方差分析
在实际工作与生活中,对于数据的统计与分析是必不可少的,拿来一堆数据,我们总不能千头万绪不知从何说起吧。我的建议是这样,首先观察分析一下它是什么类型的数据,适合什么样的分析方法,然后再使用确定的分析方法进行数据的分析处理。
常见的数据分析方法有:单因素方差分析、双因素方差分析、响应面试验、正交试验。
我们来说说单因素方差分析,重读一下这几个字,单因素方差分析,脑海里想一想自己是否真正理解这几个字。我们把它拆分为:单因素+方差分析。好,那么问题来了,何为单因素?何为方差分析?
1、单因素:那么我们必须得提一提什么是因素这个问题了。那就拿常见的实验对象打个比方:假如你所做的某项试验结束物料温度的高低取决于材料状态、试剂浓度、反应时间。那么我们就把材料状态、试剂浓度、反应时间称为不同的影响因素,说到这里还要顺便说一下水平这个概念。我们拿反应时间这个因素来说,很明显我们在做实验的时候要设置不同的时间梯度,比如5min、10min、15min、20min等,那么这四个时间就被我们称之为反应时间因素的四个不同水平。到这里,对于单因素这个概念就不难理解了,拿这个例子看,材料状态、试剂浓度、反应时间这三个因素中的任意一个因素就称为单因素,so easy to understand!,right
2、方差分析:在说这个概念之前,我们利用上面的情形做一份表格,为了考察反应时间对于试验结果的影响做一个单因素的试验设计,具体数据如下:
我们要考察一下反应时间这个因素对于实验结束物料温度到底有没有影响。如果没有显著的影响那说明反应时间长短就无所谓了,那我们肯定就选时间最短的了,人生那么短,多留点属于自己的时间多好啊。那到底怎么判断呢?至此最经典的思维模式就赫然上脑了,求个平均值看一看不就好了,且看:
哦,根据上图,我选反应时间为15min的(这里假设温度越高实验结果越好),我想理由明显是因为它的均值最大。若没有那些搞统计的数学家的存在,我们可以这样省事儿地做出选择,正因为他们的存在,让这个世界变“复杂”了(从后面看其实是更科学合理了),他们只问了你一个问题:你确定你能够除了反应时间不同,其他方面的情况都能保证完全一样吗?吗??吗???完全没有其他误差吗?吗??吗???说得貌似有道理,做决定不能这么草率!说到这里,这个试验就转化为比较这四个平均温度之间是否具有显著性差异了。方差分析这个概念也就被引出来了:方差分析是用来检验多组样本均值间是否具有差异的。到这里,单因素方差分析你知道是干什么的了,接下来是无疑是如何来具体分析的问题。这里有很多软件已经为我们做好了一切的准备工作,我们只需要把数据准备好,然后按照固定的操作步骤来执行就好了。下面我用Excel来演示一下单因素方差分析(此演示基于Excel 2013版本,其他版本可作参考)
(1)、准备数据
(2)、在【数据】选项卡中单击【数据分析】命令:
在弹出的【数据分析】对话框中选择【方差分析:单因素方差分析】工具:
单击【确定】按钮,这时弹出【方差分析:单因素方差分析】对话框:
(3)、指定输入数据的有关参数:
输入区域:指定要分析的数据所在的单元格区域A2:E5
分组方式:指定输入数据是以行还是以列方式排列的。本例输入数据是以行方式排列的,所以选“行”
标志位于第一列复选框:本例指定的数据区域包含标识列,所以勾选该复选框
置信度:根据需要指定显著水平,本例输入α=0.05
输出选项:本例把结果输出到本工作表的H1单元格
单击确定结果如下:
根据上图给出的分析结果可知F=0.140541<F0.05(3,12)=3.490,故在显著水平0.05下可以认为4个反应温度对实验结果无显著性差异,可以任意选择反应时间,那经过这么以分析的我肯定就选择5min的,而不是10min的了。(案例与结果仅供参考)
职场办公,快人一步!
有疑问或见解下方这里留言