六西格玛工具-散点图
什么是散点图:
为了考察两个变量X和Y的关系,把关于(X,Y)的N对观测数据值:(X1,Y1),(X2,Y2),…,(XN,YN),描绘在二维直角坐标系中,便形成了散点图。
在Minitab的Graph下拉菜单下的散点图Plot对话框中,Y与X栏下分别输入要分析的因变量与自变量,若两变量间存在因果关系,则设原因变量为X,结果变量为Y。若要分析多对变量间关系,则在栏下分别按行输入即可。Data ?display 选项中可指定分组变量对数据分组,可为每对数据或每一组数据或每个图表选择显示内容(如符号、面积等)。
设定显示内容的属性值,在Edit Attributes中选择实现。Annotation用来指定绘图的标题、注解、数据标记、异常值标记、中位数和均值标记、直线、多角形与书签标记等属性值。Frame可用来指定坐标轴、多图表显示、坐标轴的取值范围等属性值。Regions选项可设定数据、图表与图例的区域属性值。
从散点图可以观察变量X和Y的关系:正相关:Y值随X值的增加而增加;负相关:Y值随X值的增加而减少;不相关:Y值与X值的变化无任何规律可循。
另外,由散点图还可以知道两变量间的相关程度;检验是否有异常点的情形出现等。
散点图中点的分布形状很多,对六西格玛质量管理人员来讲,最感兴趣的往往是这些点是否散布在某条直线附近,因为如果这一趋势出现,就可以通过一个变量的取值去预测或控制另一变量的取值。
这里的例子使用Minitab软件自带数据Pulse.mtw,分析的是变量Weight与Pulse 1的关系,以及反映两变量各自的分布情况的箱形图。由二维散点图可以看出,变量weight与pulse 1间不存在相关关系,即人体脉搏不会因体重的差异而有区别,这也符合现实中人体的生理特征。由变量weight的箱形图可见有一点为异常点(outliers),处于上限以外,说明有一人的体重较大,通过图表的编辑功能Brush选项,可查看关于该点的具体信息,对该个体应予重点关注。在变量pulse 1的箱线图中,无异常点出现,说明观察对象的脉搏均无不良现象发生。在六西格玛质量管理分析中,尤其是有关的统计分析,一定要结合实际情况,以防判断错误,例如从数据看,有些变量间存在相关性,并且相关性较强,但现实中两变量并不相干,这种相关也成为伪相关。