1、散点图的定义
散点图又称为散布图或相关图,它是将两个可能相关的变量数值用点画在坐标轴对应的位置上,由此可通过对其观察分析,来判断两个变量之间的相关关系。在生产过程中,例如热处理时淬火温度与工件硬度之间的关系;某种元素在材料中的含量与材料强度的关系。这种关系用散点图来分析就是很方便的。在我们的生活中,有许多现象和原因,我们如果想要了解它,也可以借助散点图来判断它们之间的相关关系。
2、散点图的类型
①强正相关(如容量和附料重量):X增大时,Y显著增大;
②强负相关(油的粘度与温度):X增大时,Y显著减小;
③弱正相关(身高和体重):X增大时,Y小幅增大;
④弱负相关(温度与步伐):X增大时,Y小幅减小;
⑤不相关(气压与气温):X变化对Y没有影响;
⑥曲线相关:X与Y之间存在曲线相关关系;
3、散点图的应用
当不清楚两个变量之间的关系时,可以通过散点图来确认二者之间的关系。需要说明的是,在使用散点图调查两个变量之间的关系时,应尽可能固定对这两个变量有影响的其他因素,才能得到比较准确的结果。通过散点图对数据的相关性进行直观地观察,不仅能够得到定性的结论,还可以通过观察剔除异常值,提高用计算法估算相关程度的准确性。
注意事项:
① 散点图一般用来做相关性分析,它能够直观显示变量之间的相关强度、方向以及是否存在异常值。当两个或多个变量之间存在线性相关时,可以根据其两个变量数据分布的最佳拟合线和相关系数,通过一个变量去预测合理数据范围内的另一个变量的值。
② 相关性是变量之间的数学关系,两个变量间存在相关关系并不意味着一个变量必定会影响另一个变量,也不意味着两者间存在因果关系。
4、散点图的绘制方法
比如我们在烘焙面包的时候,想知道一种甜面包的味道和烘焙时间长短的关系。我们在试验的时候可以先假定面团的重量(60g)和上火温度(180℃)和下火温度(160℃)固定不变,只是改变烘焙时间作为输入变量X;把面包的口味级别Y定义在0-100之间。味道极差为0分;味道极好为100分。在此我们对60个面包设定不同的时间进行烘焙,结果如下:
本文还是以Excel和Minitab两种软件对散点图的绘制步骤进行说明,原始数据如下:
一、Excel制作散点图步骤如下:
① 在Excel中按照上面样式分别把输入X和输出Y的数据各整理成一列;
② 首先选中输入X和输出Y两列数据,然后点击菜单插入——图表——选择X Y散点图,单击第一个仅带数据标记的散点图;
③ 上图点击确定后,达到输出Y与输入X的散点图;
从上图我们可以看出,面包的口感Y与烘焙时间X呈现曲线相关关系。当烘焙时间在600秒附近时,呈现出来的口感时最佳的。当烘焙时间在0-600之间时,口感Y随着时间X的增大而增加;烘焙时间在600S以上时,口感Y随着烘焙时间X的增大而减小。
二、Minitab制作散点图步骤如下:
使用Minitab绘制散点图同样很简单
① 首先,还是将输入X和输出Y的数据各整理成一列,汇总到Minitab表格中;
② 点击菜单图形,选择散点图,简单;
③ 上图点击确定后,出现如下对话框,在Y变量和X变量中分别输入相应的数据列;
④ 上图点击确定后,得到如下散点图。
细心的朋友可以看到,Minitab制作出的散点图和Excel制作出的稍微有点差异,这是因为Excel的X轴和Y轴的坐标都是从0开始的,如果将X调整到200,Y调整到30,则两软件绘制的散点图就是一样的了。
通过该散点图只是定性分析出了输出Y与输入X的相关关系,如果我们想知道烘焙时间具体设定哪个值是最佳的,还有口感与所烘烤面团的重量以及上下火温度等这些因子是否有影响?影响到底有多大?这些因子应该如何设定才能找到口感的最佳值。在实际应用过程中,这些问题都可以通过六西格玛试验设计工具进行解决。随着学习的不断深入,后续将逐一展开。
当然,有兴趣的朋友还可以研究下Excel和Minitab中的带有平滑线的散点图;另外,如果需要检查响应变量Z与两个变量X和Y的关系时,还会用到3D散点图。这里就不赘述了。
声明:易商讯尊重创作版权。本文信息搜集、整理自互联网,若有来源标记错误或侵犯您的合法权益,请联系我们。我们将及时纠正并删除相关讯息,非常感谢!