相关分析是研究变量之间相关关系密切程度的数学方法。随机变量间的线性相关程度用二变量的相关关系r来描述。通过计算获得相关系数r的具体数据后,还必须进行显著性检验,以衡量其是否相关及相关的密切程度。
相关分析是确定地质体中某两种因素或某种因素与某种条件之间是否相关及其相关密切程度的常用方法,例如确定矿体中品位与厚度之间是否相关、品位与深度之间是否相关以及它们相关的密切程度等。
r——相关系数,x——变量值1,y——变量值2,N——变量个数
如果直接用给定的公式进行计算显得相当复杂,对于计量工作者来说既耗时也容易出错,为了更好地解决计算中遇到的实际问题,利用Excel自带的函数公式、图表向导等功能或者自己编辑计算公式进行计算,使得一些比较繁琐的计算变得更简单、快捷、准确。
注:本功能需要使用Excel扩展功能,如果你的Excel尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘中加载“分析数据库”。加载成功后,能在“工具”下拉菜单中看到“数据分析”选项。
(版本中为文件---选项---加载项---转到(如图1)---勾选分析工具库)
相关分析操作步骤
1.打开原始数据表格,制作本实例的原始数据需要满足两组或两组以上的数据,结果将给出其中任意两项的相关系数。图2
2.选择“工具”-“数据分析”-“描述统计”(版本中为“数据”---“数据分析”---“相关系数”)后,出现属性设置框,依次选择:
输入区域:选择数据区域,注意需要满足至少两组数据。如果有数据标志,注意同时勾选下方“标志位于第一行”;
分组方式:指示输入区域中的数据是按行还是按列考虑,请根据原数据格式选择;
输出区域:选择本表、新工作表组或是新工作簿;图3
注:表格中不可有数字必须全为数值,不可有文本格式数值。
3.点击“确定”即可看到生成的报表。
能看到图4,在相应区域生成了一个6×6的矩阵,数据项目的交叉处就是其相关系数。显然,数据和本身是完全相关的,相关系数在对角线上显示为1;两组数据间在矩阵上有两个位置,他们是相同的,故右上侧重复部分不显示数据。左下侧相应位置分别是不同矿种品位数据间的相关系数。
从数据统计结论能看出,铜和金、银、硫的相关性分别达到了0.、0.和0.,这说明他们呈现良好的正相关性,铜是金的良好载体。而铅锌数据间的相关性达到了0.,这说明两者共生关系。
协方差的统计和相关系数的活的方法相似,统计结果同样返回一个输出表和一个矩阵,分别表示每对测量值变量之间的相关系数和协方差。不同之处在于相关系数的取值在-1和+1之间,而协方差没有限定的取值范围。相关系数和协方差都是描述两个变量离散程度的指标。
回归分析操作步骤
查明两者具有相关性后,由于相关分析只能解决变量间是否存在相关关系及相关的密切程度问题,但在实际工作中,有时还必须进一步解决统计相关变量之间,根据某个(或某几个)变量值以预测另一变量值的问题。回归分析就是解决这类问题的数学手段。例如对于铁矿石来说往往在同一矿床中铁的品位与体重之间存在着密切的相关,我们就可以用回归分析方法,找出其回归方程,以便在储量计算中,在确定了计算块段的平均品位后,根据平均品位计算出相应矿体的体重值,以便选取合适的体重值参数参加储量计算。
在回归分析中,如果各变量存在线性相关,并设影响因变量Y的自变量共有m个,即x1、x2、…xm,则在Y与x1、x2、…xm之间可配成一线性关系式:
Y=b0+b1x1+b2x2+…+bmxm。B0为常数项,bi为xi对Y的偏回归系数。
计算时可将若干组已知数据代入上式,得到若干个以b0、b1…为未知数的方程,然后根据最小二乘法原理(为使观测点与趋势值之差的平方和为最小)解此方程组,而求出具体数字。这样一来上述方程就成为一个具体的经验方程。
在进行回归分析之前,一般先根据已知数据作统计值散点图,以便了解自变量与因变量间是否存在线性关系,当存在线性关系时才能进行线性回归分析计算,但是,从散点图上有时可发现,也有一些地质上的自变量与因变量之间不是线性关系,此时可能要进行二阶、三阶,甚至更高阶的非线性回归分析。例如,当进行二元二次回归分析时,其方程为:
Y=b0+b1x1+b2x2+b3x12+b4x1x2+b5x22
方法一:
1、打开MicrosoftExcel新建工作簿,分别输入不同矿种品位值。如前图1所示。
2、选中数据以金、银品位数据为例,选择“插入→图表”,在图表类型(c):选择“XY散点图”,子图表类型(T):选择“平滑线散点图”。
3、单击下一步,下一步,得到图表选项图。
4、单击图三所示的“完成”,得到散点系列。图5所示
5、选中散点系列(一定要选中数据点),右键→添加趋势线,类型:选择“线性(L)”,选项:选择“显示公式(E)”、“显示R平方值(R)”。图6示
6、得到直线方程y=.89x+4.和R2=0.。图7所示
相关系数r值,可以利用公式进行计算开方得到相关系数r=sqrt(0.)=0.
方法二(推荐):
数据---数据分析---回归---出现对话框
⑴在“Y值输入区域”方框中键入银品位所在表格;
⑵在“X值输入区域”方框中键入金品位所在表格;
⑶在“输出选项”中选择输出区域(这里我们选择“新工作薄”);
⑷单击“确定”按钮,得到的结果如下表所示图8:
从表中得到的主要结果有:
复相关系数:R=0.
判定系数:R2=0.
估计的回归方程为:
Y=4.+.X1
(0.)(7.)
根据括号内的t统计量的值可知:X1对Y有显著影响。
根据F统计量的值F=61.可知:回归方程是显著的。
本文原创权归刘金刚所有,感谢作者分享
平台