轻松学习:相关系数r的计算公式

在数据分析中,相关系数是一个非常重要的指标,在判断两个变量之间的关系时发挥着关键作用。相关系数r值越高,则说明两个变量之间的正相关性越强,反之则越弱。那么如何计算相关系数r呢?下面我们就通过一个例子进行说明。

假设有一组数据如下:

学生英语成绩(x)物理成绩(y)
18588
29087
38085
47382
59291
67875
78086
87580
98284
109092

我们先求出x,y的平均值:

$$ \bar{x} = (85 90 80 73 92 78 80 75 82 90) \div 10 = 82.5 $$

$$ \bar{y} = (88 87 85 82 91 75 86 80 84 92) \div 10 = 84.8 $$

然后我们可以分别求得x,y的方差Sx, Sy以及协方差Sxy:

$$ S_x = ((85-82.5)^2 (90-82.5)^2 (80-82.5)^2 (73-82.5)^2 (92-82.5)^2 (78-82.5)^2 (80-82.5)^2 (75-82.5)^2 (82-82.5)^2 (90-82.5)^2) \div (10-1) = 53.65 $$

$$ S_y = ((88-84.8)^2 (87-84.8)^2 (85-84.8)^2 (82-84.8)^2 (91-84.8)^2 (75-84.8)^2 (86-84.8)^2 (80-84.8)^2 (84-84.8)^2 (92-84.8)^2) \div (10-1) = 44.14 $$

$$ S_{xy} = ((85-82.5)(88-84.8) (90-82.5)(87-84.8) (80-82.5)(85-84.8) (73-82.5)(82-84.8) (92-82.5)(91-84.8) (78-82.5)(75-84.8) (80-82.5)(86-84.8) (75-82.5)(80-84.8) (82-82.5)(84-84.8) (90-82.5)(92-84.8)) \div (10-1) = 70.51 $$

那么,根据相关系数的计算公式,我们可以计算出相关系数r的值:

$$ r = \frac{S_{xy}}{\sqrt{S_xS_y}} = \frac{70.51}{\sqrt{53.65\times44.14}} \approx 0.93 $$

因此,我们得出的相关系数r约等于0.93,说明x和y之间的正相关性比较强。

相关信息

友情链接