【相关系数r的计算公式怎么算】在统计学中,相关系数(Pearson相关系数)是衡量两个变量之间线性关系密切程度的一个指标。它常用于数据分析、科学研究和市场调研等领域。本文将对相关系数r的计算公式进行简要总结,并通过表格形式展示其计算步骤。
一、相关系数r的基本概念
相关系数r的取值范围为 -1 到 1:
- r = 1:表示完全正相关
- r = -1:表示完全负相关
- r = 0:表示无线性相关
r的绝对值越大,说明两个变量之间的线性关系越强。
二、相关系数r的计算公式
相关系数r的计算公式如下:
$$
r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $ 是样本数量
- $ x $ 和 $ y $ 是两个变量的观测值
- $ \sum xy $ 是x与y对应乘积之和
- $ \sum x $ 和 $ \sum y $ 分别是x和y的总和
- $ \sum x^2 $ 和 $ \sum y^2 $ 是x和y平方后的总和
三、计算步骤总结(表格形式)
步骤 | 计算内容 | 公式/说明 |
1 | 计算x的总和 | $ \sum x $ |
2 | 计算y的总和 | $ \sum y $ |
3 | 计算xy的乘积和 | $ \sum xy $ |
4 | 计算x的平方和 | $ \sum x^2 $ |
5 | 计算y的平方和 | $ \sum y^2 $ |
6 | 代入公式计算分子 | $ n\sum xy - (\sum x)(\sum y) $ |
7 | 计算分母部分1 | $ n\sum x^2 - (\sum x)^2 $ |
8 | 计算分母部分2 | $ n\sum y^2 - (\sum y)^2 $ |
9 | 计算分母整体 | $ \sqrt{(\text{分母1}) \times (\text{分母2})} $ |
10 | 最终计算r | $ r = \frac{\text{分子}}{\text{分母}} $ |
四、示例说明(简化版)
假设我们有以下数据:
x | y |
1 | 2 |
2 | 4 |
3 | 6 |
根据上述公式计算:
- $ \sum x = 6 $, $ \sum y = 12 $, $ \sum xy = 1×2 + 2×4 + 3×6 = 2 + 8 + 18 = 28 $
- $ \sum x^2 = 1 + 4 + 9 = 14 $, $ \sum y^2 = 4 + 16 + 36 = 56 $
- $ n = 3 $
代入公式:
$$
r = \frac{3×28 - (6×12)}{\sqrt{[3×14 - 6^2][3×56 - 12^2]}} = \frac{84 - 72}{\sqrt{(42 - 36)(168 - 144)}} = \frac{12}{\sqrt{6×24}} = \frac{12}{\sqrt{144}} = \frac{12}{12} = 1
$$
结果表明,x和y之间存在完全正相关关系。
五、注意事项
- 相关系数仅反映线性关系,不能说明因果关系。
- 数据需满足连续变量且近似正态分布。
- 可使用Excel或Python等工具自动计算相关系数。
如需进一步了解相关系数的应用场景或如何解读结果,可参考后续文章。