方差(关于均值)
方差 \(\sigma^2\) 量化了与期望均值 \(E[x]\) 的预期距离(平方)。样本方差 \(S^2\) 量化了与样本均值的实际距离(平方)。开方后得到标准差 \(\sigma\) 或 \(S\)。在一次考试后,我会将均值 \(\mu\) 和样本标准差 \(S\) 发送给班级。我不知道预期均值和方差,因为我不知道每个分数的概率 \(p_1\) 到 \(p_{100}\)。(教了50年之后,我仍然不知道应该期望什么。)
偏差始终是相对于均值(样本均值或期望均值)的偏差。我们要寻找围绕均值 \(x=m\) 的"离散程度"大小。从 \(N\) 个样本开始。 \[ \text{Sample variance}\quad S^2=\frac1{N-1}\left[\left(x_1-m\right)^2+\cdots+\left(x_N-m\right)^2\right] \] 样本年龄 \(x = 18, 17, 18, 19, 17\) 的均值 \(m = 17.8\)。该样本的方差为 \(0.7\): \[ S^2=\frac14\left[(.2)^2+(-.8)^2+(.2)^2+(1.2)^2+(-.8)^2\right]=\frac14(2.8)=\mathbf{0}.\mathbf{7} \] 在计算平方时,负号会消失,请注意!统计学家除以 \(N - 1 = 4\)(而不是 \(N = 5\)),这样 \(S^2\) 就是对 \(\sigma^2\) 的无偏估计。样本均值已经考虑了一个自由度。
一个重要的恒等式来自于将每个 \((x - m)^2\) 分解为 \(x^2 - 2mx + m^2\): \[ \begin{aligned} \text{sum of }(x_{i}-m)^{2}& =(\text{sum of }x_i^2)-2m(\text{sum of }x_i)+(\text{sum of }m^2) \\ &=(\text{sum of }x_i^2)-2m(Nm)+Nm^2 \\ \textbf{sum of }(x_i-m)^2& =(\textbf{sum of }x_i^2)-Nm^2. \end{aligned} \] 这是通过将 \((x_1 - m)^2 + \ldots + (x_N - m)^2\) 相加来寻找 \(x_1^2 + \ldots + x_N^2\) 的等价方式。
现在我们以概率 \(p_i\)(永远不会为负)作为起点,而不是样本。我们计算的是期望值,而不是样本值。方差 \(\sigma^2\) 是统计学中的关键数字。 \[ \mathrm{Variance}\quad\sigma^2=\mathrm{E}\left[(x-m)^2\right]=p_1(x_1-m)^2+\cdots+p_n(x_n-m)^2 \] 我们对距离期望值 \(m = E[x]\) 的距离进行平方。我们没有样本,只有期望值。我们知道概率,但不知道实验结果。
例1 计算大学新生年龄的方差 \(\sigma^2\)。
解答:年龄 \(x_i = 17, 18, 19\) 的概率分别为 \(p_i = 0.2, 0.5, 0.3\)。期望值为 \(m=\sum p_ix_i=18.1\)。方差使用相同的概率计算:
\[ \begin{aligned}\sigma^2&=(0.2)(17-18.1)^2+(0.5)(18-18.1)^2+(0.3)(19-18.1)^2\\&=(0.2)(1.21)+(0.5)(0.01)+(0.3)(0.81)=0.49.\end{aligned} \] 标准差是方根 \(\sigma = 0.7\)。
这个值衡量了在以概率0.2、0.5、0.3加权的情况下,17、18、19相对于\(E[x]\)的离散程度。