样本方差
在面临数据量大的时候,计算方差可能是一个比较困难的事情,这样我们可以考虑抽取一部分样本,计算它的方差来估计总体的离均值情况.
还记得推论统计学所关心的东西在哪儿吗?
对样本进行描述性统计然后推断出总体的情况.
样本方差计算
$$S_n ^ 2 = \frac{\sum_{i=1}^n (x_i-\bar x)^2}{n}$$
$S_n^2$ 表示样本方差,$\sigma ^ 2$ 表示总体方差
这里之所以用$S_n^2$ ,而不是采用$S^2$ ,这里有一个直观的解释:用样本估计总体的方差通常会低估总体的方差.而且样本越大,估计的效果可能会更好.下面有一个更好的公式,它才是$S^2$
解释一下低估的问题:
当你样本取得有所偏倚(随机的嘛),也就是说样本的值普遍的偏小或偏大,这样样本中的数到样本的均值的距离均值肯定会小于总体的(你的数据更集中在小或大的部分嘛),即便刚刚好样本取得是完美的,也只是估计的很完美,不会高估的.如果你还不能够理解,可以去画一个数轴尝试着理解.
更好的公式
总体方差的无偏估计,你也可以称为无偏样本方差
$$S ^ 2 = S_{n-1} ^ 2 = \frac{\sum_{i=1}^n (x_i-\bar x)^2}{n-1}$$
新的公式中,只是把分母换掉了比原先小的数,这样这个值就变大了.后期会有程序验证.这里先好好理解一下那个直观的解释,当然或许你有自己更好的理解.
博主个人能力有限,错误在所难免.
如发现错误请不要吝啬,发邮件给博主更正内容,在此提前鸣谢.
Email: JentChang@163.com (来信请注明文章标题,如果附带链接就更方便了)
你也可以在下方的留言板留下你宝贵的意见.