本帖最后由 史锦顺 于 2012-4-4 17:58 编辑
两种西格玛-误差与不确定度辨析(9)
史锦顺
- (一)单值的西格玛与平均值的西格玛 西格玛是方差的平方根。物理书上常称其为均方根值。经典测量学称其为标准误差,变量统计理论称其为标准偏差。 测量一组数据,共N个。代入贝塞尔公式计算。计算过程为:先求N个数据的平均值;各数据减平均值得N个残差;每个残差取平方;对各残差的平方求和,得残差的平方和;将残差的平方和除以(N-1),再开方,即得到西格玛。这是单值的西格玛。此西格玛表征每一个单个的测得值。也就是说,西格玛是一组测量中各个单值的共同特征,是单值对期望值偏差的统计表征量,是单值的分散性的度量。在正态分布的条件下,三倍西格玛是包含概率为99.73%的取值区间。 平均值的西格玛,简称西格玛(平)。西格玛(平)等于西格玛除以根号N。西格玛(平)是平均值对期望值偏离的统计表征量。 - (二)基础测量要用平均值的西格玛 对常量的测量,称基础测量。 生活、生产、交易中的测量,是认识量值,求得量值,一般只测一次。 对常量进行精密测量,要进行多次。测一次是必要测量,另外的N-1次测量,是重复测量,又称冗(róng)余测量。测得值的变化由测量仪器引起,测得值的分散性是手段问题,要用多次测量的方法减小手段的影响,要取平均值,用西格玛(平)来表征测得值的平均值接近被测量真值的程度。 - 对慢变量的测量,实际是基础测量。例如测量晶振的日老化率,必须进行时间间隔为1日的2次测量。这2次测量是必要测量。现在通常的作法是每隔一日测量一次,共7次测量,冗余量为5(7减2)。注意,这里的一次测量的“次”,应是三到五个测得值的平均值。 - 在基础测量中,测得值的分散性由测量手段引入,称随机误差。手段要改进,方法之一是增加测量次数,因而取平均值,用平均值的西格玛来表征随机误差。 总之,基础测量用平均值的西格玛。 - (三)统计测量要用单值的西格玛 对随机快变量的测量,是统计测量。其模型是,每个测得值是准确值(误差可略),测得值的变化,表现被测量本身的变化。取得单个测得值所用的时间称采样时间。每个测得值是采样时间内的各时刻量值的平均值。单个测得值及其表征量,都是采样时间的函数。这种表达模式,在时频界,已成功应用。 - 对迅速变化的量,测量只能进行一次。如发射运载卫星的火箭,测速、测距都无法重复,因为速度在变,距离更在变,此刻的值不等于下一刻的值。这样,对测量系统的要求,是单值的西格玛,而不是平均值的西格玛。 - 对统计测量来说,西格玛是量值分散性的表征量,称随机偏差。3倍西格玛是量值的变化范围。平均值的西格玛是平均值的变化特性,对单个客观量的实际变化,已无实际意义。因此统计测量的表征量是单值的西格玛,而不是平均值的西格玛。 统计测量的标准偏差,是单值的西格玛。 - 例1 狼的活动范围 一座小山的岩石洞中,有个狼窝,住着狼和几只狼崽。狼每天外出巡猎,又要顾及狼崽,不时回窝照看,这样就大致有个行动范围。狼离小山的距离,简称狼距,在一个区间内。设每天狼的活动规律大体相同。 一天中抽样测量狼距,测10次,算西格玛为20公里,取3西格玛为狼距范围,是60公里。狼距平均值的西格玛是7公里,狼距平均值的范围是20公里。 如一天中抽样测量狼距1000次,算西格玛为20公里,狼距范围是60公里;西格玛(平)为0.7公里,狼距平均值的范围是2公里。 小山周围是大草原,杂居着羊和兔。羊国布告:按狼距3西格玛是危险区,即小山60公里范围,羊等莫入。兔国布告:按狼距3西格玛(平)是危险区,即小山2公里范围(或写成20公里),兔等莫入。 结果很明显。3西格玛是狼可能到达的范围;3西格玛(平)无安全上的意义。羊国以3西格玛(60公里)为危险范围是正确的。兔国采用3西格玛(平),危险范围仅2公里(或20公里),上当。 |