不确定度理论的五大难关(3)——可疑又难懂的自由度

史锦顺 · 发表于 2014-8-11 10:45:55

本帖最后由史锦顺于 2014-8-11 11:04 编辑

-

不确定度理论的五大难关(3)

——第三关：可疑又难懂的自由度

-

史锦顺

-

（一）自由度该有自由

自由度的概念，本来是个严肃的物理概念。物理中，自由度又称“维数”。战场上，坦克是二维运动，可以横冲直撞，坦克的位置，由经度、纬度来确定。是二维的。经度可能取各种值，是一个自由度；维度可以取各种值，是一个自由度，一共是两个自由度。飞机有经度、纬度、高度三个自由度。潜水艇有经度、纬度、水平面下深度三个自由度。航空母舰及水面舰艇船只，只有经度纬度两个自由度。由于空间的三维性，宇宙虽大，而每个物体的运动，最多有三个自由度。

每一维都可以取各种值，不受限制，固有其名曰：“自由度”。火车在某段路上，可以前进后退，却不能脱离铁路线横行，又不能做垂直地面的运动，因此火车在三维空间中，两维受限制，只有一个自由度。

数学中，函数有N个变量，就称有N个自由度。说得过去。因为每个变量都可自由取值。

函数 f(x,y)=x+y，x可以自由取值，y可以自由取值，有两个自由度。如果给定一种关系，x-y=c，c是常数，则自变量可以代换掉一个，y=c+x，则函数变成f(x)=2x+c。原来是两个自变量即两个自由度；加一个条件限制，自变量成为一个，自由度减少一个。

由上可知，自由度，该有自由。

-

不确定度宣贯以来，说取N个示值，就是N个自由度。我认为由此称说自由度，自由度就太多了。一个自由度取一个数，哪还有“自由”的味道？

-

统计测量的书中，确有N次独立测量，有N个自由度的说法。我反对不确定度理论，却不敢也不该反对统计理论。反复思考，统计理论意义下的自由度，我认为是如下的意思。

-

一场测量，N次取值。

M场测量，每场N次取值，总共有MN个数据。

横排是次数，纵排是场数，有

11，12， …… 1 N

21，22， …… 2N

↓ ↓ ↓

M1 M2 …… MN

-

统计理论说N次独立测量有N个取值，有N个自由度。由此讨论遵从统计理论的不确定度理论的自由度。

-

（二）疑问：贝塞尔公式的自由度是N-1吗？

不确定度论讲究自由度。第一处讲自由度，说贝塞尔公式的自由度是n-1。我认为，这是错误的。

n是数据量，即独立测量的个数。统计理论的自由度，应是有多少个独立测量，就有多少个数据，就有多少自由度。自由度是对独立测量说的，是对数据说的，自由度是多少，本质说的是数据有多少个取值的可能。标准方差中是用偏差Xi-EX，是n个自由度，怎么到贝塞尔公式中用平均值代替数学期望，数据量还是n个，而自由度竟变成n-1了？如果取值的自由度是n-1,则应是有n-1个数据就决定一切了，第n个数据不起作用，是个没有自由度的必然量。这是不符合事实的，n个数据，哪个也不能少。例如取2个数据，是2个自由度，如果已知二数据之和为b，则知道X1，必知X2是b-X1,因而是1个自由度。但取残差平方和时是一个也不能少的。具体计算一下。

[X1-(X1+X2)/2]^2 + [X2-(X1+X2)/2]^2 =(X1-X2)^2 /4

式中X1、X2都在，哪个也不能缺，仍是2个自由度。

因此，说残差之和等于零是一个约束条件，即限制数为1。由此可得自由度n= n - 1。这句话是不对的。n个数据的自由度是n,而不是n-1。公式中用到数据之和，设为Z，这是多出一个值，自由度该加1，而多出的Z等于数据之和是约束条件，要减去1，自由度加1又减1，还是n。

-

结论：贝塞尔公式的自由度是n，而不是n-1。您说，对吗？

-

（三）弱化自由度

学习不确定度理论的人都知道，自由度是个难点。正确的客观规律，有实际用途的知识，再难也该学。但不确定度论讲的自由度，一开始就不对（即将n误解为n-1）；以后的内容，更难；至于对不对，天知道。反正像老史这样的北大物理系六年制的毕业生，又经五十年苦读、求真的人，就认可是自己学不懂。那么有多少人能学懂会用呢？学不懂，只好抄。可笑的是，一个样板评定，估计国家计量院的可信度是80%，由此算等效的自由度。国家计量院的可信度，这样低，那个自由度就很难让人相信了。

-

2011年2月，JJF1059.1《测量不确定度评定与表示》规范修订起草小组，提出“本规范弱化了对给出自由度的要求”，这是正确的。说明，在中国计量界的学术高层，已认识到自由度无用的本质。

自由度的概念，无实际用途，难解难算，样板评定中有人用，除数据量的自由度取n-1（这是错的）外，都是些随意的估计。笔者的意见是：既然弱化，就弱化到零吧。

既然自由度可以“弱化”，不确定度论就该弱化。

-

最后，对比一下。

误差理论，不讲究自由度。不学、不用自由度。一切正常，这是正路。

不确定度理论，弄出个自由度来，还要求每个测量结果都说明自由度。而人们对自由度又学不懂、不会用。逼得人们违心地去抄袭，去蒙混；这实在是对计量人的亵渎。怨气满腔的计量工作者，认清不确定度论的伪科学本质，坚决反对不确定度论！

-

崔伟群 · 发表于 2014-8-12 11:58:58

史老的评论走上了正轨，支持下。

史锦顺 · 发表于 2014-8-12 12:19:57

本帖最后由史锦顺于 2014-8-12 12:35 编辑

-

谢谢崔先生的鼓励

-

thearchyhigh · 发表于 2014-8-21 09:36:07

本帖最后由 thearchyhigh 于 2014-8-21 09:37 编辑

自由度n-1。这是用高中数学的知识都能解译的，还在讨论，更别说大学的概率论。。简单通俗的说，这个自由度是针对偏差的，不是针对测量值。即"x(i)-x(平）"，不是“x(i)”。而n*x(平）=x(1)+...x(n)“，交换一下：【x(1)+...+x(n-1) 】- (n-1)*x(平）=x(平）-x（n)。。再交换一下【x(1)-x(平）】+... 【x(n-1)-x(平）】=-【x(n）-x（平)】，看出来了吧，前n-1个偏差可以决定最后一个偏差。。。。。。。。

zhoujidai · 发表于 2014-8-21 10:23:56

n取多少，与评定的人有关，勤劳的、勤快的取得大点，懒惰的、偷奸耍滑的取得少点，呵呵，这也充分体现了不确定度的本质：不确定嘛。

史锦顺 · 发表于 2014-8-24 08:14:58

本帖最后由史锦顺于 2014-8-24 08:24 编辑

回复 4# thearchyhigh

   先生说：
   自由度n-1。这是用高中数学的知识都能解译的，还在讨论，更别说大学的概率论。简单通俗的说，这个自由度是针对偏差的，不是针对测量值。即"x(i)-x(平）"
-
   史辩：
   先生把自由度的问题看得极简单，认为没有讨论的价值。并且不无讽刺地说，高中数学知识都可以解决，更别说大学。把老史贬到初中以下去了。
   统计学明确规定：自由度是针对“独立采样量”讲的；不是针对计算的量（中间量）说的。x(i)-x(平）叫残差，是计算量，不是“独立采样量”。其中的X(平)是n个“独立采样量”计算出来的，少一个都不行。因此，既然“独立采样量”是n,自由度就是n,而不是n-1. 如果测量仪器测得的是差值（例如被测量与标准量的差值），那时自由度多少取决于“差值”的多少。因为此时的“差值”是“独立采样量”。
-
   我认为：取得学术研究成果的关键有两条：一是敢置疑，二是靠实践。实践最基本，但置疑却是打开科学宝库的钥匙。如果上了书的，就认为当然正确，那将难有突破。
   这倒使想起几个故事，详见《驳不确定度论一百六十篇集》（P333）。虽然本网发表过，许多新网友可能不知道。题目是《创新始于置疑》。学术讨论有些枯燥，看点文艺性的回忆录，也许是个调剂。我写了二百多篇学术性文章，有些网友奇怪，看了我的这篇文章，也许能得些启发。本想在这里复印一下，怕浪费版面，请网友自己查吧。如有网友希望在这里看，我再复制。
-

njlyx · 发表于 2014-8-24 09:33:40

本帖最后由 njlyx 于 2014-8-24 09:38 编辑

回复 1# 史锦顺

对于例子【具体计算一下。

[X1-(X1+X2)/2]^2 + [X2-(X1+X2)/2]^2 =(X1-X2)^2 /4

式中X1、X2都在，哪个也不能缺，仍是2个自由度。】

——从结果来看，其‘自由度’好像是只有一个了：只与差值 △X=（X1-X2）有关了！

在“评估”出“测量不确定度”时，给出相应的“自由度”真的是没有什么实际意义的，在没有人“保证”所论‘随机量’究竟服从什么‘分布’的情况下，由“自由度”表达对‘分布’参数的‘评估’质量，基本是‘扯淡’！ ....“测量不确定度”的“评估”‘自由度’只有假想条件下的‘学术’意义---可能只对“数学”有意义！......“测量不确定度”的实际“评估”质量只能由“实践”来‘检验’--- 对于“基准”以下“对象”的“测量不确定度”，可以依靠“上级”来‘核查’，或由人们可以确认的效应来判断；对于“基准”的“不确定度”（不准确度）---这只是少数‘专家’的事情，不知有多少是给了‘自由度'的？

规矩湾锦苑 · 发表于 2014-8-24 11:56:49

　　我一直都在强调不确定度不是误差也不是误差范围，不确定度的作用是定量评判测量结果的“可疑度”或可信性、可靠性。误差理论告诉我们任何测量结果都不是符合定义的“被测量真值”，都含有大小不等的误差。因此，我们必须建立一种思维，对任何测量结果都应该先打个问号表示怀疑，“我在我的工程中使用这个测量结果可靠吗？”，这就是可信性问题，不确定度就是为了解决这个可信性或可靠性的量化评判问题。在解决了这个疑问后才能放心大胆的使用或废弃这个计量结果。
　　我现在先回避n次测量后以其平均值作为测量结果的自由度是n还是n－1，仅就这个n次测量结果的可靠性而言，自由度是否有存在价值的问题谈谈个人的观点。前面说过不确定度是评判测量结果“可疑度”的参数，换句话说就是对测量结果的否定之大小，不确定度又是人为估计的结果难道不值得怀疑吗？“自由度”就是对不确定度的怀疑参数，是对不确定度的否定之大小。根据否定之否定就是肯定的哲理，不确定度越小测量结果越可信，自由度是不确定度的否定，是测量结果的否定之否定，因此自由度越大测量结果越可信。
　　如此看来，以平均值作为测量结果时，测量次数n越多自由度也就越大，自由度越大测量结果越可靠也就是顺理成章了。所以自由度还是有其存在价值的，这并不仅仅是少数专家的事，只不过因为人们对上级技术机构的测量结果历来是信任的，信任的程度甚至都达到了100%。但不确定度评定理论仍然认为任何测量结果都有其不可信性（不确定度），哪怕是唯一的计量基准，其误差不可测得而视为０，也仍然有其不确定度。JJF1059.1-2012的表4就是对上级技术机构测量结果的怀疑程度与自由度之间的关系。例如你对上级检定结果的怀疑程度0.10（即10%)，自由度就是50，怀疑程度越大自由度越小，怀疑程度越小自由度就越大，一点都不怀疑，自由度就是∞。一般来说除了理论计算的量值、人们（国际上）共同约定的量值和极其稳定的国际基准、国家基准的量值自由度可以取∞，我们可以完全相信外，其它任何测量结果都应给予不同程度的怀疑，给予不同大小的自由度。

史锦顺 · 发表于 2014-8-24 15:04:57

本帖最后由史锦顺于 2014-8-24 15:14 编辑

回复 7# njlyx

先生说：从结果来看，其‘自由度’好像是只有一个了：只与差值 △X=（X1-X2）有关了。

-

史辩：差值△X=（X1-X2），就是两个自由度。△X由独立采样量X1与X2共同决定，哪个也不能少，因此必是两个自由度。如果给定一个条件X1+X2=C,C是常数，则X1、X2中可以代换一个，也就是独立采样只有一个，才能说自由度为1. 这个限定条件是真限定。

原式

△X=X1-X2 （1）

因已限定

X1+X2=C （2）

有

X2= C-X1 （3）

（3）式代入（1）式有

△X=X1-（C-X1）

=2X1-C （4）

我说：原差值是两个自由度，加一个限制条件，变成一个自由度，这是说得通的。

如先生的说法，（1）的自由度是1，加上（2）的限制，（4）的自由度就是零了。这显然不通。有一个X1在，它是独立测量，就必须是一个自由度。如果说着眼点是差值，那2X1-C也是差值，自由度应该是1，而不是零。

对σ的自由度来说，平均值是n个独立采样值的计算结果，必须用n个值计算，一个都代换不掉。如果给定平均值是常数差C，那就可以代换掉一个采样值，而自由度成为n-1.可惜，平均值是n个采样值的计算结果，必须n个值到齐才行。

还有一点，一个函数的自由度，由独立变量决定，与函数表达式无关。

Y=X1+X2+X3+X4+X5，和数只有一个，能说是一个自由度吗？不能。自由度应该是5。

阿仑方差的统计单元是二量之差。每组二值，连续采样；取30组，差值是30个，但独立采样是60个值，只能说在自由度60.因为统计理论规定独立采样数等于自由度.当然，阿仑方差不讲究没有实际用途的自由度。我的《测量计量学》也绝不提一句“自由度”这种废话，因为它实在没用。没法实验核对，也没法实验证否。

还有，如果函数是Y=(X1-X2)+(X1^2-X2^2)+(X1^3-X2^3),虽然差值有三种，因独立变量只有X1与X2两个，也仅能说自由度是2，而不能说是3，更不能说是1.

-

史锦顺 · 发表于 2014-8-24 15:35:31

回复 8# 规矩湾锦苑

把不确定度就当做“误差范围”（置信概率不同），这已是很多人的共识，GUM的区间公式，VIM3的包含真值的区间，也都表明了这一点。你老先生还是坚持那个“可信性”“可疑度”之类的说法，那是你的自由，我不再就此问题与您对话了（其他方面当然可以讨论），都说三年了，你不改口，还自以为正确，这不全怪你，你不过是上了当初不确定度论宣传的当。你该结合那些不确定度评定的样板，再想一想计量的实际，哪有什么“可信性”？都是误差范围吗！
-

规矩湾锦苑 · 发表于 2014-8-24 19:32:25

回复 10# 史锦顺

　　把不确定度就当做“误差范围”（置信概率不同）虽然可能是业内一些人的共识，但这个“共识”显然违背了术语“不确定度”的定义最本质的含义。“区间公式”是不存在的，VIM3的包含真值的区间存在，但不确定度只是这个区间的“宽度”（半宽），不是这个“区间”，不确定度并不关心区间在哪里，只表述该区间的宽度，我认为在探讨不确定度理论时，误差、误差范围、不确定度、区间、区间宽度、准确性、可信性（可靠性）等基本术语必须明确，不能相互混杂，相互替代。
　　不确定度是人们凭所掌握的测量过程全部信息估计出来的被测量真值存在区间的半宽，和测量结果的误差及误差范围的大小毫无关系，只不过是被用来定量评判测量结果的可信性罢了。
　　“可疑度”的说法并不是我个人的发明，而是GUM在提出不确定度定义时一开始就认定的，我只不过认为这个提法的确可以非常简单明了地与误差和误差范围评定的准确性加以区分，因此强调了它，特别提醒大家必须严格区分不确定度与误差范围的本质区别，千万不要将它们相混淆。一旦有丝毫的混淆或混同，用误差理论来解释不确定度，用准确性解释可信性，就必然陷入不确定度不可理解，不确定度必须废除的误区之中。
　　实际测量工作，包括实际计量检定/校准工作，都离不开给出测量结果（包括检定结果和校准结果），这些测量结果的品质高低需要量化评判，准确性参数是其质量指标之一，但和所有的产品质量指标一样准确性并非是唯一一个评判参数，的确还有别的质量评判参数，可信性参数就是其中之一。准确性虽然很重要，但准确性很高的测量结果可信性达不到要求同样不能采用而必须废除，另外选择测量方法重新测量，往往准确性与可信性两者，可信性是首先考虑的条件，只有保证了可信性满足要求，才能进一步考虑测量结果的准确性是否达标。可信性和准确性均达到质量要求的测量结果才能决定“产品”合格，这个合格的测量结果才可被用来判定被测对象的符合性。

njlyx · 发表于 2014-8-24 21:49:48

回复 9# 史锦顺

关于统计量估计的“自由度”算法，本人是无力深究。一下是有人在网上发的东西(http://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&ch=&tn=baidu&bar=&wd=%E7%BB%9F%E8%AE%A1%E5%8F%82%E6%95%B0+%E8%87%AA%E7%94%B1%E5%BA%A6&rn=&rsv_enter=0&inputT=18938)，似有道理....

例1：
估计总体的平均数（

）时，由于样本中的

个数都是相互独立的，任一个尚未抽出的数都不受已抽出任何数值的影响，所以自由度为

。
例2：
估计总体的方差（

）时所使用的统计量是样本的方差

，而

必须用到样本平均数

来计算。

在抽样完成后已确定，所以大小为

的样本中只要

个数确定了，第

个数就只有一个能使样本符合

的数值。也就是说，样本中只有

个数可以自由变化，只要确定了这

个数，方差也就确定了。这里，平均数

就相当于一个限制条件，由于加了这个限制条件，样本方差

的自由度为

。

njlyx · 发表于 2014-8-24 21:51:41

本帖最后由 njlyx 于 2014-8-24 21:57 编辑

回复 9# 史锦顺

关于统计量估计的“自由度”算法，本人是无力深究。以下是有人在网上发的东西(itongji.cn,链接发不了！)，似有道理....

例1：
估计总体的平均数（

）时，由于样本中的

个数都是相互独立的，任一个尚未抽出的数都不受已抽出任何数值的影响，所以自由度为

。
例2：
估计总体的方差（

）时所使用的统计量是样本的方差

，而

必须用到样本平均数

来计算。

在抽样完成后已确定，所以大小为

的样本中只要

个数确定了，第

个数就只有一个能使样本符合

的数值。也就是说，样本中只有

个数可以自由变化，只要确定了这

个数，方差也就确定了。这里，平均数

就相当于一个限制条件，由于加了这个限制条件，样本方差

的自由度为

。

规矩湾锦苑 · 发表于 2014-8-25 00:29:34

　　楼上转发的自由度算法我认为是有道理的，谈论自由度一定要说清楚是什么东西的自由度。
　　当做n次测量计算其测得值的平均值时，每个样本（每次测量）都是独立和自由的，缺一不可，因此作为最终测量结果的平均值受到n个测量值的影响，每个测得值有一个自由度，平均值的自由度就是n。
　　在实验标准偏差（σ）计算中，必须用到贝塞尔公式。自由度是“和的项数减去对和的限制数”，n次测量有n个测得值，和的项数就是n，对和的限制只有一个，即平均值与每个（次）测得值的差得到各次测得值的残余误差（简称残差），残差的平方和除以（n－1）开平方得到σ，因此计算实验标准差（σ）时，受到了一次最小二乘法的限制，其自由度为n－1。如果测得n组结果按最小二乘法拟合的校准曲线确定t个被测量时，限制数变成了t个，自由度将是n－t。如果另外还有其它r个约束条件（限制数），自由度则为n―t―r。总之自由度由测量次数n及约束条件个数所决定。如果仅仅计算平均值，则因为没有约束条件，即约束条件t＝０，所以平均值的自由度为n－0＝n。不确定度评定中的各分量自由度就是按照这个原则和JJF1059.1-2012的表4对上级测量结果的怀疑程度与自由度之间的对应关系确定的，

thearchyhigh · 发表于 2014-8-25 11:56:20

回复 6# 史锦顺

首先明确自由度是“不确定度的自由度”，不确定度主要分量是什么? 是标准偏差；标准偏差是通过什么计算的？是残差的平方合再开方；那不确定的自由度不跟残差关联，和什么关联？

		自动登录	找回密码
密码			立即注册

账号		自动登录	找回密码
密码			立即注册

[概念] 不确定度理论的五大难关(3)——可疑又难懂的自由度