本帖最后由 史锦顺 于 2016-1-30 15:34 编辑
-
关于交叉系数论
—— 答qcdc(1)
-
史锦顺
-
【qcdc质疑】
《费书》的例3-7是讲圆柱体体积的误差合成与分配,您可能没有看仔细,测量直径和高是用了两种不同的仪器,即分别用了2级的千分尺和分度值为0.10mm的游标卡尺,请问这两个量怎么相关?怎么用相关系数?最近您发明了“交叉系数”,等于+1或-1,似乎为您的取“绝对和法”找到了理论依据,但是,“交叉系数”理论是不存在的,请您三思!
-
【史答】
《费书》例3-7的测量工具本身误差的独立性,我并未忽视。
以往的理解,受“相关性”的影响很深。来自统计理论的“相关性”,被用来考虑“协方差”(钱钟泰称“交叉矩”)是否可忽略,人们习以为常,似乎既然来自统计理论,就必定是真理,毋容置疑。其实,对系统误差(包括以系统误差为主的测量仪器的误差范围)来说,这是个历史性的错误。
原来,决定误差合成方式的依据是“交叉系数”而不是“相关系数”。人们会明白,这项揭示,对误差理论,对整个测量学理论都是重要的。
-
我知道,你对“以交叉系数代替相关系数”的观点,持否定态度。没关系,可以慢慢讲道理、辩论。
-
我不是一眼就看穿这个问题的,而是经过了长时间的思考。经历了几个阶段。对相关系数的求法、作用,不仅是三思,而是百思不得其解。而在追本溯源的探讨中,得知本质是交叉项的问题,可以用交叉系数来描述,此后便一顺百顺。
有一位叫physics的网友,五个月前给我写了一封信(在我不熟悉的栏目中,昨天才看到),表示愿意学习老史的理论。今天我把个人的观点与有关交叉系数的理论,较详细的写出来(大部分是复制),一方面答复qcdc,也是对physics网友的体现尊师重道精神的来信的回复。至于某些不礼貌的帖子,我不想回应,由他去吧。不正视客观规律,到头来,吃亏的是他自己。
-
1 对相关系数公式的适用范围的突破
科学不能凭印象,不能凭主观估计。测量计量学是关于“量”的科学,评估不行,必须严格计算。计算依据公式。现行的相关系数公式为:
r=[1/(N-1)][∑[Xi-X(平)][(Yi-Y(平))] / [σ(X) σ(Y)] (a)
这个来自统计理论的公式(a),仅适用于随机变量。
公式(a)对系统误差的灵敏度为零。Xi加A,则X(平)也加A,Xi-X(平)必然消掉A。同样,Yi加B,则Y(平)也加B,Yi-Y(平)必然消掉B。就是说系统误差A、B不论是何值,不论A与B相关还是不相关,相关系数都是零。
因此,相关系数公式(a)不能用于对系统误差合成问题的分析。于是,只得追根溯源,从头分析。只得重新推导公式。
-
2 关于费先生的实例
圆柱体的两个尺寸的测量误差,可以说没有关系,因为是不同测量工具测量出来的。也可以说有极强的关系,因为体积公式决定,直径D与高度H,必须相乘才能求得体积,高度H与直径D共同决定体积的大小。直径D的误差范围与高度H的误差范围,共同决定体积值的误差范围。微分原理决定要取两个误差元的代数和。必须放在一起计算,就不能说它们间不相关。
H与D只知道误差范围,因此有误差合成的求法问题。其实,相关还是不相关,对误差合成问题都没关系,本质是“交叉矩”能否忽略。系统误差的交叉系数是±1,仅能取+1。《费书》的例子,误差项只有两项,必须取+1,因而必须取绝对和。取方和根是错误的。
-
3 要正视现实
史锦顺的关于“误差合成方式取决于交叉系数”的理论(简称“交叉系数论”)已在网上公布,这是客观事实。你可以赞成,更可以反对,但说“不存在”,是不应该的。创办《奇迹文库》的旅美博士王彦宏介绍过,国际上,凡在学术专业网上发表文章,就被认定是已经发表。不能说纸上印的才有效,那是老黄历。
任何理论都是人创造的。正确还是错误,取决于是否符合客观规律。先生似乎认为只有前人的、被公认的理论才算“存在”,这是阻碍科学发展的狭隘观点。
你应该对老史的“相关系数论”驳斥一番。我必定认真地思考、详细地说明、严肃地辩论。只说一个“不存在”,无效。挂在网上,大家都看得到,怎能说“不存在”?
-
-
附言
再次感谢njlyx(李永新)、崔伟群二位先生。我从他们那里得知:系统误差的相关系数是+1或-1。这大大促进了我对交叉系数的研究。
-
-
附录:交叉系数论(史锦顺 2015 郑州)
(一)误差合成的两种思路
经典误差理论的误差合成,随机误差自身用“均方根法”,随机误差间用“方和根法”,系统误差间用“绝对和法”。方法没能统一。
GUM为代表的不确定度理论,统一采用“方和根法”,对随机误差的处理与经典误差理论相同,没有问题;但对系统误差的处理,用“方和根法”,出现严重问题。第一,合理性问题。在系统误差合成的条件下,二量和的平方的展开式的交叉项,不能忽略,交叉系数是+1或-1,因而此时不确定度评定中的“假设不相关”是不成立的。第二,为实行“方和根法”,带来五项难题:(1)需知误差量的分布规律、(2)化系统误差为随机误差、(3)假设不相关、(4)范围与方差间的往返折算、(5)计算自由度。其中有的很难,如(1)(4)(5);有的多数情况不对,如(3);有的不可能,如(2)。
笔者在网上讨论的基础上,提出统一处理误差合成的“方根法”。“方根法”体现误差量的“绝对性”与“上限性”两个特点,着眼于误差范围,统筹随机误差与系统误差的处理,把系统误差元与随机误差元都变成是误差范围的直接构成单元,用取“方根”的办法实现误差的绝对值化。为此,用可正可负的恒值β代表系统误差元;用三倍的随机误差元3ξi 代表随机误差对误差范围的贡献单元。这样,系统误差β与随机误差元3ξ对误差范围的贡献权重相同,都是1。于是,公式推导与合成处理,都方便,给出的处理办法,十分简洁。
不确定度理论的思路是将众多的系统误差化向随机误差。此乃“众归一”。但系统误差多种多样,化向随机误差很难,甚至不可能。这就是不确定理论烦难乃至不成立的根源。
本文的思路是使随机误差对误差范围的权重为“1”,使其与系统误差权重相同。此乃“一从众”。达到此目的的方法极其简单,就是对随机误差元乘以3。
两种思路,导致处理方法一繁一简,难易分明。不确定度理论的烦难方法,基于不符合实际的臆想(用生产厂家不同、原理不同的多套仪器测量同一个量,系统误差有分布);本文的方法是基于客观实际(用同一套测量仪器,重复测量中系统误差为恒值)的严格推导。是非曲直,昭然若揭。
-
(二)随机误差元构成的误差范围
随机误差的处理,经典误差理论有成熟、完美的处理方法。
测量实践中,人们易于认识随机误差。对常量的重复测量中,测得值的随机变化就是随机误差。
随机误差元可大可小,可正可负。有四个特性:
(1) 单峰性:小误差概率大;大误差概率小
(2) 对称性:数值相同的正负误差概率大致相等
(3) 抵消性:求平均值时正负误差可以抵消或大部分抵消
(4) 有界性:很大的误差概率很小。(以3σ为半宽的区间,包含概率99.73)。
按统计理论,随机误差是正态分布。
-
对随机误差,有如下定义与关系:
1 随机误差元等于测得值减测得值的期望值(当无系统误差时,期望值是真值)。随机误差元的期望值是零。随机误差元为:
ξi = Xi - EX (1)
2 标准误差定义为
σ =√(1/N)∑ξi
=√(1/N)∑(Xi-EX) (2)
3 贝塞尔公式用测得值的平均值代换(2)式中的期望值,得到:
σ =√{[1/(N-1)]∑[X-X(平)]^2} (3)
4 随机误差范围
R = 3σ =3√(1/N)∑ξi^2
=√(1/N)∑(3ξi)^2 (4)
5 由公式(4),有:
R=3σ(ξ)= σ(3ξ) (5)
随机误差元的3倍值(3ξ),其统计意义的方根值等于误差范围值。因此3ξ对误差范围的权重为1。因此3ξ在构成误差范围时与系统误差的权重相同。以后,我们把随机误差元对误差范围的贡献因子取为1/3,而系统误差的贡献因子取为1。
-
(三)单项系统误差元构成的误差范围
系统误差元用β表示。β是可正可负的恒值。
单个系统误差构成的误差范围
R =√(1/N)∑(βi)^2
= |β| (6)
单个系统误差对误差范围的贡献是该系统误差的绝对值。
-
(四)误差合成的理论基础
函数的改变量,等于函数对各个自变量偏微分的和。就是泰勒展开的一级近似。
f(x,y) = f(xo,yo)+ (∂f/∂x) (x-xo)+ (∂f/∂y) (y-yo) (7)
f(x,y) - f(xo,yo) =(∂f/∂x) Δx+ (∂f/∂y) Δy (8)
Δf =(∂f/∂x)Δx + (∂f/∂y)Δy (9)
公式(9)是偏差关系的普遍形式。对所研究的特定函数来说,∂f/∂x、∂f/∂y是常数。
偏差关系用于测量计量领域,x是测得值,xo是真值, Δx是测得值x的误差元;y是测得值,yo是真值,Δy是测得值y的误差元;f(x,y)是代表被测量的函数值, f(xo,yo) 是函数的真值,Δf= f(x,y)-f(xo,yo) 是函数值的误差元。
-
(五)交叉系数的一般表达
设函数的误差由两项误差Δx、Δy引起。由此,函数的两项误差元为:
Δf(x) = (∂f/∂x) Δx
Δf(y) = (∂f/∂y) Δy
把分项误差作用的灵敏系数与该项误差归并,记为:
Δf(x) =ΔX
Δf(y) = ΔY
函数的误差元式(9)变为:
Δf=ΔX +ΔY (10)
对(10)式两边平方并求和、平均:
(1/N)∑Δf^2=(1/N)∑(ΔX +ΔY)^2
=(1/N)∑ΔX^2 + 2(1/N)∑ΔXΔY+(1/N)∑ΔY^2 (11)
(11)式右边的第一项为σ(X)^2,第三项为σ(Y)^2; (11)式右边的第二项是交叉项,是我们研究的重点对象。交叉项 为
2(1/N)∑ΔXΔY =2【(1/N)(∑ΔXΔY) / {√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]}】
×{√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]}
= 2J√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2] (12)
(12)式中的J为:
J =(1/N)(∑ΔXΔY) / {√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]} (13)
称J为交叉系数。
(注:J在此前记为r,称为相关系数。这和统计理论的相关系数,物理意义不一致。为澄清已有的混淆,本文称J为交叉系数。)
-
(六)随机误差间合成的交叉系数
对随机误差的合成,ΔX是ξx, 代换为[X-X(平)];ΔY是ξy,代换为[Y-Y(平)],有:
J =[1/(N-1)][∑[Xi-X(平)][(Yj-Y(平))] / [σ(X) σ(Y)] (14)
由于ξx、ξy是随机误差,可正可负,可大可小,有对称性与有界性,多次测量,是大量的,因此,随机误差间的合成的交叉系数为零(或可以忽略)。(14)式是当前不确定度论引用的统计理论的相关系数公式。
随机误差合成,“方和根法”成立,有
σ(f) =√[σ(X)^2+ σ(Y)^2] (15)
-
(七)随机误差与系统误差合成的交叉系数
两个分项误差,一个是随机的,记为ξ,考虑到对误差范围的权重,取单元量为3ξ(ΔX);一个是系统的(重复测量中不变),记为β(ΔY)。
代入公式(13),有
J =(1/N)(∑3ξiβ) / [σ(X) σ(Y)] (16)
系统误差元是常数可以提出来,有
J =(1/N) (3β∑ξi) / {√[(1/N)∑ΔX^2]√[(1/N)∑ΔY^2]} (17)
大量重复测量(例如N=20,N不得小于10)中,(17)式的∑ξi等于零或可以忽略,因此J近似为0,可以忽略。“方和根法”成立。
-
(八)系统误差与系统误差合成的交叉系数
设(13)式中ΔX为系统误差βx ,ΔY为系统误差βy,有
√[(1/N)∑ΔX^2]= |βx| (18)
√[(1/N)∑ΔY^2]= |βy| (19)
则系统误差的交叉系数为
J =(1/N)(∑βxβy) / [|βx| |βy|] (20)
=(1/N) (∑βxβy) / [ |βx| |βy| ]
=±1
即有
|J|=1 (21)
当βx与βy同号时,系统误差的交叉系数为+1;当βx与βy异号时,系统误差的交叉系数为-1.
当系统误差的交叉系数为+1时,(11)式为:
| Δf | =|βx^2|+2|βx||βy| +|βy|^2
即有
| Δf | =|βx|+|βy| (22)
(22)式就是绝对值合成公式。
当系统误差的交叉系数为-1时,(22)式变为二量差的公式。因为通常只是知道系统误差之误差范围,又鉴于误差量“上限性”的特点,二量差的公式不能用。
测量仪器的性能指标,给出的都是误差范围。
单值量具,如果上级计量已给出修正值(不是一般的测得值,必须是给出的带有修正误差的修正值),并且已按修正值使用,则该量具的随机误差与修正前相同;而修正后的系统误差等于修正值的误差[(标准的系统误差与随机误差)+被检仪器的随机误差]。
测量仪器,通常有几千到几十万个测量点。上级计量部门通常只能给出十几个到几十个校准点的修正值。只有这些点(或很接近的点)能修正;杯水车薪,测量仪器的绝大部分的测量点是不能修正的。就是修正过的点,也还是有系统误差的(等于校准时标准的系统误差与随机误差,再加上被校仪器的随机误差)。由于被检仪器的随机误差,经修正操作后转化为被检仪器的系统误差,因此修正并不一定好。除单值量具外,通常,测量仪器是不修正的。
通常,测量仪器的误差范围指标值由生产厂家给出,由计量部门公证,测量者按仪器指标应用。直接测量,测量仪器的指标,就可看作是测量的误差范围(只要符合仪器使用条件,环境等的影响,已包含在仪器的指标中)。间接测量,要按间接测量的函数关系进行误差合成。测量仪器的误差范围指标值因以系统误差为主,要视其为系统误差值,按系统误差处理。
-
(九)关于合成方法的主张
误差合成,统一按“方根法”。对特定的误差种类,“方根法”分化为“均方根法”、“方和根法”、“绝对和法”、“混合法”。
通常,测量仪器以系统误差为主。不能无视系统误差的存在。考虑到系统误差、随机误差都是客观存在,提出如下主张:
(1)随机误差序列,用“均方根法”,随机误差范围之间,用“方和根法”;
(2)随机误差范围与系统误差范围之间,用“方和根法”;
(3)有多项中小系统误差项,仅有一项大系统误差(或没有大系统误差),它们之间的交叉系数,可能是+1,也可能是-1,有相互抵消、或部分抵消的作用,这样,可以用“方和根法”。
(4)直接测量仅有两三项系统误差,要用“绝对和法”(适用于研制中确定仪器指标);
(5)间接测量,仅有两三项测量仪器的误差范围,要用“绝对和法”;
(6)有多项误差,在两项或三项大系统误差之间用“绝对和法”,其余的各种处理,用“方和根法”。总称谓是“混合法”。
-
补充内容 (2016-1-30 16:55):
你应该对老史的“相关系数论”驳斥一番,改为 你应该对老史的“交叉系数论”驳斥一番。 |