计量论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

[概念] 误差有性质不等于误差有类别

[复制链接]
yeses 发表于 2018-3-22 14:47:24 | 显示全部楼层 |阅读模式
本帖最后由 yeses 于 2018-3-22 15:00 编辑

-----该文章被科学网推为精选。

误差有性质不等于误差有类别
武汉大学 叶晓明

    现有测量理论是基于误差分类认识论而展开,但一直以来,几乎很少有人注意到这种误差分类学说存在概念逻辑自相矛盾。自作者在几个文献中明确提出以误差无类别哲学来解释测量误差理论以来,在测量学术界仍然遭到了反对的声音,当然,支持的声浪也不小。那么,今天就有针对性地对这些反对者的主要困惑点作一个解答。
作为一个科学理论,最起码必须逻辑严密、必须和实践相吻合。任何一个自相矛盾或与事实不符的证据都将构成推翻或纠正理论的充分理由。作者用于推翻误差分类学说的案例很多,这里仅简单举一例。
    2005年珠峰高程的测量结果是8844.43米,精度(标准偏差)±0.21米。按照测绘学测量平差的理论解释,精度是对随机误差的评价,那么珠峰高程结果的误差就当然是随机误差了;但按照误差的定义(测量结果与真值之差),珠峰高程结果的误差是一个恒定的偏差(因为珠峰高程的真值不可能处于随机不停的变化状态),一个恒定的偏差不是随机规律,当然应该属于系统误差。这就自相矛盾了。
    说到这里,有些测量界学者通常很不服气:重新重复测量珠峰高程时一批测量结果不就离散了吗?误差不就随机变化起来了吗?
    但是!殊不知,重新重复测量的误差就是其他的不同误差了,和当前的这个偏差就不是同一个东西了。如果用其他大量不同的误差证明当前一个偏差是随机误差的逻辑成立,那么这个世界上任何偏差都可以被证明为随机误差,根本就没有系统误差,那些我们过去所认为的系统误差都将成为随机误差!
    类似的自相矛盾还有。再譬如,总说系统误差不会贡献发散,而实际的误差数据处理中却都是从离散的误差样本序列中把系统误差分离出来。
    误差分类学说遭遇了逻辑悖论,仅凭这些自相矛盾和不合实际的事实而要求对其推翻或纠正当然是足够充分的了。
    即使如此,我当然也知道有些学者们心里仍然不服:你如何解释测量序列的发散和偏离的事实?所有测量教科书都有的那个图(如图1)?
无标题.jpg

    请稍安勿躁,尽管放心,这当然是新的测量理论必须讲清楚的事情。实际上,不仅这个图,新的测量理论要重新解释的概念还很多。
    这个图不就是个原始观测值序列的离散和偏离现象吗?不就是因为重复测量条件的变化致使一些误差产生了系统性影响而另外一些误差产生了随机性影响吗?
    但是请注意!我在这里要指出的哲学问题是:不能把误差的系统/随机影响性质和误差分类扯上关系!误差可以有不同的表现性质,但误差没有不同的类别之分!这里举一个最简单的例子来说明这个道理:水在不同温度气压条件下能表现出气化、液化和固化性质,您能把水按气化、液化和固化性质分成三种不同类型吗?
    以测量人喜欢纠结的噪声误差为例:噪声误差是时间的随机函数,单传感器重复测量时因为时间条件在改变,自然对观测值序列产生随机性的影响;但如果设计一个多路传感器并行同步的观测方法,所有观测值都是在同一时刻点采样得到,被测电压中包含的噪声误差对这样的观测值序列自然是产生系统性的影响。
    当然,如果把系统/随机误差概念仅仅解释为当前误差的系统/随机性影响而不再赋予其他任何概念内涵,这本来也的确是没有问题的。而作者之所以坚持要干脆废弃误差分类概念实则是因为现有测量理论给误差分类概念赋予了太多的概念内涵。譬如,系统误差除了误差的系统性影响的含义外,还有数学期望与真值之差、不贡献发散而只贡献偏离、不遵循随机分布、没有方差、表达测量准确度、有规律的误差、可以改正的误差、已知的误差、只能用函数模型处理的误差、可以用函数模型把它从离散的误差群中分离出来等等;随机误差除了误差的随机性影响的含义外,还有结果与数学期望之差,只贡献发散而不贡献偏离、遵循随机分布、观测值序列的发散度、表达精度、随机规律的误差、不能改正、未知的误差、只能用随机模型处理、白噪声、时间的随机函数等等;甚至任何误差都必须要牵强附会地扣上一个终身性的类别帽子(如前边珠峰案例)。恰恰就是这些引伸出来的概念把现有测量理论的逻辑搅得一团糟,给人们灌输了诸多错误的观念。既然如此,废除误差分类概念、就事论事岂不更好?
    还值得一说的是,这个图1只是对原始观测值序列分布的描述,这个图的最大忽悠点就是它没有标注最终测量结果!而测量人都清楚的一个基本道理是,一个被测量只能提交一个测量结果,不可能把一批离散的原始观测值不经任何数据处理而直接作为测量结果提交,而一个测量结果则只有一个恒定的偏差(即使这个偏差含有来自噪声的贡献)。就是说,精度/准确度术语用于原始观测值序列还勉强可以(但概念逻辑跟误差规律性之间还不能有关系),而现有测量理论却居然把精度/准确度概念用到了最终唯一测量结果的单一偏差上,以至于把不确定度概念也污染得不伦不类。
    新的测量理论要重新解释的问题还很多,有兴趣的朋友请看我的书吧。这里再提前作个预告:一篇完整论述误差规律性和影响特性的论文在历时1年多的审理后刚完成大修,以下是按大修要求提交的Highlights。
Highlights:

●Error’s regularity and randomness depend on the perspectives of observing error
●Error cannot be classified according its regularity and randomness
●The influence characteristics of error depend on the method of repeated measurement
●Error cannot be classified according its influence characteristics
●Both function model and random model can be used to process the same error


                                                                     2018 3 21

Image (2).jpg
 楼主| yeses 发表于 2018-3-23 09:36:38 | 显示全部楼层
关于误差的影响性质再补充二例:

再譬如,测量人都熟悉的舍入(四舍五入)误差是量程的锯齿周期规律,也遵循矩形分布。若重复观测值是在同一量程点取得,舍入误差产生系统性影响;若重复观测值是在任意不同的量程点取得,舍入误差则产生随机性影响。
再譬如,测绘界都熟悉的测距仪周期误差是量程的正弦函数,也遵循U形分布。若重复观测值是在同一量程点取得,周期误差产生系统性影响;若重复观测值是在任意不同的量程点取得,周期误差则产生随机性影响。
这就是误差的影响性质实际是测量方法条件决定的道理,就如同水的性质是温度气压决定的道理一样。离开了具体的条件前提就无性质可谈。


补充内容 (2018-3-29 17:16):
这些案例就是告诉所谓随机误差的产生机制,所谓重复测量实现抵偿要看重复测量的相关测量条件是否在随机变化。

补充内容 (2018-3-29 17:19):
如果只死记书中的随机误差教条而不跟随主帖的思路探讨随机变化的物理机制,那就没法讨论了。

补充内容 (2018-3-29 18:25):
脱离了具体应用条件去讨论一个孤立的误差的类别是没有意义的,就如同前边讨论珠峰高程的误差,因为没有涉及珠峰高程值如何用于后续下游测量,也就不需要涉及其误差对未来什么测量会产生什么影响。
 楼主| yeses 发表于 2018-3-29 09:31:43 | 显示全部楼层
本帖最后由 yeses 于 2018-3-29 09:35 编辑

以下内容为对原文的补充:


还值得一说的是,这个图1只是对原始观测值序列分布的描述,这个图的最大忽悠点就是它没有标注最终测量结果!而测量人都清楚的一个基本道理是,一个被测量只能提交一个测量结果,不可能把一批离散的原始观测值不经任何数据处理而直接作为测量结果提交,而一个测量结果则只有一个恒定的偏差Δ(即使这个偏差含有来自噪声的贡献)。如图2。虽然这个偏差Δ可分解为结果与期望之差ΔA和期望与真值之差ΔB,但偏差ΔA和ΔB都是恒定的偏差,实际也都有其各自的概率分布区间,根本没有性质差异。就是说,精度/准确度术语用于原始观测值序列还勉强可以(但概念逻辑跟误差规律性之间还不能有关系),而现有测量理论却居然把精度/准确度概念用到了最终唯一测量结果的单一偏差上,以至于把不确定度概念也污染得不伦不类。
无标题.jpg                                     无标题2.jpg



补充内容 (2018-3-29 17:07):
实际上,根据图2,总偏差:Δ=ΔA+ΔB,总方差 :σ2=σ2(ΔA)+σ2(ΔB) 。这个σ就是不确定度,根本没有精度、准确度的什么事。
csln 发表于 2018-3-29 14:09:10 | 显示全部楼层
yeses 发表于 2018-3-29 14:06
这稿子原针对测绘界所写,举珠峰案例也是因为如此(珠峰的成果公布就是用的精度)。我是一直主张测量概念 ...

那您倒是去测绘界宣扬您的“理论”啊
规矩湾锦苑 发表于 2018-3-22 19:18:25 | 显示全部楼层
  叶老师说得好!“测量人都清楚的一个基本道理是,一个被测量只能提交一个测量结果,不可能把一批离散的原始观测值不经任何数据处理而直接作为测量结果提交,而一个测量结果则只有一个恒定的偏差。”。JJF1001给“误差”的定义是“测得的量值减去参考量值”,“参考量值”是给定的,是唯一的,“一个被测量只能提交一个测量结果”,也是唯一的,两个唯一值相减当然也是唯一的值。误差分类说提出了多次测量的条件,完全偏离了“误差”定义的“唯一”条件,提出这种分类方法本身在逻辑上就说不通,因此造成了随机误差与系统误差合成成为不伦不类也就是必然的了,正如叶老师所说,这种按多次测量为前提条件对误差进行分类的不伦不类,“用到了最终唯一测量结果的单一偏差上,以至于把不确定度概念也污染得不伦不类”。
 楼主| yeses 发表于 2018-3-23 09:32:54 | 显示全部楼层
规矩湾锦苑 发表于 2018-3-22 19:18
  叶老师说得好!“测量人都清楚的一个基本道理是,一个被测量只能提交一个测量结果,不可能把一批离散的 ...

对头。对于专业测量来说,原始观测值和最终测量结果是二个完全不同的概念。原始观测值序列可以有发散,但最终测量结果就只有一个,自己跟自己不存在发散。
刘耀煌 发表于 2018-3-23 09:43:11 | 显示全部楼层
我认为珠峰高程测量不一通过一次绝对测量得到的,测量结果8844.43m,1sima=0.21m,这个0.21m可以认为是标准不确定度,主要是由测量方法造成的
规矩湾锦苑 发表于 2018-3-23 13:40:10 | 显示全部楼层
刘耀煌 发表于 2018-3-23 09:43
我认为珠峰高程测量不一通过一次绝对测量得到的,测量结果8844.43m,1sima=0.21m,这个0.21m可以认为是标准 ...

  我赞成你的观点,珠峰高程测量结果8844.43m,1sima=0.21m,这个0.21m可以认为是测量结果8844.43m的测量不确定度。
  因为这个测量不确定度0.21m是获得该高程测得值8844.43m所用测量方法造成的,所以也可以说是获得高程8844.43m的测量方法的测量不确定度。
  不确定度反映了测量方法的“可信性”,或称反映了测量方法的“可靠性”,但并不反映测量结果的“准确性”。量化反映测量准确性的是测量“误差”,要得到“误差”就必须知道珠峰高度的“真值”。当前没人知道珠峰高度真值是多少,所以人们才要通过测量去认识珠峰的高度。
  8844.43m是当前最高水平的珠峰高度测得值,没有比它更准确、更可靠的测得值可作为珠峰高度测量结果的“参考值”,因此珠峰高程测量结果8844.43m也就无法计算出“误差”,或称当前无法知道珠峰高程测量结果8844.43m的误差是多少。
  “真值”是没有“误差”的值,我们完全有理由说在当前科技水平下,珠峰的高度“真值”可“约定为”8844.43m,或称珠峰高度当代“约定真值”为8844.43m。其它所有想测量珠峰高度的人们,可将8844.43m作为其“参考值”,将他们的测得值与这个“参考值”8844.43m相比较,以获得他们珠峰高度测量结果的“误差”。
规矩湾锦苑 发表于 2018-3-23 14:28:59 | 显示全部楼层
yeses 发表于 2018-3-23 09:36
关于误差的影响性质再补充二例:

再譬如,测量人都熟悉的舍入(四舍五入)误差是量程的锯齿周期规律,也遵 ...

  很赞成叶老师的观点:“误差的影响性质实际是测量方法条件决定的,就如同水的性质是温度气压决定的道理一样。离开了具体的条件前提就无性质可谈。”我斗胆延伸和发挥如下:
  我们研究的对象是“测量结果”,“误差”和“不确定度”都是“测量结果”的“性质”(专用术语叫“计量特性”)。对于研究对象我们可以按其性质分类,对于研究对象的某“一个性质”而言,它只是“一个”特性,我们无法分类,也没必要分类。
  因此测量结果的“测量不确定度”和测量结果的“测量误差”是“研究对象”的“性质”,我们不能对它们再分别分类,能够分类的只是测量结果。我们可以把测量结果分成“单次测量的测量结果”和“多次测量的测量结果”,分成一个测量结果的“个体”和一群测量结果的测量结果“集”。每个测量结果个体只有一个误差,一群测量结果的“集”必包含有一群测量误差,一个“误差集”。如果把测量结果集作为一个整体给出一个统一的测量结果,这个“测量结果集”可作为一个测量结果“个体”看待,也就只能有一个“误差”了。
  “测量结果个体”的误差和“测量结果集”的误差表现形式各有不同。每个“误差集”都有其“位置”和“宽度”两个属性,分别是“偏移”性和“分散”性。疑似就有了所谓的“系统误差”和“随机误差”。在把“测量结果集”作为分散的“测量结果个体”看待时,“误差集”有了“偏移”和“分散性”,因此“系统误差”和“随机误差”不是对“误差”的分类,而是“误差集”的两个不同“性质”的名称。
 楼主| yeses 发表于 2018-3-23 14:33:28 | 显示全部楼层
本帖最后由 yeses 于 2018-3-23 15:16 编辑
刘耀煌 发表于 2018-3-23 09:43
我认为珠峰高程测量不一通过一次绝对测量得到的,测量结果8844.43m,1sima=0.21m,这个0.21m可以认为是标准 ...


当然不是一次测量得到的,肯定是大量观测值经过数据处理后最终确定的唯一结果。

您的理解是正确的,±0.21实际就是不确定度,普通老百姓都是这种理解,他们根本不会纠缠这个偏差是什么类别,但测量教科书上给出的精度定义却不是这样。

这是非常值得玩味的话题,对于珠峰高程,普通百姓一般都是把精度±0.21米理解成偏差的可能存在范围----这恰恰就是真正的不确定性概念的理解方式(我的论著中有详细推理),他们会认为测量学家们纠缠珠峰高程误差的类别问题和未来重复测量的发散性问题纯粹是莫名其妙(您不妨调研一下身边的非专业朋友)。
f8c8 发表于 2018-3-24 17:18:22 | 显示全部楼层
这回似乎看懂喽 。
原来误差没那么复杂,返璞归真,误差就是误差本身,恰如水就是水,尿就是尿,牛奶就是牛的奶,胡分乱算,误事惹是非呢,对么?
谢谢老师。
狼烟 发表于 2018-3-25 09:30:45 | 显示全部楼层
我认为,只要测量手段不唯一,就存在系统误差了。
我做豆腐,为了测量蛋白质的提取量,曾经粗略看过相关国标。其中大约提到了3种测量方法,起码不是一种方法。
那么,用3种方法测量同一批物质,分别测量多次,各得到一个正态分布,谁能保证3个分布的重心是重合的?如果不重合,如何理解其结果的差异?是不是用系统误差来分析就合理了?

转换到珠峰测量,如果存在2种以上的方法,方法之间相互独立,测量结果离散型也近似,对于测量结果的差异,请问该怎么认识?
如果一种方法测量结果离散小,数据就有了可比性,似乎可以看成真值,但该方法未必是线性的,即结果未必比另一种离散性大的方法更可靠。
方法是否线性,方法在某个区间是否线性,方法在该区间的线性是什么情况,在极端测量的时候,是无法验证的。那怎么办?折中呗。折掉的数据算什么?不得有个说法?不得有个名称?

同理推下去:同样的方法,不同的设备,对同一事物多次测量得到不同的统计结果,这个结果差异,该怎么理解?能说是偶然吗?多次测量得到的统计结果,已经不是偶然了,最多算是方法的偶然误差,就应该归属于确定测量系统的系统误差了吧。

相同条件下的同一设备多次测得的结果,其离散性为a,
相同条件下的不同设备多次测量的结果,其离散性为b,
a和b难道不需要区分吗?即便你不用系统误差偶然误差这个概念,你也要起个名字吧,无非就是新瓶装旧酒。
这个b的获得方法不就是系统误差理论分析后进行验证的方法吗?如果没有这个验证,a的结果即便离散性很小,如何确认其不确定度?难道自身的离散性就是不确定度吗?

如果自身的离散性是不确定度,那么我用一个方法测量珠峰1万米,我的分辨力就是1万米,每次测量都相同,能说我测量结果的不确定度为0吗?

离开行业好久了,术语很多是自己编的,不过我认为不会造成歧义,如果您无法理解某术语,请提出来,我学习学习相关术语后再交流。
 楼主| yeses 发表于 2018-3-25 15:00:03 | 显示全部楼层
本帖最后由 yeses 于 2018-3-25 15:07 编辑

误差的表现性质是基于特定的测量条件,脱离了特定的测量条件谈误差类别没有意义,就如同水的性质是基于温度气压的道理一样。只需要根据当时的测量条件分析其性质就够了。

误差分类学说内涵太多了,灌输了很多错误的概念,譬如:系统误差是规律误差、不遵循随机分布,随机误差是随机规律等。实际上,误差的表现性质根本不是规律决定的,误差遵循随机分布是只其取值的有界性,跟规律也没有关系。

把不确定度解释成发散性恰恰是现有测量理论的一大败笔!
狼烟 发表于 2018-3-25 15:54:06 | 显示全部楼层
单次测量,同一测量系统对被测事物在同一条件下的多次测量,同一测量方法不同测量系统对被测事物在同一条件下的分别多次测量,不同测量方法对被测事物在同一条件下的分别多次测量。
这些种类的测量,逐渐会靠近被测量的真值,所以后一种测量是前一种测量的仲裁。永远无法得到真值,所以面对2个结果的不确定度相近似,又没有了仲裁方法时,只能折中,也就是说计量学并不是完全科学的,也是要和稀泥的。
即便米原器,每年也要变化,2个同种类同性质同条件保存的米原器有了差距,怎么来认识这个差距?怎么解决差距?还是和稀泥。
狼烟 发表于 2018-3-25 15:56:38 | 显示全部楼层
即便米原器,每年也要变化,2个同种类同性质同条件保存的米原器有了差距,怎么来认识这个差距?

这个差距,对米原器的保存方法来说,是偶然误差,但是对于某一个米原器来说,是系统误差。
狼烟 发表于 2018-3-25 15:58:07 | 显示全部楼层
上一级的偶然误差,来验证下一级的系统误差,即测量系统自身不完善带入的误差。
狼烟 发表于 2018-3-25 15:59:18 | 显示全部楼层
我觉得这么理解的话,并不会给人带来困惑。
狼烟 发表于 2018-3-25 16:12:25 | 显示全部楼层
条件并不能被人类认识完全,因为一些不认识的条件变化,导致人们不认识变化产生的原因,或者无法控制这个条件,这就归属于偶然误差。
某些条件一旦确定,这些条件带入的偶然误差就确定了下来,这就归属于系统误差了。
 楼主| yeses 发表于 2018-3-25 16:16:27 | 显示全部楼层
狼烟 发表于 2018-3-25 15:56
即便米原器,每年也要变化,2个同种类同性质同条件保存的米原器有了差距,怎么来认识这个差距?

这个差距 ...

建议不要把不同的事情放在一起扯,不要把测量误差的不确定性和被测量本身的不确定性混在一起说,先把被测量稳定不变时的测量问题说清楚。

狼烟 发表于 2018-3-25 16:24:20 | 显示全部楼层
条件确定下来,这些条件带入的偶然误差确定了下来,这个误差的大小和方向不可知,所以无法修正,只能把误差带入结果的不确定度中。
所以有人要求校准不要检定,用校准数据去修正使用,这是危险的。因为校准数据如果是统计得到的,单次测量修正使用会加大误差。
狼烟 发表于 2018-3-25 16:25:20 | 显示全部楼层
yeses 发表于 2018-3-25 16:16
建议不要把不同的事情放在一起扯,不要把测量误差的不确定性和被测量本身的不确定性混在一起说,先把被测 ...

我好像一直在强调被测量固定啊。是您理解问题吧
 楼主| yeses 发表于 2018-3-25 16:26:53 | 显示全部楼层
狼烟 发表于 2018-3-25 15:59
我觉得这么理解的话,并不会给人带来困惑。

误差分类概念用得太滥了,内涵太多,现在甚至还有人在以误差的大小来分类系统、随机误差。废弃误差分类概念,就事论事更好。
狼烟 发表于 2018-3-25 16:28:10 | 显示全部楼层
米原器放在那里,同条件保存,事物都是固定的。
他们之间的互相比对,难道被测量会变化吗?
 楼主| yeses 发表于 2018-3-25 16:31:33 | 显示全部楼层
本帖最后由 yeses 于 2018-3-25 16:33 编辑
狼烟 发表于 2018-3-25 15:56
即便米原器,每年也要变化,2个同种类同性质同条件保存的米原器有了差距,怎么来认识这个差距?

这个差距 ...


才理解您的意思。

别用系统误差概念为好,因为一用系统误差概念,又要扯它不遵循随机分布没有方差了。。。
狼烟 发表于 2018-3-25 16:38:21 | 显示全部楼层
yeses 发表于 2018-3-25 16:31
才理解您的意思。

别用系统误差概念为好,因为一用系统误差概念,又要扯它不遵循随机分布没有方差了。。 ...

它确实不随机了。因为测量系统一旦固定,其中的某些条件就固定了,这些条件带入的误差是多少不可知,但是其影响是固定的,是不随机的。
就像用大斗进量米,大斗进占便宜,这是不随机的,占便宜的量大约是多少,这也不随机。
 楼主| yeses 发表于 2018-3-25 16:39:17 | 显示全部楼层
f8c8 发表于 2018-3-24 17:18
这回似乎看懂喽 。
原来误差没那么复杂,返璞归真,误差就是误差本身,恰如水就是水,尿就是尿,牛奶就是牛 ...

就是!就事论事该怎么样就怎么样,不需要套用教条。
 楼主| yeses 发表于 2018-3-25 16:41:56 | 显示全部楼层
本帖最后由 yeses 于 2018-3-25 16:45 编辑
狼烟 发表于 2018-3-25 16:38
它确实不随机了。因为测量系统一旦固定,其中的某些条件就固定了,这些条件带入的误差是多少不可知,但是 ...


但它的取值的概率区间还是存在的。“不随机”的内涵究竟指什么?

珠峰高程误差也不会随机变,但它也有方差,算随机还是系统?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|计量论坛 ( 闽ICP备06005787号-1—304所 )
电话:0592-5613810 QQ:473647 微信:gfjlbbs闽公网安备 35020602000072号

GMT+8, 2025-5-4 03:09

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表