计量论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

[数据] “平均值的误差比单次测量结果的误差小”您怎么看?

[复制链接]
都成 发表于 2014-3-12 08:21:32 | 显示全部楼层 |阅读模式
最近论坛的帖子上出现了“平均值的误差比单次测量结果的误差小”的观点,您怎么看?
hblgs2004 发表于 2014-3-12 08:42:43 | 显示全部楼层
不一定,平均值误差是由多个单次测量误差平均后获得,单次测量误差在平均值误差值上下波动
tigerliu 发表于 2014-3-12 14:54:41 | 显示全部楼层
当然是不确定的,上次看到一个帖子好像说跟系统误差有关系,我很不明白,这应该跟随机误差相关啊,单次测得值在平均值周围分散,单次测量误差也就在平均值误差上下分散,也就是有大有小
史锦顺 发表于 2014-3-12 15:32:27 | 显示全部楼层
本帖最后由 史锦顺 于 2014-3-12 15:34 编辑

回复 1# 都成

我认为:必须说“平均值的误差比单个值的误差小”。这样才能鼓励人们尽可能多测量几次。如果说谁大谁小不一定,那还提倡多次测量干什么?

在另一个楼的讨论中,已经辩论过。我认为辩论不得要领,没抓到根本症结,以至于不定说站上风。这个问题本来简单,都是推行不确定度论造成的混乱。多年不普及误差理论知识了,真该补补课。我先休息几天(刚刚写了个长帖),人老了,请原谅,过几天见。我又得写个长帖,不然说不清楚。有兴趣的网友可以先论论,也考验一下各位处理实际问题的能力,锻炼一下各自的思维能力。争论才印象深刻,学东西就要反复比较。看书可以增加知识,却难以锻炼思考能力。不怕想错,但不想是得不到提高的。如果有人能讲清“平均值的误差比单个值的误差小”,那我就安心养老了,何必我多嘴。

-

刘毅 发表于 2014-3-12 16:27:45 | 显示全部楼层
个人认为通过正态分布看每次测量结果的话,平均值最接近正态分布的极点,也就是最接近真值。
规矩湾锦苑 发表于 2014-3-12 17:39:49 | 显示全部楼层
  在这一点上,我和史老师的观点完全一致。之所以鼓励检验人员多测量几次取平均值作为自己的测量结果,目的就是削弱随机误差产生的影响,使测量结果更贴近被测量真值。因此从宏观或者统计学角度上看,“平均值的误差比单个值的误差小”是正确的。
  另外,单次测量的结果是分散的,也并不否认有个别单次测量的结果刚好与平均值相等,甚至比平均值更贴近真值,但这情况并不是总的趋向,从统计学的观点来看,绝大多数单次测量结果一定会比平均值偏离被测量真值远。
vandyke 发表于 2014-3-13 19:10:20 | 显示全部楼层
本帖最后由 vandyke 于 2014-3-13 19:14 编辑

从逻辑学来说,“平均值的误差比单次测量结果的误差小”,不是能必然推论的。应正确表述为“平均值的误差比任意单次测量结果的误差小”,而不是“平均值的误差比特定单次测量结果的误差小”
vandyke 发表于 2014-3-13 19:12:22 | 显示全部楼层
本帖最后由 vandyke 于 2014-3-13 19:16 编辑

用概率论,这句话表述为“平均值的误差比任意单次测量结果的误差小是大概率事件”,但也是依据概率论,小概率事件必发生。
史锦顺 发表于 2014-3-15 16:09:31 | 显示全部楼层
本帖最后由 史锦顺 于 2014-3-15 16:19 编辑

谈测量误差,着眼点应该是误差范围,不能讲究误差元。

比较单次测量值的误差和平均值的误差,关键就是要讲究误差范围,而不能看误差元。人们用的是误差范围,比较也必须比较误差范围。平均值的标准随机误差,是σ(),σ()等于单值的σ的根号N分之一。

设测量仪器的系统误差范围为R(),多次测量,用贝塞尔公式算σ。单次测量,随机误差范围为3σ;而N次测量,平均值的随机误差范围为3σ()

甲测量一次,测量的误差范围是 R() = R()+ 3σ

乙测量N次,用平均值当测得值,测得值的误差范围是R(N)=R() + 3σ()

甲乙的系统误差相同。而乙的随机误差范围是甲的根号N分之一。

因此,精密测量要进行多次测量,取平均值,误差范围小。也就是准确度高。

-

还有一个问题是“误差元”这个量的特殊性。一般的量,要求量值确定得准确。上偏差与下偏差的不利影响,大致对称。误差元这个量与一般量不同,有个上限要求,可以小,而不能大。当误差元小于误差范围要求时,误差小虽然好,但好处不明显。而一旦误差大到一定程度,误差增大的害处,十分严重。因此,对称分布的随机误差与系统误差合成,单值误差元使总误差减小的那一侧,作用微弱,几乎不起实际作用;而单值误差元使总误差增大的另一侧,则可能影响严重。因此,不能等同地看待单次测量误差元在两侧的作用。

为说明误差范围概念的重要性,我写了“论误差范围”一文。是为本栏讨论而写的,但顾及太长,另发。供有兴趣网友参考。
   

 楼主| 都成 发表于 2014-3-16 17:18:09 | 显示全部楼层
史老在“再论误差范围”http://www.gfjl.org/thread-171680-1-1.html的2#最后得出结论如下:
结论:精密测量要进行多次测量。平均值的误差范围比单次测量的误差范围小。
请注意不是:平均值的误差比单次测量的误差小。
justas 发表于 2014-3-17 19:48:35 | 显示全部楼层
  在这一点上,我和史老师的观点完全一致。之所以鼓励检验人员多测量几次取平均值作为自己的测量结果,目 ...
规矩湾锦苑 发表于 2014-3-12 17:39



     同意,我们测量要联系概率论。尽管单次测量值有1%的可能比平均值离真值更近, 但平均值更能在人们可接受的概率上作为真值的 “”代表“”
ylxyjb 发表于 2014-3-17 19:54:40 | 显示全部楼层
就是要多讨论才能出结果啊
路云 发表于 2014-3-17 21:53:02 | 显示全部楼层

“平均值的误差范围比单次测量的误差范围小。”

平均值的误差可能落在的区间范围比单次测量的误差可能落在的区间范围小。”

以上两句话我不知道有何区别。感觉实质就是“平均值误差的不确定度比单次测量误差的不确定度小。”前者是n次测量的算术平均值的实验标准偏差,后者是n次测量结果中某个测得值的实验标准偏差。

规矩湾锦苑 发表于 2014-3-19 17:24:24 | 显示全部楼层
回复 13# 路云

      如果把平均值作为测量结果A,把单次测量的结果记为B,测量结果A的误差范围比测量结果B的误差范围小。
      正因为如此,说明了多次测量取平均值与单次测量直接获得测得值这两种测量方案的准确度前者高于后者,测量方案的误差范围前者小于后者,那么测量方法的误差范围给测量结果带来的不确定度势必前者小于后者。所以,我也赞成你说的“平均值误差的不确定度比单次测量误差的不确定度小”。
路云 发表于 2014-3-19 22:58:57 | 显示全部楼层
回复 14# 规矩湾锦苑
回复  路云

      ...正因为如此,说明了多次测量取平均值与单次测量直接获得测得值这两种测量方案的准确度前者高于后者,…
规矩湾锦苑 发表于 2014-3-18 21:24

不是准确度前者高于后者,而是可靠性前者高于后者。增加测量次数(增加自由度)的目的是为了提高可靠性,而不是提高准确性。 两者都经过系统误差的修正,后者某次的测量结果未必就不比前者准确。测10组,每组测10次取平均值,得到10个测量结果,与10个单次测量结果相比,后者的测量结果的离散程度远大于前者,这便验证了后者的可靠性差。
规矩湾锦苑 发表于 2014-3-20 10:46:00 | 显示全部楼层
回复 15# 路云

      你说的并没有错。
      对于测量方法(检定方法)而言,不确定度是指测量方法的可靠性或可信性,因此平均值为测量结果的测量方法与单次测量就出具测量结果的测量方法,两个“方法”相比,“可靠性前者高于后者”,测量方法增加测量次数的目的就是为了提高测量方法的可靠性,而不是提高测量方法的准确性。
      对于测量结果而言,人们更侧重于准确性的要求,要求测量结果尽可能趋近于被测量真值。因此就测量结果而言,多次测量取其平均值给出的测量结果和单次测量即给出的测量结果,两个“结果”相比,“准确度前者高于后者”。意思是平均值作为测量结果比单次测量给出的测量结果更贴近于被测量真值,误差更小,准确性更高。当然,如果说平均值这个测量结果的可靠性或可信性比单次测量结果更好也是对的,因为根据上面所说,即出具平均值为测量结果的测量“过程”比出具单次测量结果的测量“过程”可靠性和可信性高,从而也使它们各自的“产品”(测量结果)可靠性和可信性高。
路云 发表于 2014-3-21 06:46:04 | 显示全部楼层
回复 16# 规矩湾锦苑
人们期望测量结果趋于被测量真值,这句话没错。但测量误差包括系统误差和随机误差两部分,它是由两部分的代数和构成。n次测量取其平均值作为测量结果,它不是更趋于真值,而是更趋于数学期望(平均值的极限)。系统误差仍然存在,它是不可能靠增加测量次数来减小的。但是该法能够发现并给出具有适当不确定度的系统误差,从而对测量结果进行修正。而修正又是另外一种方法,它同样也适用于单次测量。随机误差是不能修正的。所以说,平均值法只能缩小随机误差的分布范围(即不确定度减小),使其随机误差更趋于零。随机误差是对称分布的,大于、小于、等于零的情况都有可能发生。单次测量结果的随机误差部分等于零也不是不可能。所以说,随机误差趋于零不代表测量结果趋于真值,“平均值更准确”的说法也就不成立。
规矩湾锦苑 发表于 2014-3-21 10:30:00 | 显示全部楼层
回复 17# 路云

      是的,测量误差包括系统误差和随机误差两部分。n次测量取其平均值作为测量结果,它不是更趋于真值,而是更趋于数学期望(平均值的极限),系统误差仍然存在,系统误差是不可能靠增加测量次数来减小的,但却能够发现并给出具有适当不确定度的系统误差,从而对测量结果进行修正。这些观点我们完全一致。
      重复性实验既可以得到单次测量也可以得到多次测量“估计出的”被测量真值分散性半宽,即既可以得到平均值作为测量结果的不确定度,也可以得到多次测量结果的不确定度。n次重复测量的平均值的不确定度是单次测量结果不确定度根号n分之一,因此平均值为测量结果比单次测量结果的不确定度小,可靠性和可信性高。
      对测量结果修正了系统误差后,随机误差将是剩余的主要测量误差,剩余的随机误差是不能修正的,这个观点我们也没有分歧。但正如你所说,平均值测量方法可以缩小随机误差的分布范围,使其随机误差比单次测量结果的随机误差更趋于零。那么修正了已知系统误差后仅剩随机误差的测量结果,虽然某个单次测量结果的随机误差等于零并不是不可能,但用统计学的观点来看,平均值作为测量结果和单次测量结果,这两种测量结果相比,既然平均值更趋近于被测量真值,其随机误差更趋于零,那么“平均值更准确”的说法也就还是成立的。人们常常用多次测量的平均值作为“约定真值”来评价单次测量结果的准确性,把单次测量结果减去平均值的差看作为单次测量结果的测量误差,就是基于这个道理。
路云 发表于 2014-3-22 09:19:08 | 显示全部楼层
本帖最后由 路云 于 2014-3-21 13:36 编辑

回复 18# 规矩湾锦苑

科学讲究的是严谨。对于您在16楼的描述:“对于测量结果而言,人们更侧重于准确性的要求,要求测量结果尽可能趋近于被测量真值。因此就测量结果而言,多次测量取其平均值给出的测量结果和单次测量即给出的测量结果,两个“结果”相比,“准确度前者高于后者”。意思是平均值作为测量结果比单次测量给出的测量结果更贴近于被测量真值,误差更小,准确性更高。”是忽略了系统误差的概念。“修正后的测量结果”与“测量结果”虽然就几字之差,但表达的意思完全不同。科学的描述不应随意省略限制性说明。测量结果中当系统误差大于随机误差起决定作用时,再怎么多次测量取平均值,都无法使测量结果接近真值。


您在18楼中的描述:“修正了已知系统误差后仅剩随机误差的测量结果,虽然某个单次测量结果的随机误差等于零并不是不可能,但用统计学的观点来看,平均值作为测量结果和单次测量结果,这两种测量结果相比,既然平均值更趋近于被测量真值,其随机误差更趋于零,那么“平均值更准确”的说法也就还是成立的。”从您的这段描述看,我个人觉得仍然有点概念混淆,是将“不确定度”与“随机误差”划了等号。随机误差更趋于零是基于不确定度小而得出的结论,表达的仍然是一个区间的概念,即前者的随机误差分布区域较后者窄。既然如此,那表达的意思就应该是可靠性(或可信性)的概念,而不是准确度的概念。不能得出“前者的误差就一定小于后者(或前者更准确)”的结论。甲、乙二人在同一时段,用同一设备在相同的环境条件下对同一被测量进行测量,甲采用多次测量取平均值的方法得到测量结果a,乙采用单次测量的方法得到测量结果b,如果两人的测量结果相同(ab),你能说“甲、乙二人的测量结果相同,甲的测量结果比乙的测量结果更准确”吗?显然是不成立的。相同的误差得出不同的准确度,显然不能自圆其说。衡量准确度高低的唯一指标是误差的绝对值(表示的是测量结果距真值的偏移量),而不是误差分布区间的宽窄(表示的是测量结果的离散程度,与真值无关)。误差分布区间的宽窄是衡量可靠性(或可信性)的指标,其表达方式有多种,不是唯一的,如:重复性、极差、实验标准偏差等。根据以上分析,我们只能说“甲、乙二人的测量结果相同,具有相同的准确度,甲的测量结果可靠性(或可信性)更高,乙的测量结果具有更大的不确定性(偶然性)”。人们的习惯思维往往容易走入误区,很容易在可靠性(可信性)与准确性之间划等号,也很容易在描述时将系统误差的影响忽略,将平均值与真值划等号。

规矩湾锦苑 发表于 2014-3-22 12:10:37 | 显示全部楼层
回复 19# 路云

      你的观点是正确的,我并无异议。我的意思不是要忽略系统误差,而是说已知系统误差在一般情况下都会被修正,而随机误差无法被修正,因此日常在讲到测量仪器或测量结果的准确性时,绝大多数情况都是指随机误差的大小。
      随机误差与不确定度是两个完全不同的概念,我和老兄的观点完全一致。虽然随机误差和不确定度都可以通过多次测量用贝塞尔公式求得,但做法的含义相差很大。
      计算随机误差是将多次测量作为一个测量方法,n是一个预先规定的测量次数,得到的标准偏差是在实施规定的n次测量下,任意一个单次测量结果的随机误差变化范围。
      评估不确定度是在测量次数n充分大,具体次数却不限的情况下对设计的测量方案进行重复性实验,得到的是所设计的这种测量方案的可靠性,这是对测量方案进行的科学实验而不是真正地对被测对象的测量。一旦测量方案的可靠性得到确认,测量方案才会实施。在实施该测量方案时,具体测量次数和实验次数大多数情况下并不相等,实施测量的次数可能是1次、2次,也可能是更多次。
      如果甲采用多次测量取平均值的方法得到测量结果a,乙采用单次测量的方法得到测量结果b,两人测量结果相同(a=b)。就可靠性和可信性而言,甲的不确定度是乙的不确定度除以根号测量次数,正如你所说,甲的方法和结果比乙的可信性或可靠性高。
      就准确性而言,同一个被测对象的真值是同一个,只能说甲、乙二人的测量结果误差相等,准确性相同。不过就统计学的观点来看,某个单次测量结果与平均值相等,准确性相同的巧合并不多见。一般情况下单次测量结果均以平均值为中心忽左忽右变化着,这个变化范围的半宽就是标准偏差。此时测量次数n是规定的,标准偏差代表着单次测量结果的随机误差变化范围半宽。随着测量次数的增加,这个随机误差的变化范围会收窄,因此就统计学的观点或宏观上来看,获得平均值的测量次数越多,平均值的准确性也越高,以平均值作为测量结果比单次测量结果准确性更高。
      因此说,平均值虽然并不是被测量真值,但因平均值比单次测量结果更趋近于被测量真值,人们又不能通过测量获得被测量真值,所以常常被人们“约定为”被测量真值来计算单次测量结果的误差。
路云 发表于 2014-3-22 23:56:52 | 显示全部楼层
回复 20# 规矩湾锦苑

“不过就统计学的观点来看,某个单次测量结果与平均值相等,准确性相同的巧合并不多见。”对于有限次的测量来说,单次测量的结果总是在均值附件左右波动。但是要知道,均值不是数学期望,它只是数学期望的估计值,同样也不是固定的,也是围绕着数学期望(以下简称“真值”)左右波动的,只不过均值的波动区间更窄而已。即便是两者不等(除了异常值),你也不能断定均值就一定比单值更接近真值,除非你进行了无限多次的测量。你只能说“均值接近真值的概率比单值大”,而真值是无法得到的(因为无法进行无穷多次测量)。对于有限次的测量来说,我们只能根据贝塞尔公式来估计这个真值可能落在的区间范围(即平均值的实验标准偏差),这个区间范围内的任意一点(无论是平均值还是单次测量值)都有可能是真值(因为不确定度的意义就是真值不能确定的区间半宽度),只不过平均值是真值的可能性比单次测量值是真值的可能性大而已,这与上文红字部分的意思是一致的,而不是你说的“平均值一定比单次测量值更接近真值”。

规矩湾锦苑 发表于 2014-3-23 00:30:10 | 显示全部楼层
回复 21# 路云

      你说的很对,也更确切一些。平均值虽然并不是被测量真值,但站在统计学或宏观角度来看,因平均值的波动区间更窄,均值接近真值的概率比单值大,即平均值比单次测量结果趋近于被测量真值可能性更大,这和我说的“就统计学的观点来看,某个单次测量结果与平均值相等,准确性相同的巧合并不多见”异曲同工。人们不能通过测量获得被测量真值,所以常常把平均值“约定”为被测量真值,用来计算单次测量结果的误差。
路云 发表于 2014-3-23 10:57:12 | 显示全部楼层
回复 22# 规矩湾锦苑

正是因为平均值与单值想比,前者的可靠性高于后者,人们才约定将修正后的均值作为“参考量值”(注:依据新版JJF1001-2011《通用计量术语及定义》第8.19条,“约定真值”以改称“参考量值”)。只要单值等于真值的概率不等于零,只要均值等于真值的概率不是百分之百,就不能下“均值一定比单值更准”的定论,只能用“更可靠”(或“更可信”)这样的术语来描述。如果一定要用准确性方面的术语来描述,那只能说:“均值比单值更准确的概率(或称可能性、把握性)大于单值比均值更准确的概率。”

规矩湾锦苑 发表于 2014-3-23 11:47:48 | 显示全部楼层
回复 23# 路云

      均值比单值“更可靠”(或“更可信”)一点都没有错,但如果要约定某个量值作为被测量真值(参考值),这个量值仅仅可靠和可信是不够的,作为“约定真值”(参考值)来说更重要的是对它接近理论真值的程度要求,即更侧重于对其准确性的要求。人们之所以约定将修正已知系统误差后的均值作为“参考量值”(真值),除了看重其可靠性或可信性优于单次测量结果外,更为重要的是因为就统计学和宏观的角度上更看重平均值比单次测量结果更接近于理论真值,更准确这个特性。
      当然,老兄解释为“均值比单值更准确的概率大于单值比均值更准确的概率”也并无不妥,老兄这句话的意思与“站在统计学和宏观的角度上看,平均值比单次测量结果更接近于理论真值,更准确”并无本质上的矛盾。因此,我认为我们的观点是完全相同的,只不过说法方式有点差异。
路云 发表于 2014-3-23 12:51:07 | 显示全部楼层
本帖最后由 路云 于 2014-3-22 17:27 编辑

既然仅仅可靠和可信是不够的,还要要求准确,那就分别用两个不同的指标来要求。前者可用不确定度、重复性、稳定性等指标来对测量结果的离散程度加以限定,这些指标都与真值无关,因此它们不具有评价准确程度的功能。后者可用最大允许误差范围来加以限定,这才是评价准确程度的唯一指标。我个人认为,我们不要总是将这些定量表征离散程度的指标与误差、准确度扯到一起,硬要将其赋予评价准确度的功能。


“均值比单值更准确的概率大于单值比均值更准确的概率”“站在统计学和宏观的角度上看,平均值比单次测量结果更接近于理论真值,更准确。”这两句话粗略看是没有本质区别,但细究起来却有着本质的区别。区别就在于前者表达的意思是一个概率事件,而后者表达的意思是肯定事件。我不赞成后一种说法,理由已在23楼中阐述,除非“平均值比单次测量结果更接近于理论真值”这一事件发生的概率为100%


既然两者都已进行了系统误差的修正,理论上来说准确度应该是一致的。两者的区别就只剩下量值分布区间的宽窄不同了,两者的分布区间的对称轴(理论真值)是重合一致的,从这一方面去比较,就只能比较出谁更可靠了,比较不出谁更准。如果要比较谁更准,那只能分别比较某个具体测量结果的随机误差(残差)的绝对值了。但由于真值不确定,所以两者的残差谁大谁小也就自然不能确定。所以只能用参考量值(真值的估计值)来计算各自残差绝对值的估计值了,在这种情况下无法保证每个均值残差的绝对值都小于每个单值残差的绝对值,故不能下“平均值比单次测量结果更接近于理论真值”的定论。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|计量论坛 ( 闽ICP备06005787号-1—304所 )
电话:0592-5613810 QQ:473647 微信:gfjlbbs闽公网安备 35020602000072号

GMT+8, 2025-6-23 01:33

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表