计量论坛

 找回密码
 成为会员

QQ登录

只需一步,快速开始

搜索
查看: 6417|回复: 16

[概念] 请问最小二乘法的标准试验差中为何有b^2Sx^2一项

[复制链接]
发表于 2017-4-14 14:15:52 | 显示全部楼层 |阅读模式

立刻注册计量论坛 交流工作中的点滴

您需要 登录 才可以下载或查看,没有账号?成为会员

x
本帖最后由 solarup 于 2017-4-14 14:52 编辑

据一级计量注册师基础知识和事务一书,最小二乘法如果要拟合直线方程y=a+bx,其标准试验差平方为
sp2(yj)=sa2+xj2sb2+b2sx2+2xjr(a,b)sasb
这个公式我的直观反映使用的是不确定度传播率公式。
因为要拟合直线y=a+bx,应该不同的xj有不同的实验标准偏差,xj是已知量,a和b是未知量,所以式中标准差或者协方差都是a和b的,这些我能理解。
但是对a求偏导为1,则a的偏导乘以其实验标准偏差平方为右边第一项sa2,对b求偏导应该看作a和xj为常数,那么乘以其实验标准偏差平方后应该是右边第二项xj2sb2,那么请问右边第三项b2sx2何来?
如果需要这一项,根据导数公式,那么b和x应该都是一个因变量,但是为何第四项又直接对b求偏导而没xj的事情?
我实在想不明白了,请大家给我指点。谢谢
ps:a和b相关么?我不知道,但是我觉得可能相关,所以这里要考虑其相关性,现实生活中可能相关,也可能不相关。因为a是截距,b是斜率,斜率不同,一个模型截距也不同的情景还是有的。会有相反例子么?不知道这个理解是否正确?
ps:我又想了想,是不是我被不确定度传播率公式套住了,其实这里并非一定要按照不确定度传播率公式计算,而是需要考虑一个sx,所以才有这么一项。但是,为什么公式是这个样子?实验标准偏差公式不是贝塞尔公式么(这更不是极差较差公式吧)?这个公式怎么看都不是直接贝塞尔公式推导出来的,而是根据不确定度传播率公式反推来的吧。因为需要考虑xj重复性引入的不确定度,所以加了这个,不知道这样想对么?

补充内容 (2017-4-14 17:10):

文中r(a,b)是相关系数的估计值,手残打成了协方差,两个都是表示相关性的。不过当时确实写错了。
发表于 2017-4-17 10:07:09 | 显示全部楼层
本帖最后由 吴下阿蒙 于 2017-4-17 10:17 编辑

从标准试验差平方表达式来看
是将yj=a+bxj中a,b,xj做为三个未知量来看的,且a和b相关,xj和a,b都不相关。前三个平方和就是三个未知量标准差平方乘以它们的灵敏系数的平方,最后的交叉量是a和b相关的交叉量,xj和a,b都不相关,无交叉量。
理解的话,a和b都是由总数据根据最小二乘法计算得出的,有相关性是应该的。。xj为啥做为未知量表示不知道。。。我只是从表达式看出来的,表达式含义应该就是上面说的,但为啥这样,还得求大神解答。。

PS:不确定度传播公式貌似也不是自创的吧?好像也有来源,我好像在史老的文章中看到过,一个很泛用的公式。
 楼主| 发表于 2017-4-17 16:34:55 | 显示全部楼层
吴下阿蒙 发表于 2017-4-17 10:07
从标准试验差平方表达式来看
是将yj=a+bxj中a,b,xj做为三个未知量来看的,且a和b相关,xj和a,b都不相关 ...

不对吧,这个明显不是把xj当作未知量了。你看后面的协方差前面的系数,明显没有xj什么是,里面的xj是对b的常量来着。
而且根据最小二乘法的意思,就是知道离散点(xj)去拟合一个不知道的
发表于 2017-4-17 17:18:45 | 显示全部楼层
本帖最后由 吴下阿蒙 于 2017-4-17 17:20 编辑
solarup 发表于 2017-4-17 16:34
不对吧,这个明显不是把x当作未知量了。你看后面的协方差前面的系数,明显没有x什么是,里面的x是对b的常 ...


把这个3个都当未知量,然后把所有的交叉项都列出来,然后另xj和a相关性为0,xj和b的相关性为0,2xjr(a,b)sasb 就是a和
b的交叉项,其中a的灵敏系数为1,b的灵敏系数为xj,相关系数为r(a,b)。虽然不知道为啥这样,但题中式子这么理解感觉最合适吧。。
 楼主| 发表于 2017-4-17 17:27:43 | 显示全部楼层
吴下阿蒙 发表于 2017-4-17 17:18
把这个3个都当未知量,然后把所有的交叉项都列出来,然后另xj和a相关性为0,xj和b的相关性为0,2xjr(a,b) ...

我的意思就是这样,如果真的xj当作未知了,那么第三项应该还应该乘以一个b才对吧。
所以我在Ps里面写怀疑xj根本就不是因为当作未知量了,而是因为这个式子本身是不确定度的式子,用不确定度去说实验标准偏差,而不确定度中不得不考虑xj本身引入的不确定度分量,而这个分量的不确定度为bSx.所以才有这一项。
发表于 2017-4-17 17:30:50 | 显示全部楼层
本帖最后由 吴下阿蒙 于 2017-4-17 17:37 编辑
solarup 发表于 2017-4-17 17:27
我的意思就是这样,如果真的x当作未知了,那么第三项应该还应该乘以一个b才对吧。
所以我在Ps里面写怀疑x ...


第三项是这b2sx2项嘛?这项xj的灵敏系数是b,灵敏系数的平方乘以sx的平方,没毛病啊???还要再乘个b?

本人不确定度入门不久,刚看到非线性函数时不确定度评定的一些方案,其中Y=A*B ,其中A和B都是未知量时,大概和题中后面bxj类似,可以参考。
 楼主| 发表于 2017-4-17 19:33:44 | 显示全部楼层
吴下阿蒙 发表于 2017-4-17 17:30
第三项是这b2sx2项嘛?这项xj的灵敏系数是b,灵敏系数的平方乘以sx的平方,没毛病啊???还要再乘个b?
...

你误会了,是我没说清
我说的是,如果算实验标准差,不需要算灵明度系数,也不需要进行偏导数计算
但是这里是从不确定度传播率公式来的,按照其公式,右侧的第三项是要对偏导数进行乘积的,相当于这个实验标准差式子右侧第四项
但是从这个实验标准差式子的右侧第四项来看,只有a的偏导数1和b的偏导数xj相乘,没有出现xj的偏导数系数b,所以我说岂不矛盾?
发表于 2017-4-18 09:26:16 | 显示全部楼层
本帖最后由 吴下阿蒙 于 2017-4-18 09:59 编辑
solarup 发表于 2017-4-17 19:33
你误会了,是我没说清
我说的是,如果算实验标准差,不需要算灵明度系数,也不需要进行偏导数计算
但是这 ...


根据不确定度传播公式,a和b的交叉项只包含:a的偏导数1,b的偏导数xj,a和b的相关系数r(a,b),并不包含xj的偏导数b的吧。完成展开的交叉项系数应该是:a和b的交叉项系数2xjr(a,b),a和xj的交叉项系数2br(a,xj),b和xj的交叉项系数xjbr(b,xj)。如果另后两个相关系数为0,就是主楼的公式吧=。=我对不确定度传播公式理解有误?
3451221.bmp
 楼主| 发表于 2017-4-18 10:01:14 | 显示全部楼层
本帖最后由 solarup 于 2017-4-18 10:02 编辑
吴下阿蒙 发表于 2017-4-18 09:26
根据不确定度传播公司,a和b的交叉项只包含:a的灵敏系数1,b的灵敏系数xj,a和b的相关系数r(a,b),并 ...


我的意思是,既然标准偏差公式前三项表明,xj是一个未知量(输入量),那么选用传播率公式的时候,xj相当于其中一个输入量了。按照不确定度传播率公式,应该考虑xj和a与b的相关性,计算其相关系数,除非他们之间不存在相关性。,协方差为0。
a和b一个是截距,一个是斜率。a我不知道,b作为斜率肯定是和xj相关的吧,怎么可能会是0呢(b值要由xj值得出呢)。可是这里第三项只有计算了a和b的相关性,计算偏导的时候应该既计算xj的偏导,又计算b的偏导,但是这里的相乘结果不是这样。
发表于 2017-4-18 10:18:16 | 显示全部楼层
本帖最后由 吴下阿蒙 于 2017-4-18 10:27 编辑
solarup 发表于 2017-4-18 10:01
我的意思是,既然标准偏差公式前三项表明,x是一个未知量(输入量),那么选用传播率公式的时候,xj相当 ...


这就不清楚,我只是根据你给出的公式来理解的。如果这个给出的公式没问题,那么结论就是:a,b,xj都是未知量,且xj和a,b都不相关。至于为什么,我表示看不懂,抱歉=。=!标准差也能这样算??不过楼主,您可以自己模拟个数据试一试,r(xj,a)和r(xj,b)可以根据相关系数公式算出来=。=!请问能找到这个传播公式的出处嘛?为啥标准差,不确定度的传播都能用这个。。。
 楼主| 发表于 2017-4-18 10:24:09 | 显示全部楼层
吴下阿蒙 发表于 2017-4-18 10:18
这就不清楚,我只是根据你给出的公式来理解的。如果这个给出的公式没问题,那么结论就是:a,b,xj都是未 ...

我的个人理解:当我们的测量模型大多是理论值的时候,我们没什么可以搞B类评定的了。没说明书,没资料,没不确定度,啥都没有,而剩下的A类就是重复性,重复性就是实验标准差,于是乎这么来的。
说实话我就是找不到出处啊!但是怎么看这个就是不确定度传播率公式吧。
其实我觉得按最小二乘法的思想来说,xj绝对不是输入量,是已知量,求直线不就是求a和b么。
发表于 2017-4-18 10:44:31 | 显示全部楼层
solarup 发表于 2017-4-18 10:24
我的个人理解:当我们的测量模型大多是理论值的时候,我们没什么可以搞B类评定的了。没说明书,没资料, ...

按公式看,xj存在sx,说明这个xj肯定不是单值,应该是一组值的平均值。样本可能是这样的的x1为5个数的平均值,x2为5个数的均值,x10为5个数的均值。然后x1~x10对应10个y1~y10,根据这个对应关系,使用最小二乘法,求出a和b,得y=a+bx。如此当不确定分析的话,yj=a+bxj,xj确实会引入一个重复性分量=。=!但xj和a,b好像是相关的?弱相关,忽略不计?。。。。我怎么感觉想偏了。。

 楼主| 发表于 2017-4-18 12:05:14 | 显示全部楼层
吴下阿蒙 发表于 2017-4-18 10:44
按公式看,xj存在sx,说明这个xj肯定不是单值,应该是一组值的平均值。样本可能是这样的的x1为5个数的平 ...

为啥咱两个理解的xj不一样?难道我理解的是假的最小二乘法?先吃饭去,回来再研究。
发表于 2017-4-19 09:13:21 | 显示全部楼层
本帖最后由 吴下阿蒙 于 2017-4-19 09:16 编辑
solarup 发表于 2017-4-18 10:24
我的个人理解:当我们的测量模型大多是理论值的时候,我们没什么可以搞B类评定的了。没说明书,没资料, ...


说实话我就是找不到出处啊!但是怎么看这个就是不确定度传播率公式吧。,向量和的三角形法则?模型基本一样,角度正余弦和相关系数一样是正负1。。
 楼主| 发表于 2017-4-20 13:05:41 | 显示全部楼层
吴下阿蒙 发表于 2017-4-19 09:13
说实话我就是找不到出处啊!但是怎么看这个就是不确定度传播率公式吧。,向量和的三角形法则 ...

请教,这里相关系数正负1有什么关系么?
嗯,我知道好像相关系数只是牵扯到合成不确定度不是方和根,而是不确定度求和。
不过相关系数是1协方差不见得是1吧?恕我鲁愚,没搞明白。
 楼主| 发表于 2017-4-20 13:11:22 | 显示全部楼层
吴下阿蒙 发表于 2017-4-18 10:44
按公式看,xj存在sx,说明这个xj肯定不是单值,应该是一组值的平均值。样本可能是这样的的x1为5个数的平 ...

我觉得如果按照这样看,y=a+bx的话,为什么是弱相关?应该是强相关吧。b是斜率,就是b=y/sqrt(x2+y2),x增大不是b减小么?这不是负强相关?而且上面你说是正负1,那么就是相关的意思,还是强相关。对,就是三角公式。
发表于 2017-4-20 17:39:11 | 显示全部楼层
solarup 发表于 2017-4-20 13:11
我觉得如果按照这样看,y=a+bx的话,为什么是弱相关?应该是强相关吧。b是斜率,就是b=y/sqrt(x+y),x增 ...

我只是基于公式的推测,也不是很理解。我说的正负1,是说它们的上下限都是正负1,和向量求和相似。。
您需要登录后才可以回帖 登录 | 成为会员

本版积分规则

小黑屋|手机版|Archiver|计量论坛 ( 闽ICP备06005787号-1—304所 )
电话:0592-5613810 QQ:473647 微信:gfjlbbs闽公网安备 35020602000072号

GMT+8, 2024-4-27 00:00 , Processed in 0.056242 second(s), 31 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表