供应链从业者怎样通俗地理解和掌握《全面库存管理数学分析》-连载-5
第4章假设检验与几个估计
程晓华
2022-1-2
如果再通俗一点,我们可以这样理解大数定律与中心极限定理:
大数定律谈的是样本的平均值无限逼近总体的均值问题,而中心极限定理则谈的是样本均值与总体均值的误差问题。
二者结合起来谈的就是,当样本越来越多的时候,样本均值逼近总体均值而其分布则是接近正态分布。
这个理论为实现样本推断总体奠定了基础,简单粗暴地理解就是,知道了样本的均值及其标准差,我们在一定信心的基础上就可以推断总体的均值及标准差。
譬如说本章中的例子,35个男生的身高数据均值
=1.770米,其标准差s=0.182米,我们企图通过这些数据推断总体,即全校男生的身高。
我们估计,全校男生平均身高也应该是1.770米左右,这是基于大数定律得出的结论,当然,如果我们的测量的样本数更多,譬如说这个1.770米是350个男生而不是35个的平均身高,我们认为全校男生的平均身高也是1.770米的信心就会更足。
但是,样本再多,这也是个样本,它不能完全代替总体,所以,我们需要在样本的均值基础上估计那个“左右”,即区间。
那么,这个区间值(可以理解为左右误差、公差)应该是多少呢?
这个区间由两部分组成,一个是你的信心,另一个就是与采取的样本数量及其标准差有关系。
毫无疑问,你的信心越大,你“左右”的范围就越大,反之越小,甚至是0,譬如说,你是否有信心相信全校男生的平均身高就是1.770米而没有任何偏差呢?
是,或者不是,50%的信心,OK,normsinv(50%)=0,此时样本标准差不起作用。
那90%的信心呢?
此时,你的信心系数为:normsinv(90%)=1.282
由于样本数为35,标准差为0.182,所以采用的标准差系数为:
0.182/SQRTT(35)=0.031
这两个系数相乘得到的结果0.0394就是“左、右”的幅度,即,我们在90%的信心下估计全校男生的身高应该在1.770-0.0394~1.770+0.0394
1.7306~1.8094之间。
你的信心越大,这个信心系数就越大,这个“左、右”幅度就越大。
这就是所谓的点估计(平均值)与区间估计(左、右公差)的通俗理解。
本章接下来的内容就是几个假设检验。
假设检验,又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起的还是由系统差别造成的统计推断方法。
所谓的抽样误差就是指随机误差,通俗地理解就是样本与样本、样本与总体之间的差异是随机产生的,并没有发生系统性的、本质的改变,再通俗点理解就是,这种差异不是你人为地努力的结果,是随着运气(抽样误差)而产生的;而系统误差则正好相反,它意味着这个差异是实实在在地发生了,是由于系统本身发生了本质性地变化而导致跟以前不一样了,譬如说生产线由于采用了新的生产工艺方法等导致每小时产出量的提升,这可能的确是你努力的结果。
假设检验的基本思想是“小概率事件”原理,即先假设新得到的样本S属于某个总体A,那么,S的特征与A的特征表现一致应该是大概率事件,但是通过构建统计量Z,如果我们发现这是个小概率事件,那么,我们就只能说S其实不属于总体A。
统计量Z包含了总体A的基本特征μ及σ,同时也含有样本S的基本特征
及样本数量n,它就是用来衡量样本是否属于总体的基本统计量。
如果S属于A,那么,这个Z统计量一般情况下应该是在3个标准差(σ)之内,否则就是“小概率事件”-尽管,习惯上,人们喜欢用95%作为置信度(CL),此时临界值是Z=normsdist(1-5%/2)=1.96,而对应3个西格玛的置信度为CL>99%。
Z检验与T检验的唯一区别就是,Z检验知道总体的标准差σ而T检验则是不知道这个σ,它是用样本S的标准差s代替,正因为如此,Z检验的置信度更高一些而T则是小一些,这也是符合人之常情的–就像供应链管理,你对客户的需求了解的越多,你判断的信心也就越是足一些,这是一个道理。
从实际应用角度,我觉得T检验可能用的更多一些,因为,通常情况下,我们其实是不知道那个传说中的总体A的标准差σ的。
与卡方检验(X2)有关的一个典型案例就是那个著名的“啤酒与尿布”的故事,这个理论理解起来很简单,但是它反映了大数据时代的一个“问题”–看起来是胡乱联系的东西,它们之间可能是有相关性(存在着较大的相关系数)的,而相关系数在供应链管理实践中是有着极其广泛的应用的,最简单直接的应用就是分析不同产品需求之间的相关性。
F检验的思想在体现“随机误差”还是“系统误差”方面表现的比较直观,它的基本意思是,如果两组数据之间的组间差异跟组内的差异相比较相差比较大,它就是系统误差,反之,则是随机误差。
如果你觉得F检验的计算过程比较复杂,你其实可以直接用Excel的单因素检验搞定这个过程。
本章的第三部分内容则是简单地谈了一下极大似然估计、贝叶斯后验概率及近似估计。
对于这三种估计,如果你认为与之相关的函数、公式难以理解的话,你可以这样去掌握它们的精髓:
“极大似然”听起来有点文言文的性质,其实从英语原文(Maximum Liklihood Estimation, MLE)直译就是“最大可能估计”。
MLE的基本思想就是,在一次实验中有x1, x2,
x3……xn等n个可能的结果,结果第一次试验,xi(1<=i<=n)事件就发生了,那么,我们认为xi极有可能是个大概率事件,即xi在所有可能的结果中出现的概率最大。对这个概念的解释,我们也是像大多数的教科书一样,都是用的红球、黑球的例子,很容易理解的。至于那个似然函数之类的,你要是觉得理解起来比较困难,那就不要去理解了–还是那句话,掌握数学公式、定理、定律背后的思想是个关键,而这个极大似然估计背后的基本思想,我个人认为还是“样本推断总体”。
即使如接下来的贝叶斯估计,也是样本推断总体的思想体现,只是它们的理论基础不一样,一个是概率论的经典学派,一个是所谓的贝叶斯学派。
经典学派认为被推断的那个概率φ是个确定的值,而贝叶斯学派则认为它只能是个随机变量,即φi,我们只能推断其分布,但随着事件的不断发生,我们对φi的认识就会不断深入、提升。
在本章中我们引用了北京师范大学赵楠教授在MOOC上的课件的例子来说明贝叶斯估计,并在此基础上做了适当的延伸。
贝叶斯后验概率的基本思想与供应链管理实践是一致的:
我们对客户、供应商、物流合作伙伴,甚至是对自己的产线的认识都是存在着这样的一个认识过程的,那些经常甩单的客户会被打入低优先级清单,那些经常交不上货的供应商有可能被逐渐淘汰。
所以,在供应链管理实践中,有人经常抱怨说,客户经常甩单,销售经常给我们“惊喜”,供应商经常交不上货……那该怎么办呢?
“经常”就不是“偶发事件,Surprise-令人吃惊的事情)”,如果你已经知道他们“经常”在干这些事情,但你还“经常”在抱怨这些事情,那这个问题到底是谁的呢?
本章最后一部分简单地谈了一下近似值与估计,关于这部分,你只要记住两点即可:
1.有些事情看起来没有头绪,无法估计,其实是可以大概估计的;
2.有些事情,本来是没有办法精确的,你非要弄个精确,那反而是不科学了。
另外,本章拓展阅读里面提到“很多公司的KPI都是假的”、“十分之九原则”,那也都是些“估计”。
-
未完待续 –
作者程晓华(John Cheng),全面库存管理(TIM)咨询独立顾问,《制造业库存控制技术与策略》课程创始人、讲师,《制造业库存控制技巧》、《决战库存》、《制造业全面库存管理》、《全面库存管理数学分析(已经上市,京东、当当网等都有售)》著作者,邮箱:johnchengbj@126.com TIM订阅号:ITOOTD
发表于:
2022-01-02 09:28 阅读(51)
评论(0) 收藏 好文推荐
本博客所有内容,若无特殊声明,皆为博主原创作品,未经博主授权,任何人不得复制、转载、摘编等任何方式进行使用和传播。
作者该类其他博文:
网站相关博文: