供应链从业者怎样通俗地理解和掌握《全面库存管理数学分析》-连载-2
第一章 平均值很重要
程晓华
2021-12-4
本章的题目就是平均值很重要。
本章开篇就引用了凡客诚品的CEO陈年先生的话,“决定库存的,是销量的平均数,而不是最高销量”。
据说,这是“凡客用血的代价、牺牲了大把的库存与现金流之后,得到的真经:平均值很重要”。
平均值是我们在供应链管理中做到“心中有数”的第一步,它其实也是整个概率与数理统计的基础。
本书第二章的正态分布,其定义N(μ,σ2)其实也是基于平均值,这里的N是正态分布的英文单词Normal Distribution的第一个字母,μ被称为所谓的“数学期望”,其实它就是总体的平均值,而那个σ2则是方差,描述的是数据偏离平均值的“偏离程度”,σ2去掉右上角那个平方就是σ, 它就是总体的标准差,意思跟方差差不多,也是描述数据偏离平均值的分布情况的一个统计量。
简单理解就是,如果σ=0,总体的所有数据都距离平均值为0,那不就是一条直线了吗?
这是一种极端的情况,如本章及后续章节提到的某大学一年级3,000名男生的身高问题,书中举例说,抽样的35个男同学的身高均值为
=1.770,标准差s=0.182,如果这里的标准差是0的话,那就意味着这35个同学的身高是完全一样的,都正好是1.770米,那这35个身高数据的分布就是一条直线嘛!
但实际情况是,常识也告诉我们,这是不可能的嘛!
不要说35个人的身高不可能完全一样,即使是机械加工的35个“标准件”,如螺栓,我们机器的加工精度也不可能达到35根螺栓的高度完全一样,这样自然而然地就会产生所谓的数据分布了,而这些所谓的分布,不管是正态分布还是后面提到的T分布等等,其实都是围绕着平均值来谈的。
即使第3章讲到的切比雪夫不等式、马尔科夫不等式,它们其实也是围绕着平均值在说事;而大数定律则是干脆明说了,那个硬币抛来抛去的,落地是正反面的次数的平均值最终就是50%嘛!
所以,我们说平均值很重要,道理就在这里。
平均值就像一把衡量一切事物的尺子,不管你是不是“被平均了”,总之,如果你(的工资)达不到平均值,那就是个问题,因为你拖累了当地的平均收入水平,当然,如果超出平均值太多,如那些明星们的“工资”,“一爽”就是一个多亿,那可能也是个问题。
总之,既不要太少,也不要太多,“正好”最好。
但问题是,这个世界总是不完美的,总有些“异常的东西”存在,统计学称之为“异常值”。
为了公平起见,异常值的定义还不是基于平均值,因为平均值有个毛病,那就是“被平均”,为了解决这个问题,统计学发明了一个新的统计量叫“中位值”。
顾名思义,所谓的中位值就是,一组数值中处于中间位置的那个值,譬如说1,2,3,4,5,总共5个数,3就是那个中位值,而这5个数的平均值也恰好是3,即,本组数的平均值=中位值,这就是很好的分布了。但总有平均值不等于中位值的时候,甚至说,它们相等的时候往往很少的,也就是说,现实中,有异常才是正常的。
那么,这个所谓的异常值又是怎么定义的呢?
统计学上定义了一个东西叫“四分点”,通俗地理解就是以一组数中间的那个数为基准,把这些数分成4段5个点,分别用Q0,Q1,Q2,Q3,Q4来表示,Q2就是那个中位值,而Q3-Q1就是所谓的四分位距(IQR),这样,是否异常的标准就有了:Q2±1.5IQR,在这个范围内的就是“正常”,否则就是不正常,就是“反常”,那也就是异常了。
而“事出反常必有妖”,对那些所谓的异常值,我们就需要好好查查,看看它们到底是怎么回事。
如果结合着第二章的正态分布的知识来看这个所谓的异常,到底是超出平均值±1σ是异常还是超出平均值±2σ,甚至是超出平均值±3σ呢?
从我在本书举的例子来看,似乎是Q2±1.5IQR很接近平均值±1σ,但我其实并没有做过严格的论证,因为我不是数学家,只是从供应链管理角度,我更倾向于定义“超出平均值±1σ是异常”,为什么呢?
这个范围其实已经是把“大多数(正态分布情况下>68.2%的数据)”定义为正常了。
至于本章最后提到的移动平均,我相信都会做,我们可以这样来理解及应用这个概念或工具:
上述提到的平均值的概念其实是移动平均的极端情况,即,针对一组数,只做一次平均,体现在图形上那就是一根直线;如果你将这一组数分成n段分别做平均,你将得到一条曲线,而这条曲线可能就是我们想要掌握的“趋势”-极端地讲,一次平均得到的平均值本身就代表着一种趋势。
那个加上权重的α、β法从方法论角度讲是很有道理的–我更相信历史数据的话,我就给它权重高一点,你的预测不是太靠谱,但我又不得不信一些,那就给它权重低一些–其实,最终都是个心里安慰而已,高点也好,低点也罢,都不要太当真,预测就是预测,它永远都是错的,包括本书第六章提到的统计预测,你只要明白这个基本的道理就可以了。
本章的拓展阅读部分共采用了我平常写的5篇文章,看起来有些胡乱联系,甚至是包括后续章节的那些拓展阅读内容,都有类似的嫌疑,关键看你怎么理解:
平均值是所有数据分析的基本常识,包括平均订单量,平均采购提前期,平均库存等等,但问题就是,越是常识性的东西越是容易被忽视,越是常识性的东西越是难以普及–所谓“好公司”、“坏公司”,其差别主要就是看常识普及的程度怎么样,你不信你随机问一下你老板,某某客户的某某产品的周平均需求是多少?
估计他十有八九是回答不上来。
更不用说关于这个需求的标准差之类的问题了。
懂得常识的人往往会把复杂的问题简单化,而缺乏常识的人则正好相反,这就是“高手”与普通者的区别,这也是为什么我说,简单,简单,越简单越好。但是,我们看到各个企业的供应链管理现象又是什么呢?
复杂!极其复杂!本来是很简单的事情,他非要搞得很复杂不行,要么是为了显示自己的存在,不把事情搞复杂了不行,要么就是为了显示自己的无知,总之,简单的事情被弄得丰富多彩、乌七八糟的,结果就是一帮人,包括链条上的合作伙伴,都跟着受累。
拓展阅读之三“没有规矩不成方圆”则是有这么几个意思,类似文章结尾的几条:
第一, 供应链管理应该是最讲规矩(契约、合同、协议等)的,这是简单的常识;
第二, 规矩不能随便定;
第三, 用简单的方法可以无限逼近复杂问题的解决方案。
正因为如此,才有了拓展阅读之四:数学化归思想举例。
化归思想是数学这门科学的非常重要的思想之一,将A的问题通过一定的策略转化为B的问题去解决,而不是一根筋、钻牛角尖、认死理,这本身就是一种人生哲学,也是供应链管理的重要思想之一。
至于拓展阅读之五,“用垂直平均法计算MAPE”,其实谈的还是“平均值”的问题,只不过这里导入了一个新概念叫“动态平均”,如果说前面提到的平均值、移动平均是对一组数的横向平均的话,那么,这个动态平均则是指对一组数做垂直平均,这种方法在基于预测瀑布做分析、判断产品生命周期曲线的时候非常有用,至于那个最小二乘法及其推导过程,如果你理解不了,那也就算了,这并不影响你使用动态平均法分析数据,但从方法论的角度,最小二乘法其实是一种寻找回归曲线与数据分布之间最佳拟合程度的方法,其核心思想是回归曲线与各个数据点之间的距离平方和最小。
-
未完待续 –
作者程晓华(John Cheng),全面库存管理(TIM)咨询独立顾问,《制造业库存控制技术与策略》课程创始人、讲师,《制造业库存控制技巧》、《决战库存》、《制造业全面库存管理》、《全面库存管理数学分析(预计2021年12月中上市,正交付印刷,企业管理出版社)》著作者,邮箱:johnchengbj@126.com TIM订阅号:ITOOTD
发表于:
2021-12-04 08:37 阅读(134)
评论(0) 收藏 好文推荐
本博客所有内容,若无特殊声明,皆为博主原创作品,未经博主授权,任何人不得复制、转载、摘编等任何方式进行使用和传播。
作者该类其他博文:
网站相关博文: