供应链从业者怎样通俗地理解和掌握《全面库存管理数学分析》-连载-3
第2章 正态分布与需求管理
程晓华
2021-12-18
关于本章的内容,请各位记住我在本章开头说的那句话:我个人的粗浅理解是,在样本足够大(样本数n>30)的情况下,在供应链管理实践中,所有数据的分布,如订单的需求量、采购提前期的长短等等,都可以简单地看成是正态分布。
正态分布通常被记为:X~N(μ,σ2), 其中,μ为平均值,σ为标准差,这里的X你可以理解为是不同时期的订单的需求量或不同物料的采购提前期或者同一物料其实际的采购提前期分布等。
那怎么样通俗地理解这个正态分布呢?
记住那个可爱的钟型曲线(S04)很重要。
首先我们需要搞清楚的是,所谓的分布是指一组数按照一定的范围分组,落在不同组中的数据的数量的分布,即统计学所说的频数(Frequency)。
符合正态分布的数据,其频数分布类似钟型,即大部分数据分布在平均值周围,然后,那些偏离平均值的数据(高于或低于平均值)沿着钟型曲线往两边分布,而且大概呈对称分布,并随着数值越来越偏离平均值,其频数急剧下降。
譬如说一组数X,它是有100个数据(x1~x100)组成,我们将其分成10组,0~10是第一组,11~20是第二组,以此类推,91~100是最后一组,第十组,然后看这100个数分别落在各个组中有多少。比较理想的分布就是我们刚提到的钟型分布,譬如说落在中间那组(这里定义第六组51~60为中间组)的数最多,有25个,其次是落在中间组前、后的第五组、第七组的数也比较多,譬如说各自是20,22,再然后是落在第四组、第八组的数也比较多……落在第一组及最后一组的数都比较少,各是一两个数,甚至是没有,这样,X轴是1,2,3,4,5,6,7,8,9,10,Y轴是落在以上对应各个组的数据数,你大概就可以画出一个歪歪扭扭的钟形曲线,你姑且就称其为“正态分布”吧。
因为你不是数学家,你是搞供应链管理的,所以,你不必要去较真说,你怎么证明这个歪歪扭扭的钟形曲线就是正态分布呢?
怎么证明是数学家的事情,怎么应用则是我们供应链管理人员的事情 – 尽管书中运用Excel提供了一种比较简单的思路来近似证明这个所谓的正态分布。
要想把正态分布应用到供应链管理中,我们还是要掌握几个起码的比较简单的统计学概念的。
第一个是方差(Variance)。
方差其实总体(X)中每个具体数据(x1~x100)与其平均值的“差”的“平方”的“和”的“平均值”。
我们还是用1,2,3,4,5这5个数来说明这些概念。
这5个数的和是15,平均值等于15/5=3,每个数都减3,我们就得到-2,-1,0,1,2,这就是上面提到的那个差,那么,其平方就是4,1,0,1,4,它们加起来就是10,这个10就是那个和,10再除以5=2,10除以4就是2.5。
我们通常会把这个2.5当成这组数1,2,3,4,5的方差,为啥呢?
简单地理解,统计学认为,这5个数的自由度是4,第五个数是有前四个数决定的。
当然,如果你非要说这个2才是这组数的方差,也不是不可以–你说是,它就是,为什么呢?
你认为这5个数就是“总体”而不是样本 – 在供应链管理实践中,我们的确是会经常遇到这种情况,那就是样本验证不足。
所以,在Excel里面,关于这5个数,你可以得到两个标准差,一个是STDEV.S(1,2,3,4,5)=1.58,另外一个是STDEV.P(1,2,3,4,5)=1.414,而1.58的平方就是2.5,或者说2.5的平方根就是1.58,1.414的平方就是2,对应的公式里面的.S代表这是样本(Sample),.P则是代表总体(Population)。
现在你又明白了第二个基本概念,即标准差就是方差的平方根。
学到这里,你其实已经掌握了统计学的两大基本工具(统计量),第一章你明白了平均值,第二章你知道了标准差,你手中起码是有了砖头(平均值,μ)和水泥(标准差,σ)了,咱不敢说搞个摩天大楼,但盖个小房子反正是没有问题了。
利用这两个工具再回过头去定义正态分布就好办多了:
所谓的正态分布X~N(μ,σ2)大概就是这样的:以平均值μ为中心,以标准差σ来分组,往右,μ+1σ为一组,μ+2σ为第二组,μ+3σ为第三组……往左,μ-1σ为一组,μ-2σ为第二组,μ-3σ为第三组……无论是100个数还是n个数,只要是有68%左右的数落在μ±1σ范围内,有95%左右的数落在μ±2σ范围内,有99%左右的数落在μ±3σ范围内……那这组数就基本符合正态分布。
但严格地讲,正态分布是有一个密度函数公式的,书中有讲,但你完全可以不用记住它,你只要知道有这么回事就行了 – 数学的所有定义、对象等都是有着严格的逻辑及公式描述的。
为了给后续的学习做一些知识储备,我们在第一章还导入了另外两个配套的概念,一个叫“协方差”,另一个叫“相关系数”,它们的关系类似“方差”与“标准差”。
如果说方差与标准差是用来描述一组数据自身偏离平均值的分布情况的,那么,协方差与相关系数则是用来描述两组数据间的相互偏离情况的,通俗地理解可以是两组数在变化的过程中是同方向的还是反方向的。
如果你感到协方差及相关系数的公式很难理解的话,你就不要去记它们,在供应链管理实践中,我们其实用到比较多的是相关系数,Excel的公式是CORREL(),把两个产品某一段时间的各期需求数量往公式里一套得到一个数,如果是正的,那就是正相关,数越大,越是相关,意味着这两个产品的需求趋势越是“很像”。
最后一个基本概念就是CV,变异系数,在供应链管理**们称之为需求波动率,即某段时间的需求标准差除以平均值,这也是我们在物料分类管理中做XYZ分类的时候用到的一个统计量。
在正态分布X~N(μ,σ2)的基础上还有个所谓的“标准正态分布”,这个所谓的“标准”就是μ=0,σ2=σ=1,即X~N(0,1)。
在后续章节中,我们提到的“标准化处理”的“标准”就是这个,具体来讲,标准化处理就是用一组数的每个变量Xi减掉平均值,再除以其标准差然后得到的新的一组数。
明白了以上道理,尤其是掌握了平均值和标准差的概念,我们就很容易理解供应链管理传统意义上的安全库存了。
前面提到:无论是100个数还是n个数,只要是有68%左右的数落在μ±1σ范围内,有95%左右的数落在μ±2σ范围内,有99%左右的数落在μ±3σ范围内……那这组数就符合正态分布。
如果我们把上述100个数理解成是某个客户或某款产品的100次需求的话,那么,我们的库存只要是等于平均需求+需求的3个标准差即可以满足99%以上的需求,这里的3σ就是我们所说的安全库存,而99%则可以理解为库存满足需求的次数,或者叫客户服务水平,就是我们讲的OTDD(满足客户原始需求的水平)。
那有人可能会举例说,假设平均需求是μ=100,需求标准差σ=50,则μ±3σ=100±3×50
-50~250,也就是说即使是负数也可能出现在平均值加减三个标准差的范围之内,而我们的需求,如客户下单或生产实际消耗则不可能是负数的,那我们在计算安全库存的时候,假设要求的客户服务水平也是99%,是不是就可以取1.5σ就可以了呢?
答案是“否”。
为什么呢?
从纯粹的数学角度,正态分布在μ=100,σ=50的时候,出现负数的累积概率百分比为NORM.DIST(0,100,50,1)=2.28%,也就是说,在当前条件下,出现负数的可能性本来就很小,根本不存在“一半是负数、一半是正数”的情况,从根本上讲除以2就是错误的;同样根据这个函数,如果取1.5σ,则累积概率百分比为NORM.DIST(175,100,50,1)=93.32%。
从供应链管理角度,我一直在讲的一句话就是“安全库存不安全”,相关论述大家可以参考拓展阅读一、二或者《制造业库存控制技巧》第四版或《制造业全面库存管理》。
拓展阅读之一“安全库存到底害死了多少人”直接讨论了为什么说安全库存不安全,而拓展阅读之二“我的书从来就没有教着你去怎么建立库存模型”则是进一步论述了“供应链管理不是纯粹的数学模型”这个观点。
本章的最后还简单地谈了另外几个分布,即:二项分布、泊松分布与指数分布。
二项分布只是个引子,平常跟我们关系不大,但对于泊松分布和指数分布,你可以记不住它们的公式,但你需要知道的是,泊松分布通常被用来描述随机事件在特定时间或空间内发生的次数,如每天我们接到客户订单的次数等,而指数分布则是往往用来描述客户下单的时间间隔等,也就是说,这两种分布是可以直接用于供应链管理仿真的研究的,具体的例子大家可以参考本书第七章的内容。
-
未完待续 –
作者程晓华(John Cheng),全面库存管理(TIM)咨询独立顾问,《制造业库存控制技术与策略》课程创始人、讲师,《制造业库存控制技巧》、《决战库存》、《制造业全面库存管理》、《全面库存管理数学分析(已上市)》著作者,邮箱:johnchengbj@126.com TIM订阅号:ITOOTD
【备注】《全面库存管理数学分析》已上市,京东、当当网等都已经可以预订,链接如下:
《全面库存管理数学分析》(程晓华)【摘要 书评 试读】- 京东图书
(jd.com)
《全面库存管理数学分析》(程晓华)【简介_书评_在线阅读】 -
当当图书
(dangdang.com)
发表于:
2021-12-18 17:41 阅读(135)
评论(0) 收藏 好文推荐
本博客所有内容,若无特殊声明,皆为博主原创作品,未经博主授权,任何人不得复制、转载、摘编等任何方式进行使用和传播。
作者该类其他博文:
网站相关博文: