供应链从业者怎样通俗地理解和掌握《全面库存管理数学分析》-连载-6
第5章判别分析、聚类分析与主成分分析
程晓华
2021-1-9
第五章的内容对于很多人来讲有点难度,因为里面牵扯到一些线性代数及多元统计学的知识,同时还用到了“R语言”。但是,这里提到的三种分析方法的共同特点就是,让我们学会以定量的方法怎么样正确地区分似是而非的东西,同时,大家需要搞清楚的是,这也是供应链分类管理的数学理论基础。
你先不要被那些概念所吓倒。
首先,“矩阵(Matrix)”这个概念你应该不陌生,譬如说在我的书《制造业全面库存管理》里面,我们也多次提到过“供应链管理矩阵”的概念,还有“BOM矩阵”等等,过去打仗叫“排兵布阵”,其实是差不多的意思–方方正正的一个东西,只是线性代数里面矩阵是指“方方正正的一组数”。
这组数可以是一组人的身高、体重、肺活量等,也可以是一组方程的a、b、c、d系数。
而所谓的转置矩阵呢?
转而置之,类似Excel的选择性粘贴,转列为行,是为转置,如某个矩阵表达的是上述一组人的身高、体重、肺活量,第一列是身高,第二列是体重,第三列是肺活量,转置后就是,第一行是身高,第二行、第三行分别是体重和肺活量。
利用矩阵的数据计算欧式距离,这个大家都很熟悉,但对于欧式距离也存在着一个“标准化处理”的问题,即去掉量纲,否则计算结果也可能跟你感觉不一致,即所谓的“似是而非”。
但即使去掉量纲问题,欧式距离计算法还是不能去掉数据间的相关性问题,如身高与体重、肺活量之间是有相关性的,往往是身体高的人体重数也大–这个相关性问题也影响我们的判别分析。
于是统计学就导入了一个叫马氏距离的计算方法。
马氏距离与欧式距离的本质不同是提取了数据间的相关性信息并加以正交处理(逆矩阵)–这个相关性信息在统计学上用“协方差”或“相关系数”来表示,这些知识在本书第二章我们都学过的,而矩阵中协方差或相关系数的提取在Excel中的操作也是非常简单的;提取后将其整理成方方正正的矩阵格式。
然后将上述矩阵通过Wolfram Alpha或R语言求出其逆矩阵,再回到马氏距离的公式即可。
那前面讲了转置矩阵,这里又来了个逆矩阵,这是啥意思呢?
统计学的定义是A、B两个矩阵相乘,如果其结果等于一个单位矩阵,那么称A、B矩阵互逆。
如果你实在是不能理解这个“互逆”的意思也没有关系,你只要明白,通过这个逆矩阵的转换,数据间的相关性因素就被剔除了,类似通过标准化处理去掉量纲对距离计算的影响差不多。
还有,那个Wolfram Alpha或R语言看起来挺难的,其实玩起来很有意思,类似计算器,但如果你不想玩,也没有关系,你理解这个判别分析的思想精髓就可以了–通过标准化去量纲,通过协方差或相关系数的逆矩阵去掉相关性,这样得出的距离才是客观的,相当于把似是而非的一些因素统统地去掉,剩下的信息就是丁是丁,卯是卯。
我个人的这点数学常识告诉我,这可能就是数学的“精确性思维”在判别分析上的体现。
本章的第二部分内容为聚类分析。
统计学上的聚类分析是“人以群分物以类聚”的意思,其本身并不事先规定有多少个类别,而是根据一定的规则,不断地进行分类。
聚类分析本身没有什么高深的数学计算之类的,尽管在这里也可以用到“R语言”之类的,但这本身并不是最重要的,我个人感觉,我学习聚类分析的过程本身就是很有启发意义的–如果大家对计算过程不感兴趣,倒也没所谓,但你不妨体味一下我的整个学习过程。
在这里,我要再次感谢上海财经大学的王学民老师。
本章的第三部分为主成分分析。
主成分分析的主要思想是降维–减少评价的维度,其依据还是评价指标之间的相关性问题。
正因为不同的评价指标之间存在着相关性,把这种相关性信息以协方差或相关系数矩阵的形式提取出来(类似马氏距离计算),然后计算该矩阵的特征值及特征向量,以最大的特征值对应的特征向量来表达整个评价体系的主成分。
书中关于矩阵特征值及特征向量的统计学解释,一般的读者,尤其是文科类读者,可以直接忽略这部分的阅读和理解,但是,顾名思义、望文生义,你大概也应该清楚这是什么意思–把这个表示评价指标之间相关性信息的协方差或相关系数矩阵的特征找出来,并以特征来代替原先的评价体系,这个您总该明白吧?
类似“小瘪三”,一提到这个词,上海一带的人就会想到那些流氓、地痞、无赖及那些游手好闲的人,但“小瘪三”本身到底是啥意思呢?
没啥意思,小瘪三就是小瘪三,它只是代表一类人的共同特征而已,说白了也是一种“抽象”。
再通俗点理解就像是各种各样的啤酒,其主要成分其实都是水、麦芽糖、酒精等,只是,不同的啤酒其不同成分的%不同而已。
本章后面的拓展阅读看起来比较多,但我其实还有好几篇类似的文章没有放在这里,因为有滥竽充数的嫌疑,但是,结合着正文,你仔细想想:
-有多少人真正地理解库存问题与交付问题是一类问题?
-库存与交付是对立统一的?
在日常生活中,我们经常说某某某公司是“好公司”,那么,请问,您判别的依据是什么?公司的名气吗?
名气这个东西往往是最不靠谱的。
我个人的体会是,区分所谓的“好与坏”,有的时候,可能“感觉”会更靠谱一些,但是,光靠感觉的话,那可能会犯大错误
– 定性分析与定量分析的有机结合才是分析问题、解决问题的王道。
至于那个喝酒备不备库存的故事,真真假假,你看看或许能对您有所启发–做决策之前,先对事物、情况分分类或许是个不错的选择,就像我们的供应链管理为什么要对客户、供应商、物料分类一样。
第六篇拓展阅读谈是“照搬照抄”的问题,也是我这些年来的深切体会
,想必很多人都会有体会。
-
未完待续 –
作者程晓华(John Cheng),全面库存管理(TIM)咨询独立顾问,《制造业库存控制技术与策略》课程创始人、讲师,《制造业库存控制技巧》、《决战库存》、《制造业全面库存管理》、《全面库存管理数学分析(已上市,京东、当当网等均有售)》著作者,邮箱:johnchengbj@126.com TIM订阅号:ITOOTD
发表于:
2022-01-09 10:27 阅读(113)
评论(0) 收藏 好文推荐
本博客所有内容,若无特殊声明,皆为博主原创作品,未经博主授权,任何人不得复制、转载、摘编等任何方式进行使用和传播。
作者该类其他博文:
网站相关博文: