程晓华
2024-2-3
R?还是Python?
这似乎是个问题。
针对这个问题,网上有很多讨论,但都是仁者见仁智者见智。
我这些年一直在用R语言,近半年来经不住诱惑,也抽空练习了一下Python。我的感觉是,对于供应链管理者来讲,R语言可能更适合我们。当然,如果你精力旺盛,时间充沛,觉得R练得差不多了,你再去练练Python也是个不错的选择。
功能角度,R主要是统计分析、数据挖掘、机器学习等,但Python除了这些还能实现其他很多功能,如办公自动化、大型项目编程、网络爬虫等等。大概是R有的功能,Python基本都有,但R在这些功能实现上可能更专业、更简洁、更简单一些。
我们做制造业供应链管理的通常所处理的数据主要都是来自ERP、CRM、SRM、MES等的记录。我们与所谓的大数据几乎没有什么关系,一般也不会去做什么大型数据挖掘项目,网络爬虫之类的东西好像跟我们也没有什么关系。
在数据处理方面,我们做的比较多的是些基础的描述性统计分析(Descriptive Data Analysis, DDA),如需求平均值、中位值、标准差、波动率之类的。这些东西在R里面可以实现,即使在Excel里面也可以轻松做到。
稍微复杂点的探索性数据分析(Exploratory Data Analysis, EDA )也就是些相关系数分析以及一般的统计检验之类的,如不同产品PLC(产品声明周期)曲线之间的相关性以及可视化等等。这些东西在Excel里面也能勉勉强强地做到,但R实现起来则是更容易一些。
在统计预测(Statistical
Forecasting)方面,简单的移动平均之类的可以在Excel实现,但稍微复杂点的指数平滑之类的,在Excel里的实现可能是比较困难的,但在R语言里面都有现成的实现手段,如Holter, Holter-Winters等。数据准备好了,在R里面实现这些统计预测就是几行代码的事儿。
至于供应链管理经常用到的分类,如物料分类、供应商、客户分类等,它们在R语言里叫聚类(Clustering),属于无监督学习;对于新的客户或供应商分类的判别分析,在R语言里面可以通过分类(Classification)方法实现,该方法也称有监督学习。另外,我们很多人都喜欢给人家“打分、排名次”,但我们打的分往往都是些主观的东西,而R语言则是可以提供一种简单的主成分分析(Principle Component
Analysis, PCA)方法使得你的打分、排名尽可能是客观的。Clustering,
Classification, PCA等在Excel里面实现应该是非常困难的,但在R语言里面也是几行代码的事情而已。
当然,不管是简单的描述性统计分析还是稍微复杂点的机器学习,要想掌握R语言工具并灵活应用到供应链管理日常工作中,你还是得复习一下大学时期学过的《概率与数理统计》《线性代数》《微积分》等基本知识,再明白点《多元统计学》可能就更好了。
我在这里并没有排斥Python的意思,相反,没事的时候我还是会经常玩一下Python,它与R会给你带来不一样的体验。但从供应链管理应用角度,我的建议是R,至少是建议你先学R。
作者程晓华(John Cheng),“全面库存管理(TIM)”咨询独立顾问、“制造业库存控制技术与策略”课程创始人、讲师,《制造业库存控制技巧》(第1、2、3、4版+经典版)《决战库存-制造业供应链管理小说(大陆及台湾版)》《制造业全面库存管理》《全面库存管理数学分析》著作者。
全面库存管理(TIM)文章订阅号:ITOOTD
Mail: johnchengbj@126.com
发表于:
2024-02-03 17:11 阅读(15)
评论(0) 收藏 好文推荐
本博客所有内容,若无特殊声明,皆为博主原创作品,未经博主授权,任何人不得复制、转载、摘编等任何方式进行使用和传播。
作者该类其他博文: