人类正处于一个数据爆炸的时代。首先,随着计算机硬件技术的迅速发展,信息存储的成本迅速降低,使得更大的数据可以更加方便地存储;其次,随着互联网带宽的快速提升,数据传输的数据越来越快,因此可以传输越来越多的数据;第三,随着智能手机的迅速普及,移动互联网应用得以迅速发展;第四,社交网络发展迅速,越来越多的人通过互联网进行交流和信息交互;第五,云计算应用的落地(Saas, Paas, Iaas),使得更多的应用程序,可以通过互联网来进行应用。
在这种背景下,大数据(Big Data)开始受到广泛关注。大数据的特点是4V:
1) Volume:数据体量巨大。从TB级别跃升到PB乃至EB级别。
2) Variety:数据类型繁多。网络日志、音频、视频、图片、地理位置信息等等多类型的数据对数据的处理能力提出了更高的要求。
3) Value:价值密度低。价值密度的高低与数据总量的大小成反比。例如在连续不间断的视频监控记录中,有价值的信息只有一两秒。
4) Velocity:处理速度快。这是大数据区分于传统数据挖掘最显著的特征。
大数据的存储、搜索和处理的方式将进行本质的改变,数据库的结构也将进行巨大的变化,例如列式存储的数据库,内存数据库也开始应用。国外已开始研究能够让用户轻松架构和使用海量数据的分布式计算平台,例如Hadoop。
制造业的整个价值链,制造业产品的整个生命周期都涉及到诸多的数据。制造企业的运营,越来越依赖IT,因此制造企业的数据也呈现出爆炸性增长的趋势。
制造企业需要管理的数据与信息种类范围繁多,涉及到大量非结构化的数据和多媒体数据:
1)产品数据:计算、设计、仿真、工艺、加工、试验、维护数据、产品结构、配置关系、变更记录等。随着三维造型技术、真三维渲染、虚拟现实技术的广泛应用,产品模型的数据量也迅速增大;而对产品进行多学科仿真分析,更是需要高性能计算环境来处理海量的数据。计算能力的迅速提升,使得工程师在产品性能仿真时,可以设定更细的有限元网格和更多的自由度,从而进行更加准确的仿真。这加速了产品数据量的“扩容”。
2)运营数据:组织结构、管理制度、人力资源、薪酬、福利、设备、营销、财务、质量、生产、采购、库存、标准/行业法规、知识产权、工作计划、市场推广、办公文档、媒体传播、电子商务等。例如,在市场推广方面,涉及到越来越多的多媒体数据,例如视频。
3)价值链数据:客户、供应商、合作伙伴、联系人、联络记录、合同、回款、客户满意度等。例如,在客户服务过程中,涉及到很多服务原始记录的保存。
4)外部数据:经济数据、政策信息、行业数据、竞争对手数据等。
随着互联网社区的发展,制造企业还需要考虑对互联网上相关的新闻、咨询、文章、博客、QQ群、微博、微信等信息传播媒介的信息进行监控,为企业的运营服务,及时规避风险。
目前,搜索引擎和微博,已开始提供数据分析的接口,从而使公众可以利用互联网上的海量数据,来分析有商业价值和科研价值的重要趋势。例如,Google通过对其服务器集群上的海量数据进行统计分析,使机器翻译达到实用水平;国外科研机构开始利用互联网分析全球范围内的基因样本中的基因缺损信息,来找到预防疾病的医学方法;有人利用Twitter上的微博对Facebook褒贬态度的变化,成功地预测其股价的走向,从而在股市上大有斩获;银行可以分析消费者信用卡消费的记录,分析出消费者的个人状态,从而进行定向营销等。
这些似乎看起来离制造企业还有些距离。但是如果说到互联网社区对企业的影响,已经可以举出很多实例。例如,当年三一重工向文波的博文,就阻击了徐工集团被国外机构并购;最近的一篇与塑化剂有关的博文,使茅台酒的股价受到很大影响,市值大大缩水。因此,在当今这样一个大数据的时代,制造企业也应当尽早开始研究大数据的管理与应用,使大数据“为我所用”,制定安全策略和灾备策略,实现大数据的“长治久安”。
发表于:
2012-12-16 19:33 阅读(8401)
评论(6) 收藏 好文推荐
本博客所有内容,若无特殊声明,皆为博主原创作品,未经博主授权,任何人不得复制、转载、摘编等任何方式进行使用和传播。
作者该类其他博文: