文章 - 212 评论 - 33 收藏 - 0 粉丝 - 12 访问量 - 237550


        如果离开建立数据分析模型谈大数据,就好比男人讲怀孕,都是务虚的理论概念!

       如何管控企业非结构化大数据,如何做到大数据能够服务企业,能够支撑企业经验决策? 我们提出时空建模——即“数据空间关系分析”方法论。任何一个行业的数据都逃不出这个“空间—时间”范畴,唯一不同的就是度量指标。我们针对每一行业设计分析出一个空间数据关系模型,只需要掌握理解每个行业的空间数据模型,就能做各行业的大数据分析。时间维度和空间维度(主数据)是两个比较独立的维度,没有交集和关联关系,一般是通过“度量”发生联系的。 下面我们谈一谈时空建模最重要的指标——度量。

                         

         时间维度定义是数据标准化清洗时的标准规则,粒度设置一般视企业的管理深度。

         常见的时间维度定义:– 小时 – 日 – 班次(白班、夜班;三班倒) – 需要去关注的特定业务时间段(如:订单处理时间段,制造时间段,物流时间段等) – 周 – 半月 – 月 – 季度 – 半年 – 年

                                                      对应时间维度的报表就有小时报表、日报表、月报表、季度报表、年报表

                                                           

         空间维度是数据抽取、清洗转换时的过滤条件和标准规则。是主数据的维度,不同的企业主数据不一样。

常见的主数据有

        – 产品相关(系列、型号、规格、物料、BOM)

        – 人员及组织相关(员工、供应商、客户、部门组织单元、分支机构、竞争对手)

        – 设备相关(生产线、设备/工位、车、船、飞机)

        – 地理位置相关(分公司、行政区域、河流水系、矿区、断面)

        – 数据分类(如食品类、药品类、轿车类、商用车类、工业类、IT类)

                                                              

         度量指标一般与业务价值链上的业务阶段相关,常见的度量指标有:“量”和“率”

        – 总量、分量、平均量、单位产出量、比例、比率(单位分量,贡献率、利润率、投资回报率、投入产出率)、增量、差距量、排名名次、对比量

        – 量是一个统计累加值,表明“多少”,一般业务系统中的记录都是反映这类指标,是由业务的流水量累加而成的

        – 率是一个效率值,表明单位时间、单位“主数据”的值(如人均产值,单位成本等),表明一个效率

                                                                                          部分业务阶段度量指标举例

                                 


更多详情请关注:www.china-soa.com


发表于: 2014-12-22 16:05 阅读(448) 评论(0) 收藏 好文推荐

发表评论(网友发言只代表个人观点,不代表本网站观点或立场。)

您尚未登录,请先【登录或注册