文章 - 212 评论 - 33 收藏 - 0 粉丝 - 11 访问量 - 239821

     如果离开建立数据分析模型谈大数据,就好比男人讲怀孕,都是务虚的理论概念!

     如何管控企业非结构化大数据,如何做到大数据能够服务企业,能够支撑企业经验决策? 我们提出时空建模——即“数据空间关系分析”方法论。任何一个行业的数据都逃不出这个“空间—时间”范畴,唯一不同的就是度量指标。我们针对每一行业设计分析出一个空间数据关系模型,只需要掌握理解每个行业的空间数据模型,就能做各行业的大数据分析。时间维度和空间维度(主数据)是两个比较独立的维度,没有交集和关联关系,一般是通过“度量”发生联系的。 下面我们谈一谈时空建模最重要的指标——度量。

 

      时间维度定义是数据标准化清洗时的标准规则,粒度设置一般视企业的管理深度。

      常见的时间维度定义:– 小时 – 日 – 班次(白班、夜班;三班倒) – 需要去关注的特定业务时间段(如:订单处理时间段,制造时间段,物流时间段等) – 周 – 半月 – 月 – 季度 – 半年 – 年

     对应时间维度的报表就有小时报表、日报表、月报表、季度报表、年报表

     空间维度是数据抽取、清洗转换时的过滤条件和标准规则。是主数据的维度,不同的企业主数据不一样。

     常见的主数据有

     – 产品相关(系列、型号、规格、物料、BOM)

     – 人员及组织相关(员工、供应商、客户、部门组织单元、分支机构、竞争对手)

     – 设备相关(生产线、设备/工位、车、船、飞机)

     – 地理位置相关(分公司、行政区域、河流水系、矿区、断面)

     – 数据分类(如食品类、药品类、轿车类、商用车类、工业类、IT类)

      度量指标一般与业务价值链上的业务阶段相关

      常见的度量指标有:“量”和“率”

      – 总量、分量、平均量、单位产出量、比例、比率(单位分量,贡献率、利润率、投资回报率、投入产出率)、增量、差距量、排名名次、对比量

      – 量是一个统计累加值,表明“多少”,一般业务系统中的记录都是反映这类指标,是由业务的流水量累加而成的

      – 率是一个效率值,表明单位时间、单位“主数据”的值(如人均产值,单位成本等),表明一个效率

     部分业务阶段度量指标举例

——————————————————

让企业IT更简单!

更多大数据详细内容请关注斯欧信息公众微信号

china-soa

发表于: 2014-12-18 17:03 阅读(701) 评论(0) 收藏 好文推荐

本博客所有内容,若无特殊声明,皆为博主原创作品,未经博主授权,任何人不得复制、转载、摘编等任何方式进行使用和传播。

作者该类其他博文: