说到SAP HANA有点惭愧,一直知道他的内存计算能力很强大,但是“知其然”而不知道其“所以然”,毕竟不是做技术出身的,所以对技术的东西多少欠缺兴趣。本次因为工作的需要,认真的深入的了解了一下HANA,心得就不说了,说出来挺逗人笑话的,所以我只能说和我之前意识里的完全不是一个意思,或许大家也曾经有和我一样的困惑,搜集的一些资料和大家分享一下,共同学习。
HANA是什么
HANA是一个软硬件结合体,提供高性能的数据查询功能,用户可以直接对大量实时业务数据进行查询和分析,而不需要对业务数据进行建模、聚合等。用户拿到的是一个装有预配置软件的设备。至于HANA的云服务,只是对用户而言可以在不购买相关硬件的情况下享受HANA的高性能,而HANA云服务的背后还是需要更高性能的硬件支撑的。
软件方面,HANA的内存数据库(SAP In-Memory Database, IMDB)是其重要组成部分,包括数据库服务器(In-Memory Database Server)、建模工具(Studio)和客户端工具(ODBO、JDBC、ODBC、SQLDBC等)。HANA的计算引擎(Computing Engine)是其核心,负责解析并处理对大量数据的各类CRUDQ操作,支持SQL和MDX语句、SAP和non-SAP数据。比较显而易见的一点是,HANA计算引擎要快速处理用户复杂的查询请求,快速返回查询结果。
SAP内存数据库的数据并不是只在内存里,也会不停写到硬盘里,这就用到复制服务器Replication Server,包括Log-based,Trigger-based和ETL-based。这些复制服务器需要用到Sybase Replication Server、Sybase Replication Server Agent、Sybase Adaptive Server EntERPrise (AES,适用***器)等,以及HANA Load Controller和BO Data Services。
操作系统方面,HANA目前只能运行在Suse Linux企业版(SLES)上。
硬件方面,SAP和多个硬件厂商合作生产支持HANA的高性能服务器,包括Dell R910、Fujitsu、HP DL580、IBM x3850等,以及和Cisco(Cisco Unified Computing System. UCS)等公司的合作。直观地说,这些机器的硬盘可能是数个600GB、转速10k rpm的硬盘组成RAID,内存可能有1T,文件系统可能是ext3或GPFS(IBM通用并行文件系统,General Parallel File System)。
和HANA类似,Oracle的Exadata也是一个预配置的软硬件结合体,提供高性能的数据读写操作。Exadata机器由Exadata数据库机器、Exadata数据库服务器、Exadata存储服务器以及高速网络接口等组成。InfiniBand端口的传输速度可以达到40Gb/秒。
HANA的快在于用大内存提供内存数据库,并在内存数据库里采用列式存储从而可以将更多的数据装进内存(列式存储更适合数据压缩)。
Exadata的快在于把大部分数据库操作push到硬件,通过高性能硬件提高数据查询速度,通过采用列式结构减少需要在存储和内存间移动的数据量,通过高速网络接口提供数据传输的效率。
HANA能做什么
HANA不是一个数据仓库,而是一个平台,在这个平台之上用户可以构建数据仓库或集市、报表和仪表盘等。
HANA能做的,首先是作为内存数据库,提供数据插入、修改和高效的查询功能。
其次,作为一个平台,在HANA之上,BO报表系统可以提供更好的用户体验——用户几乎不需要等待数据返回。
用户可以使用HANA的建模工具直接访问ECC或其它数据源,避开BW。但也可以在HANA之上建BW,把BW那些性能问题交给HANA解决。
什么是HANA?
High-Performance Analytic Appliance ,高性能分析应用,简称HANA,目前为SAP独有技术。HANA的核心是“内存计算(In-Memory Computing)”技术,其被看做海量数据实时处理的高速公路。
从计算存储技术的角度看,由于服务器在处理数据时,CPU首先会从其缓存中找数据,缓存中找不到,再从内存中找,内存里没有,再从硬盘上读取。在传统数据库查询中,磁盘访问时间是一个主要的瓶颈。研究发现,如果让查询在读写速度快很多倍的内存中进行,而不用访问物理磁盘,将会大大提升处理性能。所谓“内存计算”,实质上就是CPU直接从内存而不是硬盘上读取数据,进行计算、分析,是对传统数据处理方式的一种加速。内存计算非常适合处理海量的数据,以及需要实时获得结果的数据,比如可以将一个企业近十年几乎所有的财务、营销、市场等各方面的数据一次性地保存在内存里,并在此基础上进行数据的分析。当企业需要做快速的账务分析,或要对市场进行分析时,内存计算就能够快速的按照需求完成。
由此可见,HANA与硬件系统关系密切。由于HANA采用整合的方法和新型编程范式,并且简化了现有计算层次,使得应用软件可以直接受益于硬件性能的改进。SAP CTO Vishal Sikka曾接受采访表示,SAP的HANA平台仅建立在英特尔的X86架构上,而且只沿着至强这条线走,HANA在至强上做了大量的性能优化。而在市场开拓层面,SAP也将与IBM、惠普、思科、富士通、戴尔等服务器厂商合作,直接面向用户推广。
SAP解决方案和架构部总经理张志琦说,HANA具有两大特性:
•加速数据访问。传统数据库磁盘读取5毫秒,内存数据库磁盘读5纳秒,速度提升100万倍。可以利用内存高速的性能,更快速的获取数据、汇总数据、分析数据。
•大规模数据的分而治之。通过分而治之的方式将动态的服务器分到不同的节点上,快速的进行数据分散计算、数据分散汇总、获取更快速的结果。
HANA的架构
最下层是SAP ECC、BW及其它非SAP数据源,通过Data Services和Modeling Studio把数据导入HANA,通过Replication Services写到磁盘,,通过HANA计算引擎处理数据插入和查询等操作。HANA是一个平台,在这个平台之上可以是BO、BW,以及其它产品。
HANA的价格
了解到的信息就是Hasso说HANA can run an entire company on a box comparable to a Mac mini,大概是几千美元到几万美元。应当比几百万美元的Oracle Exadata便宜。
借助主存储器、处理器技术和应用诀窍领域的最新成果,SAP HANA充分发挥内存数据处理的威力,使分析应用软件获得了前所未有的效能,并由此开启了一个全新的应用软件类别——高性能分析应用软件。2010年12月,SAP HANA横空出世,它的每一个进步都给业界带来更多的想象力,那么何为HANA?HANA能做什么?HANA未来走向何方?
HANA能做什么?
SAP HANA为构建新一代创新应用提供了坚实基础,使用户能够实时地分析来自几乎任何数据源的大数据量,企业管理者可以实时模拟相关业务场景,快速分析复杂数据关系并审视被建议的组织结构调整对企业业务产生的影响。
HANA应用案例
•SAP HANA用于强大的销售数据分析案例
一家体育用品零售商,在全球有大量不同品类的零售产品销售,系统中积累了四年的零售数据,大约32亿条,需要加载到HANA环境中进行分析。目标是希望能够在48小时内实现货架的周转,即要分析出哪些产品卖得好,并且不使其缺货。运用一台装备了512GB内存的HANA服务器,来支持整个运算分析过程,在小于1秒时间内完成数据分析。现场演示结果显示,在系统中装载了32亿条记录,装载时间是0.036秒,
在此基础上再进一步分析更多详细的信息,了解企业业务中间的一些实际的状况。在整个系统中,包括品类、小类、商店信息,以及商品编号,甚至某个商品是何时销售的都会显示。接下来把目标聚焦在某一年,系统会自动导航到基于不同品类的商品的细节性销售信息,演示结果显示系统从三亿条记录中间动态筛选出八千万条记录,并且完成品类汇总后的信息共花费的时间是0.031秒。这只是企业内部中间的一个环境,在SAP为某公司做的原型设计项目中,通过十台刀片服务器,装载了超过4600亿条数据,在这些数据中间的响应时间也都是小于一秒,并且整个报表的质量提高了3600倍,同时可以帮助这家公司将它的平均收入提升21%。通过HANA的运用,这家公司可以完全改变市场中间的游戏规则,变成一家永远不缺货的快速消费品公司。
•SAP HANA帮助制造企业实现精益制造案例
一家汽车制造企业,它的基本情况是有五款车在市场中进行销售,有几条组装线、几条配件生产线,还有存放配件的仓储。企业面对的问题是如何平衡生产使得利润最大化或者市场占有率最大化?HANA可以帮助企业过去的信息模拟客户的需求,按照这些需求来进行产能计划的编排。
一共有五款汽车进行销售,每款汽车都有一个相对较为简化的生产流程,基于这样一个简化的生产流程,可以看到在汽车中间有不同的配件的信息,还有仓库,在仓库中间,不同的配件还有不同的库存。此外,在配件生产线中,还有四条不同的组装线,二十多个提供配件的供应商。
基于市场的需求,进行一些需求的预测分析。利用HANA技术,可以将上一年一整年的销售情况进行一个模拟演算,来算出下一周每一天需要生产车辆的市场的需求情况。接下来要完成的就是进一步的系统化排程。很多企业都在困惑,每次运行MRP,基于整个生产流程,基于整个供货流程,会有一个相当复杂的计算过程,所以每一次MRP运算都要花费很长时间。通过HANA技术,可以将MRP计算的方式,以利润最大化的方式来实现,在系统中按下排程按纽之后,在短短4秒之内,HANA将分析超过十万种不同生产的组合,从中找出最优化的结果。可以基于市场的需求,分析出每一款车辆应该生产多少。
企业也可以按照本身实际的需求来进行分析运算,如果不希望能够达到利润和市场占有率的平衡,即产量最大化的有效平衡,可以按下平衡按纽,再进行一次排程,在几秒钟之内分析超过十万种不同的排列组合,找到产能最平衡的情况之下,分析出这种情况下产量是多少,这些汽车销售之后,能带来的利润是多少。
此外,如果产能不够,是否能进行一些优化来提高利润?可以利用SAP HANA技术来随时进行进一步的模拟,可以添加一条组装线,分析这种情况下能够提高多少产量和利润。或者如果增加10%的库存,又能带来多少产量和利润。通过SAP HANA技术,将来从销售部门到生产排程部门之间所有的联系,将完全作为一个创新的模式提供给客户。通过SAP HANA技术,将需要几天甚至几年才能完成的计算过程,在短短几秒钟之内,就可以给企业提供最精确的信息。
据了解,SAP HANA技术目前已经在SAP的很多联合创新应用的用户中发挥作用。如联想已经在使用HANA技术,从CRM系统提供数据源,使用BW系统处理数据,最后通过BO呈献给用户。而HANA带来的最大改变是,联想不再需要几个小时来得到最新的报告,使实时报告成为了可能。
HANA未来走向何方?
SAP将把HANA打造成为开放性战略平台。除了能够利用HANA进行分析,还可以在HANA平台上,构建进一步的应用程序。一方面,SAP将HANA平台开放给更多的合作伙伴和用户,它们可以基于此平台开发更多创新型应用,给企业带来更大的价值。另一方面,SAP已经在HANA的应用技术之上,推出了进一步的产品,未来将有更多产品不断向市场推广。如SAP动态促销管理、SAP动态现金管理、销售和生产计划的排程、劳动力战略规划、SAP智能电网等这方面都将有HANA技术在背后提供强力的支持。张志琦透露,从未来的路线图来看,HANA将成为SAP的核心平台之一。SAP也会逐步考虑将商务套件运行在HANA平台之上,今年11月份,SAP会向市场发布基于SAP HANA的版本。未来也会在SAP产品路线图中进行全面的支持和提升。如果说云计算会对企业管理软件的应用方式产生革命性的变革,那么HANA将会对企业管理软件在性能上的提升起到巨大的推动作用,至于能否产生革新浪潮,让我们拭目以待。
发表于:
2012-10-15 10:44 阅读(1743)
评论(0) 收藏 好文推荐
本博客所有内容,若无特殊声明,皆为博主原创作品,未经博主授权,任何人不得复制、转载、摘编等任何方式进行使用和传播。
作者该类其他博文: