数据仓库主要解决哪些问题

2024-05-18 04:47

1. 数据仓库主要解决哪些问题

数据仓库主要解决哪些问题
企业信息化建设过程中,为了提高日常的工作效率以及提高本企业的市场适应能力,大部分企业会根据市场、客户和企业本身建立不同的业务系统来满足需求。但此系统往往因为市场需求、设计理念、建设时间、平台选择等因素的不一致性而导致系统间相互独立、信息分散等特点,从而形成信息孤岛,为了解决上述问题,企业就需要一种行之有效的技术进行信息整合,通过集成不同的系统信息为企业提供统一的决策分析平台,帮助企业解决实际的业务问题(如:如何提高客户满意度和忠诚度,降低成本、提高利润,合理分配资源,有效进行全面绩效管理等)。人们往往会采用数据仓库技术实现。
   使用数据仓库有3个方面的好处:
    (1)数据仓库能够为业务部门提供准确、及时的的报表。虽然给业务系统也能够提供报表功能,但由于业务处理系统是为实现某个业务功能开发的,业务处理系统中的报表只能提供局部的信息,无法提供关于企业整体的信息,使管理人员有“只见树木,不见森林”的感觉。另外业务系统中的报表相对是比较固定的,对于业务人员临时提出来的一些分析要求,必须经过软件人员大量艰苦的开发工作才能实现,业务人员往往感觉报表功能不能满足管理上的要求。而在数据仓库中提供的灵活的报表工具,可以很方便地增加新的报表,适应业务的变化。
    (2)数据仓库可以赋予管理人员更强大的分析能力。联机分析处理(OLAP)是数据仓库中经常采用的一种分析手段。OLAP技术使得用户能够方便地从多个角度对信息进行分析,使业务人员可以了解更多的信息。例如,对于业务收入指标,我们可以了解到每个产品是通过哪些渠道销售出去的,销售给哪些类型的客户,我们不仅可以看到某个区域总的销售收入,而且可以看到在该区域中每个城市、每个商店的销售情况,直到查看到具体的一笔销售合同。OLAP分析的另一个好处是它采用业务名词而不是技术术语对事物进行描述,因此业务人员可以清晰地了解数据对象的含义,并且无需依赖技术人员,就可以自主地进行业务分析。
    (3)数据仓库是进行数据挖掘、知识发现的基础。利用数据挖掘技术,我们可以发现数据中存在的模式和规律,例如可以了解到不容的用户群体具有什么样的消费行为,对于价格的敏感度如何。利用这些知识,可以帮助企业对未来的变化趋势进行预测,制定更加准确的市场策略,实现交叉销售/向上销售的目标。由于数据仓库已经实现了企业数据的整合,提供了反映企业全局的、一致的信息,因此,在数据仓库的基础上进行数据挖掘,可以使预测分析结果更加准确、更完整。
    随着云计算、大数据的不断深入,伴之而来的是海量的数据,那么如何更好的从这些数据中提取有用的信息呢?那数据仓库就发挥了他巨大的潜力。

数据仓库主要解决哪些问题

2. 数据仓库开发过程中的七个禁忌

  过去我们一直使用的OLTP技术也许隐藏着许多严重的缺陷 数据仓库的实现并不是一个简单的任务 你会发现以前积累下来的丰富经验 并不适合处理每个数据仓库的独特需求     下面列出的条款是你在实现数据仓库过程中一定会面对的问题 其中一些看起来并没有想象中那么严重 但是你还是应该尽量避免出现类似问题 数据仓库并不是一个事务处理系统 它没有一定的标准也不会实现某个特定的应用 但它本质上是非常有组织性的 总之 每个公司所建立的数据仓库都是唯一的 并且每一次数据仓库的实现方法都不是一成不变的 在实现数据仓库时需要注意的不单是 应该如何作 更要注意 不该如何做 下面就是我们总结的七点 不该如何作      不要编写自己无法快速修改的代码  你所要编写的程序主要用于数据分析 而不是处理事务 而你的用户也并不真正知道他们自己真正想要一个什么样的程序 因此你不得不反复修改代码好几次 才会明白用户到底需要一个什么样的程序 如果你编写的程序具有良好的结构和灵活性 就算需要修改也不会太浪费力气 反之 你会被自己累死      不要使用无法修改的数据库访问API  在过去 你的数据库可以为大量的客户提供稳定的数据查询服务 而如今 你的程序必须能够应付更多的数据查询 这使得重新改写程序以使得每个查询请求能得到最大的数据量成为势在必行的工作 而一般来说这种代码修改都不会一次成功 所以只有选择合适的可以修改的API 才能使程序尽快适应新的需求      不要设计任何无法扩展的东西  在联机处理过程(OLTP)应用中 数据分析并不是一个真正的应用程序 实际上 数据分析的关键是获取大量旧的数据 从中提取数据模型 并以此模型推断出新的信息 而你所编写的访问潜在信息的代码应该具有可扩展性 可以附加新的数据 千万别在支持数据分析的代码中假定数据都是固定格式的 不要附加不必要的功能  一个仓库要做的是恰到好处的服务 用户走进仓库 从货架上取得自己所需得信息 仅此而已 由于业务智能 分析以及规律性的问题都有各自的处理程序 因此你的客户唯一的需要就是获取信息 他们需要一种应用环境 可以让他们快速的从数据仓库中取得分析过程所需的数据 而不论这个数据是什么样子的 也许你想帮助他们精炼一下获得的数据 但最好不要这么做 一定要记住 不要给客户的数据分析程序添加任何会影响数据访问性能的功能      不要简化数据清除和数据源分析的步骤  在实现数据仓库过程中最应该注意的地方就是为Extract Transform Load机制分析数据源 以及为优化负载而清除数据 安全的做法是假设项目经理在这个阶段会需要整个项目资源的一半以上 相反 如果你在这方面进行了简化 稍后肯定会后悔 所以就算系统工作缓慢 也不要简化清理旧的数据的过程      不要避免颗粒度和分区问题  在数据仓库设计过程中有两个最大的数据存储问题 第一是如何给转换数据定位一个恰当的颗粒度等级 第二是如何将数据绝对的分区 为什么这两点问题如此重要呢?因为整个数据仓库的响应能力受颗粒度影响 并且数据访问的效率直接与数据分区性能有关 因此这是具有关键性的工作 不要试图避免面对这些问题      不要在没考虑业务问题前就使用OLAP  用户在亲眼见到程序前通常都不知道自己到底想要个什么样的程序 因此他们的观点有不少错误 比如他们希望分析结果会忠实反应性能度量 或者希望程序会使他们部门或公司的业务工作有所不同 而你必须跳出自己的职责范围 从IT管理者的角度考虑用户部门直至整个企业的运行方式 才能在开发过程中避免这类问题 在通常的OLTP开发中 你可以比较方便的理解业务流程 而在联机分析处理(OLAP)领域 任何事情都需要亲自考察 而在你周围工作的人也许并不会发现你对业务方面存在的误解 因此 不要自以为已经了解了足够的信息 不断的询问才能使你真正了解 业务智能 中的 业务 到底是什么样子的 lishixinzhi/Article/program/Oracle/201311/16760 
   

3. 数据仓库实施内容有哪些

1、处理性能
日常业务涉及频繁、简单的数据存取,因此对操作型处理的性能要求是比较高的,需要数据库能够在很短时间内做出反应。
2、数据集成
企业的操作型处理通常较为分散,传统数据库面向应用的特性使数据集成困难。
3、数据更新
操作型处理主要由原子事务组成,数据更新频繁,需要并行控制和恢复机制。
4、数据时限
操作型处理主要服务于日常的业务操作。
5、数据综合
操作型处理系统通常只具有简单的统计功能。
数据库已经在信息技术领域有了广泛的应用,我们社会生活的各个部门,几乎都有各种各样的数据库保存着与我们的生活息息相关的各种数据。作为数据库的一个分支,数据仓库概念的提出,相对于数据库从时间上就近得多。美国著名信息工程专家WilliamInmON博士在90年代初提出了数据仓库概念的一个表述,认为:“一个数据仓库通常是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,它用于对管理决策过程的支持。”

这里的主题,是指用户使用数据仓库进行决策时所关心的重点方面,如:收入、客户、销售渠道等;所谓面向主题,是指数据仓库内的信息是按主题进行组织的,而不是像业务支撑系统那样是按照业务功能进行组织的。
集成,是指数据仓库中的信息不是从各个业务系统中简单抽取出来的,而是经过一系列加工、整理和汇总的过程,因此数据仓库中的信息是关于整个企业的一致的全局信息。
随时间变化,是指数据仓库内的信息并不只是反映企业当前的状态,而是记录了从过去某一时点到当前各个阶段的信息。

数据仓库实施内容有哪些