1 引言
随着科学技术和网络技术的迅速发展,当今社会已经进入了一个信息化时代,同时,现代企业管理水平也在不断的提高,企业要想在这个竞争激烈的市场环境中获取更多的利润就必须增强核心竞争力,尤其是要重点提高企业信息化水平,这是现代企业生存、发展的关键因素。为此,国内外大多数企业开始组建适合自身企业发展的信息化系统,进而提高企业的生产效率,增强企业的营业能力。但是,与传统市场环境不同的是,信息化也给企业积累了海量的数据,使企业承受着巨大的负担,比如客户所下的订单、业务运作的库存、客户和供应商的资料以及交易账目,还包括行业、市场环境和竞争对手的各种资料数据信息。这是一个信息时代,也是一个大数据时代,企业要想从海量的数据中提炼出有用的信息相对不容易,这对管理层来说是一个难点,也增大了他们做出决策的风险。为了将海量的数据信息转换为对企业有用的知识数据,进而帮助管理层做出正确的决策,商业智能(Business Intelligenoe,简称BI)技术应运而生。而且,随着商业智能技术的不断进步和发展,在各行各业都得到了广泛的应用,且由原来简单的嵌入企业变为融合到企业关键的业务流程中去。
信息时代电子商务已成为主流模式,这对物流服务行业来说既是机遇又是挑战。在竞争日益激烈的市场环境下,物流企业为了更好的生存和发展需要不断的获取巨大的业务数据,然后利用先进的信息技术将这些数据转换成有用的信息,进而帮助企业做决策,提高企业的核心竞争力。但是,普通的管理信息系统并不能很好的满足物流企业管理层的决策需求,为此,物流企业亟需更直观、智能的系统帮助管理层对海量的数据进行全面的处理和分析。而商业智能技术就可以满足物流企业的需求,它可以收集、整理、处理、分析以及转化物流企业的大量数据,使其变为对企业有价值的信息,从而使物流企业管理层具有深远的洞察力,做出更好的决策与指导方案。本文考虑到商业智能技术的优点,将其应用到物流企业数据仓库的设计中,希望能够更好的辅助物流企业管理层做出最利于企业发展的决策。
2 商业智能技术及数据仓库的理论基础
2.1 商业智能技术概述
商业智能技术是一种信息技术工具,它可以将与企业有关的海量数据信息转化为有价值的知识,精确地挖掘和处理企业大量的业务数据,从而辅助企业管理层更深入的了解业务数据,并做出正确的经营战略和决策。要想有效的将巨大的数据转化为有价值的知识,单一的信息工具是不行的,商业智能技术就是将数据仓库、数据挖掘、联机分析处理(OLAP)以及数据备份和恢复等技术整合到一起处理海量的数据,也就是说,商业智能技术是一个由多个技术组合而成的综合性的信息工具。
商业智能技术的主要工作是从海量的企业业务数据中提炼出对企业正确有用的信息,并清理冗余的数据信息,然后根据企业需求将这些信息进行抽取(Extraction)、转换(Transformatior)和装载(Load),简称为ETL过程,把数据信息整合到一个统一的企业级数据仓库中,进一步向企业管理层呈现出一个关于企业数据的全局视图。除此之外,商业智能技术还需要结合一些查询和分析工具、数据挖掘工具、联机分析处理工具等对数据仓库的数据进行分析和处理,最终将海量的数据信息转变为能够辅助管理层做决策的有价值的知识信息。
2.2 数据仓库概述
W.H.Irmon提出了数据仓库的概念,他认为数据仓库是面向主题的、集成的、稳定的却又不断变化的数据集合。一般的,在数据仓库中比较重要的技术包括:数据挖掘、数据仓库和联机分析处理。数据仓库体系的主要组成部分有:数据源、集成器、监视器、数据仓库和客户应用等。
一般的数据仓库主要采用三级数据模型的结构,即概念模型、逻辑模型和物理模型。不同于具体的操作实施,概念模型是从企业最高层的角度出发对全局的抽象,它的主要作用是明确企业的主题。因此,概念模型会向企业展示一个面向数据库的全局的、宏观的概念视图。逻辑模型则主要为企业数据仓库的大量数据建立逻辑关系。要考虑到企业的实际需求,通过对数据仓库中数据的分析建立相应的逻辑关系模型。而物理模型主要针对的是企业的数据仓库,并设计其物理分布,它在一定程度上决定了企业数据仓库所需要的各种软硬件和资源的置备及其分布状态。其中数据仓库的逻辑模型将概念模型与物理模型关联在一起,三者相辅相成,共同构造一个良好的数据仓库系统。
一般情况下,企业数据仓库的整个数据处理过程是从录入数据开始,并严格按照企业所指定的方式组织数据,同时,系统所输出的数据也要符合用户的要求,满足用户的需求。用户会根据自身的需求筛选提取出相应的数据信息,然后对所提取的数据进行加工处理,最后依据已经设定好的数据仓库模型,将处理好的数据信息加载到企业的数据仓库里。
3 商业智能技术在物流企业数据仓库设计中的应用
为了将商业智能技术更好的应用于物流企业数据仓库设计,物流企业应该结合其自身的业务特点和市场需求,基于已经存在且使用相当成熟的元数据模型和数据粒度模型,构建符合物流企业数据仓库特点的概念模型,这样就可以抽象化物流企业的具体业务,然后,企业应该以概念模型和科学合理的逻辑模型为基础,给出相应的物理模型,最终达到物流企业数据仓库的物理实现目的。
3.1 概念模型设计
在数据仓库设计的过程中,首先要做的就是建立概念模型。由于录入数据仓库的物流企业业务活动的相关数据非常重要,因此,在建立概念模型的时候,一方面模型要保证其能准确的理解所有数据内容,另一方面,模型还要涵盖全部完整的业务内容。所以,要想设计出优质的概念模型,设计者就必须充分认识和理解物流企业相关业务的知识内容,但是不用过多的考虑细节。设计概念模型时主要工作包括界定系统边界和确定主要的主题域及其信息包图。
(1)界定系统边界。数据仓库是一个错综复杂的数据逻辑系统,因此它的设计过程也比较复杂,需要得到不断的改进和完善。数据仓库的设计在初期阶段无法给出详细且精确的宏观需求,但可以明确一些比较基础的方向性需求,例如:①物流企业在日常的业务活动中经常做什么类型的决策。②物流企业的管理层最关心哪些问题。③为了深入分析各种各样的问题,物流企业需要搜集什么类型的数据信息等。在明确了各种问题之后,物流企业就可以据此划定出一个最为符合企业利益的大致的系统边界,然后就可以集中精力有重点的收集和挖掘所需要的数据信息。综合可知,系统边界的界定工作也就是对物流企业的需求分析阶段,它在一定程度上反映了上层管理者的数据分析需求。
(2)确定主要的主题域及其信息包图。首先,设计者应该充分认识物流企业的业务规则,了解上层管理者的决策需求,并对物流企业的数据源和其他业务报表样例进行深入的分析。然后,设计者再以企业的核心物流业务为依据,给出3个与物流企业的数据仓库相匹配的主题,也就是说该主题域包括业务发展、运输和仓储三个主题。确定了主题域之后,还需针对各个不同的主题设计与其相对应的信息包图。信息包图在一定程度上给出了用户对所需数据信息的要求,并明确了各种分析指标,它主要包含3个关键内容,即类别、维度和指标。为了更好的说明主题和信息包图,下面给出了仓储主题所对应的信息包图,如图1所示。
3.2 逻辑模型设计
通常情况下,概念模型设计时所确立的主题域中的每个主题都应该构建与其相对应的逻辑模型。设计逻辑模型的主要工作如下:
(1)数据粒度的确定。在数据仓库的设计中,数据粒度是一种时间段参数,它用来标明数据记录或数据整合所耗用的时间。所耗用的时间段参数取值越小,数据粒度的级别就越低,同时,还表明所对应的数据更加详细、更加具体;相反,所耗用的时间段参数取值越大,数据粒度的级别就越高,同时表明所对应的数据复杂程度比较高,细节丢失也比较多。
物流企业在设计数据的粒度级别时,必须综合考虑到企业的业务特点、所采用的分析类型以及数据的总存储空间等各种因素,而且,在这些因素中尤以分析类型为关键性因素。因此,为了满足物流企业管理层的分析需求,将录入数据仓库中事实表上业务数据划分为按日汇总数据、按月汇总数据和明细数据3种粒度级别。
(2)主题域关系模式的定义。为了避免物流企业数据仓库变为单纯的操作型数据,需要分析细化主题域中的各个主题,使每个主题都能够有多个数据表,这就是定义主题域的关系模式。在物流企业数据仓库的逻辑模型设计中,最为简洁直观的模型是星型模型。星型模型主要包括事实表和维度表,它能够正确地给出不同实体之间存在的逻辑关系,并采用实体的重要程度来反映这种逻辑关系。
(3)数据集市的设计。数据集市的数据范围比较小,对总的数据仓库来说,数据集市仅仅是一个真子集。它可以是某一特定单元或部门的相关数据值。众所周知,为了满足一些特定的需求,比如某些用户的特殊要求,才出现了数据集市。因此,数据集市往往与商业智能技术联系到一起。针对物流企业的数据集市,本文的设计流程是根据商业智能技术应用功能的设计原则,从整体数据仓库中提取不同应用功能分析所需要的数据,然后将这些数据存放到与其功能相符的中间表中,最后,按照先前的规定构建数据集市。这样物流企业就可以及时的应对不同用户对不同功能的数据需求,如果某个用户对某一功能提出业务数据请求,那么企业就能够很方便的找到与该功能相对应的中间表,并将其中的数据发给用户,这大大提高了物流企业数据仓库系统的响应效率。
3.3 物理模型设计
物流企业数据仓库的逻辑模型建立之后,就可以在其基础上构建物理模型,在数据仓库设计物理模型时需要完成的主要工作如下:
(1)确定数据的存储结构。数据仓库系统可供选择的存储结构有很多种,而且实现不同存储结构的方式也千差万别,要想发挥出数据仓库系统的最高效率,设计者就需要综合考虑多种因素并选择恰当的存储结构,主要因素包括:维护代价、存储空间利用率和存取时间。
(2)确定索引策略。为了方便物流企业在数据仓库中快速的找到所需数据,可以对不同的数据存储单元设计其专用的索引,进而提高数据仓库的存取效率。而且,所建立的索引不需要设计者经常性的进行维护,这是因为物流企业数据仓库中大部分数据更新频率都很低,也就是说大部分数据存储是相对比较稳定的。
(3)确定数据存放位置。设计数据仓库是为了方便物流企业管理层能快捷的存取数据。因此,在设计物理模型时,不一定非要把相同主题的数据信息放到一起,而是按照一定的要求进行分类,比如按数据的重要程度分别存放在不同等级的数据信息,按照数据的使用频率分为高、中、低等数据信息,这样根据分类将它们分别存放在与其相对应的存储设备中,从而方便管理和使用数据。
4 总结
随着互联网技术的迅速发展,电子商务已成为现代经济发展的主流模式,而物流业是电子商务实现必不可少的一个环节,因此物流行业已经成为现代经济活动的重要组成部分。而物流企业为了紧跟时代的步伐,为了生存发展,为了更好的满足市场需求,就离不开先进的科学技术和完善的数据管理系统。目前,在物流行业中得到广泛应用的是数据库以及管理和分析数据的数据仓库技术,在我国物流行业中,商业智能技术仅仅是处于刚开始发展的阶段。本文介绍了大数据时代数据仓库设计的必要性,还分析了商业智能技术在物流企业数据仓库设计的应用,分别介绍了概念模型、逻辑模型和物流模型的设计问题。文中所给出的商业智能技术在物流企业数据仓库设计中的应用方法在某种程度上适用于大部分物流企业,但是不同的物流企业的核心竞争力或者说核心业务是不同的,因此物流企业要根据自己的业务范围和企业内部的管理模式等,应用商业智能技术设计符合自身特色的数据仓库。
原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/tech/cloud/169656.html