0 引言
纵观信息技术发展史,新技术一直推动着社会信息化的进程。在当今信息资源丰富,计算机硬件技术日新月异,网络基础设施已成规模的条件下,智能化成为信息研究的热点和方向。诸如具有人工智能的机器人、自动交易系统等都是智能化的雏形。智能化正在成为信息技术的又一变革。
商业智能(Business Intelligence,BI)是一个新兴的智能化技术体系。英特尔公司认为“商业智能技术是企业进入大数据时代的钥匙”。英国航空公司利用商业智能技术分析飞机状态与天气、海拔高度、机械故障等因素的关联,达到提高航班安全系数的目的。国内外大型电子商务公司也正在应用商业智能技术,通过挖掘海量商品销售信息,预测顾客商品需求来优化库存和产品。商业智能技术是现代国际大型企业信息应用的热点。
作为中国电力行业的核心骨干企业,国家电网公司建设经营的电网覆盖国土面积88%以上,供电人口超过11亿。为有效管理大规模的生产营销业务,国家电网公司相继推广应用了ERP系统、实施了“三集五大”战略改革、建立了覆盖全面的信息应用系统,推进了企业信息化。
然而在生产营销业务数据不断规范的同时,数据量也在不断积累。海量的原始数据结构复杂,传统的查询和分析方式效率有待提高。商业智能新技术在电力行业的应用,诸如阶梯电价的辅助决策、电网投资分析、客户需求预测等,对提高信息资源的利用效率、支撑电网企业科学发展具有积极作用。
1 商业智能技术应用步骤
BI是企业对数据的搜集、管理和分析的系统过程,主要实现将原始业务数据转换为企业决策信息的过程,与一般的信息系统如MIS、ERP等系统有很大区别,其在海量数据处理、数据分析、信息展现等多个方面具有突出性能,大幅提高信息资源利用效率。
从技术上说,商业智能主要包括数据预处理、数据仓库(Data Warehouse)、联机分析处理(Online Analytical Processing,OLAP)、数据挖掘(Data Mining)技术,还包括数据展现、绩效管理、指标管理以及其他用于统计和分析商业数据的先进信息技术。商业智能技术应用流程示意如图1所示。
1)数据预处理。这是整合原始数据的第一步,将网页、笔记、电话转录等各种形式的原始数据整理成系统设计的格式。包括数据的抽取(例如从网页上抽取供货商简介、从订单中抽取供货商名称)、转换(成为设计的格式)、装载3个过程。
2)数据仓库技术。数据仓库最大的特点是面向主题。传统的关系型数据库及应用系统偏向于具体操作问题,如变压器小修、客户交纳电费。而主题可能为电网投资、客户需求等。数据仓库的另一个特点是集成,如电力公司和个人客户电量计量单位不同(亿千瓦时、千瓦时),这些原始数据在进入数据仓库后都要消除单位差异。数据仓库一般是非易失的,即只读的,提供给统计分析和数据挖掘使用。数据仓库是不同时间的数据集合,其中数据保存时限可能很长(如5年,而一般应用系统例如客户电费查询期限只需12个月),能满足决策分析的需要,而且数据仓库中的数据都要标明该数据的历史时期。
3)OLAP技术。OLAP委员会对联机分析处理的定义为:将从原始数据中转化、为用户所理解的、真实反映企业多维特性的数据称为信息数据;OLAP是使分析人员能够从多种角度对信息数据进行快速、一致、交互地存取,从而获得对数据更深入了解的一类软件技术。其技术核心是“维”和“度量”2个概念。OLAP常和数据立方体联合使用,OLAP的基本多维分析操作有钻取(Drill-up和Drill-down)、切片(Slice)、切块(Dice)以及旋转(Pivot)等。
4)数据挖掘技术。数据挖掘是从海量的、有噪声的数据中总结出潜在信息的过程,其可分为统计分析和需求预测2种。例如,根据客户报修情况统计出哪个厂家生产的智能电表容易出现故障;根据某个城镇历年用电趋势预测明年负荷需求,商业智能技术可以认为是以上技术的融合。数据仓库作为联机分析处理和数据挖掘的平台,用于数据预处理后的存储和组织。联机分析处理侧重于数据的汇总,侧重于与用户交互,提供敏捷的操作及直观的多维视图,属于验证型的分析,由用户驱动。相对于联机分析处理,数据挖掘以数据仓库和多维数据库为基础,侧重于自动发现数据中的隐含规律,属于数据驱动。而数据挖掘又可反过来为联机分析处理提供分析的模式。
2 商业智能技术在电网企业的应用实践
2.1 阶梯电价决策支持
商业智能技术的精髓在于OLAP分析。下面以阶梯电价决策支持为例,阐述OLAP技术在电力行业的应用原理。制定阶梯电价电量分档方案时,以分析居民历史用电量数据作为决策依据。居民用电量数据如图2所示。
图2所示的数据立方体有3个维(可以有更多维),分别为时间、区域、月均用电量。每个方块中的数值即度量,为用户数量。
时间维的粒度为1个月,也可“上卷”为1年,或“下钻”为1天。月均用电量维的粒度为100kW·h,同样可以不同的粒度(如10kW·h、1kW·h)观察。
可以查询“山东省2014年3月份月均用电量在100-200kW·h之间的用户数量”,在3个维约束条件下作“切块”操作,即得所求答案。
假设要查询“全国月均用电量在200kW·h以下的用户数量”,在月均电量维上做“上卷”操作,得到0-200kW·h的粒度,再忽略区域、时间维,在0-200kW·h上作“切片”操作即得所求答案。
在阶梯电价电量分档方案制定时,可以图2的分析为决策依据,例如选择用户数最多的月均用电量范围(0-200kW·h)作为一档基本电量。
这是商业智能的OLAP技术提供的直观有效的分析功能,而这种便捷性是传统操作型查询系统很难实现的。所以,商业智能新技术提高了信息资源利用效率。
2.2 山东电力BI高级分析
国家电网公司在ERP系统实施后,特别是“三集五大”战略改革以来,业务管理水平大幅提升,积累了海量的企业数据。但是ERP原始数据结构复杂,编制一个分析报表非常困难,需要到多个系统中找数据。这严重制约了管理和运行人员对公司各项指标的把握,数据利用效率有待提高。
国网山东省电力公司为解决这些问题,引进商业智能新技术,实施了高级分析项目。采用SAP的BI系统与ERP系统无缝连接,使管理、运行人员能够即时获取分析报表,大幅提高信息资源利用效率。
2.2.1 SAP BI高级分析系统与ERP对接
国内外研究高级分析系统的厂商较多,有微软、SAP、Oracle、IBM等。为了与已推广的SAP ERP系统实现兼容,选取SAP BI系统。
SAP BI产品从SAP R/3系统和其他信息系统中获取数据,经过转换后存放在一致的空间,即生成数据仓库。在此数据仓库基础上,可以支持计划与预算的编制、多维数据的实时分析、管理报告的生成与定量分析及绩效考核等功能。SAP ERP系统和SAP BI高级分析系统的区别见表1所列。
2.2.2 “大规划”投资计划趋势分析示例
以“大规划”投资趋势分析为例展示BI高级分析项目的实际应用。
投资计划趋势分析是一个主题,指从不同的项目维度,分析整个公司历年的项目投资,通过该指标为相关部门对未来的投资规划调整提供依据和参考。投资计划趋势分析主题的数据来自投资计划系统。
首先从门户系统点击ERP系统,从“项目管理”入口进入高级分析功能,在左侧有预先开发好的多种主题,包括“投资计划分析”、“项目进度分析”、“项目合同分析”等。选择“投资计划综合分析”主题,点击“投资计划趋势分析(非基建)”,在屏幕右侧显示该主题的筛选条件,输入条件包括:下达年度(范围)、单位、项目大类(多选)、项目小类,投资计划趋势分析操作界面如图3所示。
通过查询分析,系统会给出简单直观的统计图表(见图4)。
在图4中,右下角的表是原始表。在高级分析项目实施之前,要进行投资计划趋势分析,只能通过若干张原始数据表,进行手工连接计算,其计算速度和准确率难以保证。图4右上角的图是高级分析项目生成的统计图表,快速直观。所以,山东电力高级分析项目代表的商业智能技术切实提高了公司信息资源的利用效率。
3 未来应用场景
商业智能技术正在不断发展中,目前应用的软件和技术远远没有完全发挥出商业智能的潜力。随着各种关键技术的进步,在可预见的未来将会有更多智能化的应用场景。
3.1 依托技术
数据预处理技术、数据仓库、联机分析处理、数据挖掘是商业智能体系的关键技术领域。其中非结构化数据处理和文本OLAP是当前研究的热点,是处理大数据所依托的基本技术。
1)非结构化数据处理。信息数据可大体分为结构化数据和非结构化数据。结构化数据是格式良好的、有规则的数据,如ERP系统中具有多个字段的表格数据。与结构化数据不同,非结构化文本数据没有固定的格式或标记,其表现形式多种多样,像网页内容、客户投诉记录等。
2)文本OLAP技术。现有的OLAP对非结构化文本信息的处理能力非常有限。比如,要从一堆文本数据中查询“客户投诉原因是什么”,传统OLAP很难做到。文本OLAP技术是用OLAP的方法处理文本信息。未来文本OLAP新技术的发展成熟,将会利用传统OLAP分析的便捷性、直观性的优点,有效处理文本信息,也将会给电力行业带来新的应用场景。
3.2 “大营销”客户分析场景
国家电网公司电力营销95598客服热线在“大营销”改革之后走向规模化和集中化。借鉴国外客服电话转录技术,未来或可实现将客户投诉、建议的反馈电话语音自动转换为文本数据,与营业厅现场接待客户所生成的客服笔记等一起装载到数据仓库,以供统计分析。
这个数据仓库具有姓名、用电区域等结构化维以及文本维。借助未来中文分词、语义网络、文本维度获取和度量计算等相关新技术的发展,将能够自动生成客户反馈信息分类树(见图5)。
每个客户的每次反馈信息都将映射到一个或多个分类上。营销业务人员可以方便地根据主题查询分析,而不用翻阅历史客服记录文档,从而大幅提高客户分析水平,提高优质服务水平。
4 结语
企业信息化使各种生产和业务数据在不断规范的同时,数据量也在不断积累。以数据仓库、OLAP为核心的商业智能新技术能够利用结构复杂的海量原始数据,提高查询和分析效率。当前商业智能新技术已经在国家电网公司以至整个电力行业得到初步的推广应用,效果显著。在非结构化数据的处理方面,文本维度获取和度量计算等文本OLAP技术在未来还有广阔发展空间。
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/169655.html