抛弃Excel,学会这样做数据处理,轻松搞定业务数据分析

这两年,随着大数据概念的热门,数据分析也渐渐不是一个独立岗位,而变成一种通用能力,业务人员也开始做起了数据分析。但是业务人员做数据分析的日子并不好过,在和一部分做业务分析的粉丝交流的时候,经常听到他们这样抱怨:

“公司各种系统里堆积的各种业务数据摞起来比英汉字典都高,要用的时候不知道该往哪找”

“还有呢,有的人就喜欢用Excel表传来传去,要么就是直接从平台上随意修改数据,最后数据指标全都乱套了。“

“领导也是天天催报表,想要自己做吧,又没有相应的数据权限,要推给IT做吧,他们又没有档期,有数据要修改就要等半天。”

其实不光是业务人员,还有包括人力、运营等岗位的分析人都有这样两个痛点:

1、数据被IT高度集中化,难以下放到业务分析人的手里,数据处理等工作只能交给IT做;

2、数据管理混乱,业务人员想要拿数据做分析,很可能会影响其他人的使用,严重还会影响整个BI系统的运行;

这两个痛点是业务与IT之间由来已久的矛盾了,很多公司都想到了用BI分析系统管理业务数据,数据分析工作由专门的IT人负责制定模板,固定出报表和分析。

然而问题还是没有得到解决,因为IT部门的人对业务不够了解,业务场景不同、数据不同等具体问题,往往要和业务人员来回更改需求,扯皮吵架就在所难免。IT累的像取数机,业务拿不到数据不能及时交差,两败俱伤。

业务数据处理,数据处理与分析,数据分析处理方法,大数据自助分析平台

业务分析实现自助化,才是真正的良药

这样的矛盾怎么化解?唯一的办法就是让业务自己取数,自助分析。也就是近两年在企业数据应用用比较火的概念:自助式BI。

什么叫做自助式BI呢?按照我个人的理解,就是要实现业务数据的IT去中心化,让IT部门真正实现数据下放,业务人员参与到数据处理和分析的过程中来。

举个例子,如果你是一个零售企业的业务分析师,某天公司的毛利率数据出现了明显异常,老板让你赶紧拉数据分析一下原因是什么,以及让你预测一下经营风险。

如果是一般传统的BI分析流程,你应该先搜集数据指标需求,比如建立毛利率影响指标体系,通过零售价格、库存、销售量等构建业务场景,然后将这个具体的场景需求提给IT。

IT拿到了需求,会先安排需求的优先级,假设你这次的需求优先级很高,那么IT就会按照你提交的指标体系从数据库中取出相应的数据,加载到数据仓库中进行分析。

但是IT一般是不懂业务的,IT的数据模型肯定是需要参照你的业务模型的模板,因此你需要不断与IT进行沟通和反复修改,最终经过不断返工,最终的分析报告或者报表才能出来。

这个过程不仅流程复杂,需要反复修改,而且经常会造成IT与业务人员的极大沟通成本,浪费人力资源,降低了工作效率。

业务数据处理,数据处理与分析,数据分析处理方法,大数据自助分析平台

所以,自助化BI实现数据下放,才能真正解决痛点。还是上面那个场景,如果实现业务自助化,会怎么样呢?

你需要分析毛利率的异常数据,不需要给IT提供业务需求,IT只需要将自助数据平台上的数据访问权限给你开放,你就可以直接进行数据访问和提取。

有了业务数据,你就可以利用自助BI进行个性化和自主化的数据分析,比如创建仪表板等,如果需要处理和修改某些数据,也不用再和IT进行反复沟通了。

这样企业的数据分析工作将得到极大的提升,数据的下放不仅能让IT的人力得到解放,也能使业务人员进行探索式的交互分析,比IT人员更容易识别数据风险,挖掘出数据价值。

数据下放了,会不会造成管理混乱

这应该是很多企业担心的问题,一旦让IT把数据下放给业务人员,业务人员随意在系统中取数拉数,会不会造成数据混乱呢?

这里就要提到一个概念——自助数据集。简单点说,自助数据集就是将分布、异构数据源里的数据,进行一定的数据底层处理,然后存放到一个数据集里,然后将这个数据集进行权限分配,供后续可视化使用。

业务数据处理,数据处理与分析,数据分析处理方法,大数据自助分析平台

以FineBI为例,负责系统管理的人将业务数据放在业务包中,如果某个业务人员想要进行取数分析,就要自己创建一个自助数据集,按照自己的场景需求从业务包中取数。

也就是说,自助数据集的取数过程并不影响原有的业务数据,从而杜绝了数据传来传去造成的管理混乱。

业务数据处理,数据处理与分析,数据分析处理方法,大数据自助分析平台

此外,业务人员也可以将这个数据集进行权限管理,没有数据集访问权限的人是无法进行相应操作的,同样的,管理者也可以设置业务数据的访问权限,从上至下的保证数据安全性。

没了IT,数据处理和加工怎么办?

一般来说,业务人员是很希望进行自主化数据分析的,但是无奈数据处理和加工流程只能依靠IT部门,而IT部门又觉得这种数据加工工作很机械重复,业务人应该自己掌握。

还是以上面的FineBI为例,业务人员创建了自己的自助数据集,下一步就要进行初步的数据清洗和加工,而自助化BI之所以能够简化工作,就在于它提供了一种自助化的加工功能。

业务数据处理,数据处理与分析,数据分析处理方法,大数据自助分析平台

比如FineBI中的表处理操作,基本上可以满足业务人员的数据处理需要,包括脏数据过滤、数据分组、新增数据列、数据排序以及合并等等。

比如脏数据的处理,一般业务数据里有很多的无效数据和脏数据,像负数值、空值等等,我们就可以在FineBI的数据处理中过滤掉金额数为负值且订单时间为空的数据,初步进行数据清洗。

业务数据处理,数据处理与分析,数据分析处理方法,大数据自助分析平台

再比如,我们想要计算某个客户的订单频次,就要先算出上次订单到这次订单的时间差,就可以在FineBI中直接添加一个新列,选择时间差选项,选择对应的数据指标就可以完成了。

业务数据处理,数据处理与分析,数据分析处理方法,大数据自助分析平台

当然,如果有的业务数据需要比较复杂的数据处理,比如聚类、回归等,也可以直接在finebi中实现:

总结

只要解决了IT数据集中化,以及数据管理问题,业务人员和IT人员之间的矛盾才能得到解决,二者之间的鸿沟也能告一段落。

而我们在选择自助式BI时,也需要从用户的角度和IT基础架构的角度找到最适合企业的平台。首先要适合业务,简单易用,此外还应该具备良好的性能,功能强大,才能简化工作、提高工作效率的积极影响。

从IT基础架构的角度看,最好选用分布式数据库读取数据,这就要求BI工具的数据性能要强,此外还要保证BI系统的稳定性与安全性。

但这一切都要基于一个好用的数据可视化平台。现在市面上流行的有FineBI、Power BI,但权威机构IDC指出市场占有率第1的还是FineBI,这些都可以做数据分析

原创文章,作者:745907710,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/219010.html

(0)
上一篇 2021年12月30日 16:27
下一篇 2021年12月30日 16:27

相关推荐

发表回复

登录后才能评论