记得我刚毕业那年,父母一直让我报考统计局,毕竟对于一名刚刚毕业的数学系应届生来说,铁饭碗的工作无疑是最好的选择。但是当我进入系统之后才发现,枯燥无味的工作根本提不起我的兴趣,升职加薪也不会落到我的头上,于是我总是想着出去看看外面的世界。
大约过了2年,当时网上的数据分析刚开始火起来,虽然跟我所学的专业毫不相关,但是直觉告诉我这是一个风口。于是我开始拿出空闲时间了解和学习数据分析,在学习了大约两个月后,我决定裸辞了稳定的工作,进入一家互联网公司做业务分析员。
后来一边工作一边学习,跳槽了2、3次,慢慢开始从业务员做到了数据分析师、数据挖掘师等等,我的工资也从原来的3k涨到了3w,成为了公司数据部门的leader。
数据问题频出,掌握好工具很重要
一开始做数据分析的时候,当然也犯了很多小白的错误:
不知道如何分析有价值的数据,不明白什么才是有价值的数据,领导不重视、同事不认可,最终变成了取数机器。
当初我每天的工作就是取数做报表,业务要拿什么数据、什么指标、什么报表,我就要写代码帮他们做个模板出来,日复一日,比之前的统计工作还要枯燥无味。
我几次都跟领导反映,领导都摇头说没办法,公司业务部门不会sql、不会取数,他们的需求只能让我们数据部门完成。IT部门本来工作就多,还要为业务取数服务,我提出让业务人员自己学会取数分析,解放一下我们IT的人力,领导却说学习成本太大,业务部门不会答应。
除了应对业务部门,我们IT部门内部的矛盾也是日益严重:
我们数据组觉得数据仓库里的数据口径太混乱了,而且当初是直接用的hive计算资源,取数速度实在是太慢了,不能支持大数据量,所以我们提出能不能换成性能更强的关系型数据库。
IT底层组却说公司用的数据仓库版本太老旧,很多数据只能做底层的ETL处理,所以只能简单做一层数据清洗给我们用,属于历史遗留问题,很难办。
除了IT和业务上的矛盾,还有一个最大的问题就是个人的数据分析能力:
在我当初做数据分析的时候,用的是Excel的数据透视表,但一旦面对大量的数据和复杂表格,根本就搞不定,做出来的可视化也很丑,没什么价值。后来学R语言又比较复杂,于是就想着有没有更加简单、功能强大的BI工具来代替。
于是我尝试了powerbi、FineBI这些工具,你会发现BI工具才是数据分析路上最必不可少的!
因为BI工具是完全按照数据分析的流程来设计的,先是数据处理、整理清洗,再到数据建模,最后数据可视化,展现图表,用图来讲故事,发掘问题影响决策。这些工具之间的差别也很大,经过不断尝试,我选择了FineBI一直到现在,至于原因且听我慢慢讲来。
一、数据整合+数据处理,解放IT
因为数据口径的问题,我们与数据底层部门没少发生矛盾,后来引入了FineBI之后,把数据源彻底打通,各个业务部门的数据都统一放入数据库,通过FineBI的ETL数据处理功能进行数据指标的梳理与清洗,IT底层人员的工作量大大减少。
而且FineBI不仅能够支持关系型数据库,而且还支持Oracle、SQLServer、MySQL等数据库,以及其他各种主流多维数据库,它采用的是自己的分布式连接方案,取数速度比以前快上不止一个等级。
此外,FineBI的ETL能力很让我意外,不仅是因为可以实现数据清洗,比如添加数据指标,而且操作十分简单,IT和业务都只需要简单的鼠标拖拽就能完成,数据合并、聚合、过滤、分组等等根本不需要编程基础,甚至比Excel还简单。
二、取数不必学sql,业务也能自主分析
以前业务总是苦于太依赖于IT,一旦分析需求有变化就要重新返工IT,而IT根本难以应付。而当引进了FineBI之后,业务人员现在可以自己进行取数分析了,完全剥离了IT的束缚实现了自助分析,效率自然是提高了好几倍。
FineBI实现自助分析的方法是通过自助数据集的方式,相当于一个数据容器,IT将清洗好的数据放入数据集中,如果业务觉得基础数据不满意,或者是需要进行跨表联用,就可以自主建立数据集,自己进行数据的加工处理。
这个过程当然也是通过鼠标点击来实现,不需要学习sql等编程,十分适合业务人员。
三、多维分析+数据可视化,实现BI展示
数据分析师是否能够得到有价值的结果,除了要求自己的业务思维与数据思维之外,BI工具的分析功能也是很重要的因素。FineBI除了拥有丰富的可视化图表之外,还可以制作出炫酷的dashboard,在领导面前展示自己的分析结果,事半功倍。
最重要的,是我们可以利用FineBI的联动、下钻、跳转等OLAP分析操作功能,结合业务思维,实现有价值的数据分析,而不是流于表面的拉表作图。
比如分析销售情况,我们可以用FineBI做出上图,先整体看当前这一阶段或这一时间段的销售目标完成情况。然后根据销售趋势图进行同比、环比分析,内部趋势跟自己之前的数据比较,外部趋势跟同行业其他企业的数据比较。
分析完宏观趋势之后,进行下钻切片分析:去对比区域店铺的情况,看找哪个区域店铺销售问题,同样也会对比区域店铺的销售同期环期。依次类推会下钻到品类、再到具体的单品。最后结合资源配置情况,找到异常数据的原因,提供最终的建议结果。
总结
数据分析之路漫漫,一个能真正解决你的问题的BI软件,才是最棒的工具;而一个能被自己得心应手的使用,并能提高自己能力的,才是最适合自己的工具。
原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/173463.html