作者介绍

杭州@阿坤

母婴电商行业数据分析师兼数据产品经理;

致力于研究电商行业的数据驱动增长,

以及数据产品从0到1的搭建;

“数据人创作者联盟” 成员。

01 数据分析简介

数据基础概念

先带大家看下以下三组内容,试着思考区别是什么:

  • 170
  • 170CM
  • 小明的身高是170CM

170是一个数值、170CM是一个带单位的数值、而小明的身高是170CM就是一个数据了。

数据的定义:数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。

数据分析定义:数据分析是一个从数据中通过分析手段发现业务价值并实现价值的过程。对于数据分析而言,很多同学会实现价值的过程忽略,认为数据分析是发现有价值的内容就已经结束的。但是能把事情落地并且实际产生了效益但是数据分析真正价值的体现。

接下来再讲一个数据分析的例子:

小明的身高很高!

这句话就是一个数据分析结论,那是怎么得出这个结论呢?小明的身高是170CM,那如何来判断小明的身高高不高呢?

  • 首先需要判断下小明的性别,男生和女生的判断标准可是大不相同的
  • 其次是年龄,10岁的小明、30岁的小明、90岁的小明身高的标准也不一致
  • 再是地区,北方和南方的差异也是比较大
  • 还有其他的一些细节,比如是否有什么疾病等等,明确判断标准后才能对小明的身高做出合理的判断。

这个就是生活的一个数据分析的例子,里面蕴含的就是数据分析的最常见也是最核心的思想。那在后面的内容中会带大家一起来学习如何进行数据分析。

数据分析过程

数据分析入门篇(一)_数据

数据分析的主要过程

上图就是数据分析中涉及到的主要流程,接下我们对每一步进行一个简单介绍:

数据获取:根据分析的目标,获取有用的数据。在这个阶段,必须明确一个分析目标,哪怕这个目标没有那么明确或者没有特别清洗,必须要有大致的方向。因为在中大型的公司当中,已拥有的数据已经是海量的,如果没有分析目标来限制,面对海量的各种各样的数据根本就是束手无策的。

数据清洗:数据清洗也就是我们常说的ETL的过程。主要包括异常数据的处理、缺失数据的处理、数据的一致性变换、编码的替换等等。

数据处理:相当于数据初处理过程,可以包括数据的简单汇总聚合,或者行列转变。以便于后期的统计建模的处理。

统计建模:用统计分析方法或机器学习算法对数据统计建模,以便描述业务现状或对未来进行预测。

分析结果呈现:把分析的结果以图、表等可视化方式简洁明了的呈现出来,重点是注明分析结论。很多同学会把这个阶段的重点误认为是可视化的展示,就会弄一推炫酷复杂的可视化图表,以提前自己数据分析的能力。但是这样反而陷入了误区,在这个阶段呈现结果不是目的,目的应该是让业务方对分析结果有充分的理解,保证双方的认知的一致性。其次,呈现的手段除了可视化之外,还有很重要的一点是沟通,并且这个沟通是也是双向,这样可以最大程度上保证数据和业务同时理解这个结果。

业务价值发现:数据分析师和业务同学共同基于分析结果发现对应的业务价值。但是这个发现的业务价值只有被业务同学认可才有可能实现。所以,此处的“发现”应该是数据分析师和业务同学的“共同认知”。

业务价值实现:业务价值的实现经常不被包含在数据分析过程中,很多数据分析师认为这一步是业务同学的责任,自己已经发现了可以执行的业务建议就已经很”牛逼了“。但是,业务价值现实才是数据分析的终极目的。因此,我认为业务价值的实现才是整个分析过程的最后一个阶段,这个阶段虽然主要是由业务人员掌控的,但是仍然需要数据分析师的深度参与。因为双方对于分析结果的理解和价值的发现经常出现偏差,需要在实践中逐步达到统一,并且最终也需要数据分析师把业务价值的落地效果通过数据展示出来。

通过上面数据分析过程的介绍,我们再来总结下数据分析的重点。

  • 明确分析目标
  • 分析过程是非单向的
  • 充分沟通
  • 分析没有重点

1.在开始做分析之前,首先要有分析目标!分析目标!分析目标!重要的事情说三遍。

2.数据分析的过程不是单向的,在后一个阶段中发现问题时可以跳回到前一阶段,数据分析过程不是一次性,而是不断循环往复的。

3.上一次分析过程的终点,可能是下一次分析过程的起点。我们经常会在业务价值发现和实现阶段发现新的分析主题,并把它作为下一次分析的起点。还有一点,对于任何一次数据分析来说,不是每个阶段都是必需进行的,很可能数仓做的很好,已经不需要数据清洗和数据处理的过程,或者报表做的很完善可以直接进入业务价值发现阶段。

4.整个数据分析过程中的大多数时间都需要分析师和业务人员的密切合作,尽可能的消除信息差带来的影响。

02 数据分析应用案例

接下来我们简单来看一下一个数据分析价值体现的案例。

数据分析入门篇(一)_数据_02

某App首页改版前后UI图

经过数据分析后发现,首页的banner位置占据着首页最明显的位置,带来的销售价值缺失最低的。通过横向对比首页的其他模块,banner位置的点击率是最低的,并且该区域的曝光价值也是最低的。中间的类目导航金刚区是曝光价值是最高的。

因此决定对首页的进行优化,由于banner还起到一些气氛烘托的作用,因此直接干掉这个资源位也不合适,因此觉得把首焦banner改造成竖版banner,并且放在类目导航金刚区的下面。并且对这次改版进行了AB测试。

数据分析入门篇(一)_数据_03

此次改版的AB测试结果如上图所示,展示的数据都经过了脱敏处理。从数据结果来此次首页优化效果比较明显,全量后每天大约能提升销售额10W+。

03 最后

关于数据分析入门篇之数据分析过程到这里就是结果,数据分析的魅力在用较小的成本就可能带来巨大的业务价值。这一点在互联网行业当中尤为明显。之后还会给大家带来数据分析入门的其他部分,大家敬请期待哦!