3分钟，看懂假设检验

大家好，我是爱学习的小xiong熊妹。

今天来说说假设检验。这是个古老的方法，近年ABtest大行其道，使假设检验方法迎来了新一波文艺复兴，搞得很多小伙伴都在问：如何做假设检验？那一堆似懂非懂的统计符号啥意思？

今天小熊妹帮大家整理了一个懒人攻略，大家抄起来用即可。可能有描述不准确的地方，大神们勿喷哦。

一、假设检验是干什么的？

假设检验最常见的场景有两个：

3分钟，看懂假设检验_统计学_02

总之是吵架必备，怼人利器。

当错误很明显的时候，不需要做假设检验。比如销售、运营的表现不好，可以直接取过往X天的销售业绩、运营指标来看。如果销售业绩一直下滑，还有啥好说的，这时候不需要假设检验，直接开怼。

有些问题不那么明显，比如上边吐槽的产品寿命问题。除非产品用到烂，否则不知道寿命是多少。而当用户遇到产品寿命很短的问题的时候，他们只会默默换牌子，也很少投诉“不耐用”。此时必须做抽样检测，就得用到假设检验方法。

在论证新点子很好的时候，也需要先把新点子做出来，再做小范围测试。此时也要用假设检验方法。总之，假设检验方法适合于抽样检验/小范围测试的场景。

众所周知：证伪比证真容易多了。证真要穷尽各种可能，证伪只要找到反例即可。假设检验的基本思路也是如此，它利用了“小概率事件，不可能在一次小范围抽样中发生”的朴素原理，先提一个假设，之后看能否用小概率事件推翻它。能推翻的，就说明假设不成立；不能推翻，就至少说明不能推翻（是否接受假设，可以再验证）。

基于这个原理，我们一般把要怼翻的结论，作为原假设。然后试着去怼翻它！（如下图）

3分钟，看懂假设检验_统计学_03

很多小伙伴在这里犯迷糊：到底原假设是啥？最简单的判断方法，就是：想怼翻什么，就把什么放原假设（记得带等号的一定在原假设）。不过实践的时候，还是经常会写错，这里需要多加练习才行。

设定原假设以后，还要设定“小概率事件”到底有多小。一般用显著性水平α来表示。α是一个人工给定的数，一般给0.10,0.05,0,01看起来够小就行。

得到假设后，需要选择合适的检验统计量，代入参数，计算是否属于小概率事件。

检验统计量，和要检验的假设有关系。比如上述产品使用寿命问题，是一个典型的单总体（只有一个产品要检验）+均值（使用寿命，指的是待检测产品的平均寿命）检验问题，因此可以选用t检验。如果是比例检验问题（比如检验产品的合格率，合格率=问题样本/全部抽检样本），则可以使用Z统计量（如下图）

3分钟，看懂假设检验_数据分析_04

有了统计量以后，可以检验是否属于小概率事件。不同的假设，拒绝不同

3分钟，看懂假设检验_数据分析_05

关于拒绝区域，有个简单的记忆方法，就是：

这样就容易区分了

当然，有很多统计软件/算法直接给了P值，大家记得：P值小于0.05就拒绝原假设即可。

某产品经理宣称，目标用户80%都是年轻人（25岁以下），现随机抽样200人，发现146名年龄在25岁以下，问：我们能怼翻产品经理的结论不？

解答过程如下：

3分钟，看懂假设检验_数据分析_06

原假设被拒绝掉了，我们可以认为产品经理在吹逼，打完收工！

实际上，假设检验的类型很丰富。为了小伙伴们理解方便，上边举的是最简单的单总体问题。单总体问题，常见于已经有了一个预设结论，之后推翻这个结论的情况。比如证明新版本A比老版本的数据好看。

我们常说的ABtest，如果是真的是设计两个版本A版和B版，之后再检验AB版的区别，则涉及2个总体的均值/比例检验，需要用到不同的统计量。

以上检验均值/比例的方法，统称参数检验，还有非参数检验，比如检验身高和体重之间是否有关系。这些方法在实际工作中有不同的应用场景，之后再慢慢介绍吧。

今天的分享就到这里，如果没听懂也没关系，后续小熊妹还是会努力讲清楚的。喜欢的话，记得转发+在看+点赞，支持下小熊妹哦，谢谢大家。

原创文章，作者：奋斗，如若转载，请注明出处：https://blog.ytso.com/155078.html