咱今天就来讲讲假设检验这事儿,这对数据分析、质量管理还有做研究的朋友来说绝对绕不开。很多人老是干巴巴地记P值小于0.05就拒绝原假设,其实心里都没底;面对不一样的数据源,到底是该选T检验还是卡方检验也搞不清楚;做回归分析就盯着R²看,完全把失拟项和弯曲项检验给忘了。今天咱就把这门课里的核心知识一锅端出来,从P值怎么看一直讲到方法怎么挑,学完就能上手干活。 先把P值的判断逻辑理顺了。看下面这张表就够了。一般来说,P值要是小于咱们通常定的0.05这个显著性水平,那咱就把原假设给否定了。不管是数据正态性检验还是相关系数、回归分析、测量系统、列联表这些场景,只要P值这么小,基本都说明事儿了。 最让人头疼的不是怎么算这些数值,而是到底该选哪种检验方法。记住这三步就行了:第一步看总体有几个样本(是一个还是好几个),第二步看要检验的是均值、方差还是比率这些指标,第三步再看看数据分布是不是正态的。 要是只有一组数据做单总体检验的话: 检验均值的时候,如果δ已知用单样本Z检验,δ未知就用单样本T检验; 检验方差只要看图形或者求个置信区间就行; 检验比率用单比率检验看看合格率啥的; 检验位数要是非正态就用单样本符号检验或者Wilcoxon符号秩检验。 要是有两组数据做双总体检验: 比较均值差异有独立样本双样本T检验和配对样本T检验; 方差的话正态分布用F检验或者双方差检验,任意分布就用Levene检验; 比率用双比率检验比较通过率; 位数非正态分布的话用Mann-Whitney检验。 要是有三组或者更多数据做多总体检验: 比较均值方差相等的时候用方差分析ANOVA,不等的时候用Welchs; 方差齐性正态分布用Bartlett检验,任意分布用Levene检验; 比率就用交叉分组表和卡方检验或者卡方双向表; 位数非正态分布用Kruskal-Wallis检验或者Mood中位数检验。 这里面有几个坑得注意躲开: 误区一:直接上T检验不验正态性。正确做法是先用Anderson-Darling这种正态性检验,P值要是小于0.05说明数据不对头,就得换非参数的Mann-Whitney检验来做。 误区二:回归光看R²不管模型好不好看。效应项P值小说明模型有效,但失拟项P值小说明拟合得不行要重修模;弯曲项P值小就得加高阶项进去调整。 误区三:多组比较老用多次T检验会出错。得用ANOVA一次性搞掂然后再用Tukey法事后检验看是哪两组有差异。因为老用T检验会把第一类错误的概率搞高。 下面咱们实战举两个例子: 案例1:看看新工艺是不是把合格率从85%提升到90%。这是单总体检验的事儿,类型是比率。用单比率检验一算结果P值小于0.05,咱们就把原来的假设给拒绝了。结论就是新工艺确实把合格率给提上来了。 案例2:比比A、B、C三个供应商产品尺寸的稳定性。这是多总体检验方差的事儿。假设数据是正态分布的话用Bartlett检验一看结果P值小于0.05,说明方差不全相等这三家供应商的稳定性不太一样。接着还得再做事后检验去看看到底哪家最稳当。