p值小于0.05就拒绝原假设，其实心里都没底

咱今天就来讲讲假设检验这事儿，这对数据分析、质量管理还有做研究的朋友来说绝对绕不开。很多人老是干巴巴地记P值小于0.05就拒绝原假设，其实心里都没底；面对不一样的数据源，到底是该选T检验还是卡方检验也搞不清楚；做回归分析就盯着R²看，完全把失拟项和弯曲项检验给忘了。今天咱就把这门课里的核心知识一锅端出来，从P值怎么看一直讲到方法怎么挑，学完就能上手干活。先把P值的判断逻辑理顺了。看下面这张表就够了。一般来说，P值要是小于咱们通常定的0.05这个显著性水平，那咱就把原假设给否定了。不管是数据正态性检验还是相关系数、回归分析、测量系统、列联表这些场景，只要P值这么小，基本都说明事儿了。最让人头疼的不是怎么算这些数值，而是到底该选哪种检验方法。记住这三步就行了：第一步看总体有几个样本（是一个还是好几个），第二步看要检验的是均值、方差还是比率这些指标，第三步再看看数据分布是不是正态的。要是只有一组数据做单总体检验的话：检验均值的时候，如果δ已知用单样本Z检验，δ未知就用单样本T检验；检验方差只要看图形或者求个置信区间就行；检验比率用单比率检验看看合格率啥的；检验位数要是非正态就用单样本符号检验或者Wilcoxon符号秩检验。要是有两组数据做双总体检验：比较均值差异有独立样本双样本T检验和配对样本T检验；方差的话正态分布用F检验或者双方差检验，任意分布就用Levene检验；比率用双比率检验比较通过率；位数非正态分布的话用Mann-Whitney检验。要是有三组或者更多数据做多总体检验：比较均值方差相等的时候用方差分析ANOVA，不等的时候用Welchs；方差齐性正态分布用Bartlett检验，任意分布用Levene检验；比率就用交叉分组表和卡方检验或者卡方双向表；位数非正态分布用Kruskal-Wallis检验或者Mood中位数检验。这里面有几个坑得注意躲开：误区一：直接上T检验不验正态性。正确做法是先用Anderson-Darling这种正态性检验，P值要是小于0.05说明数据不对头，就得换非参数的Mann-Whitney检验来做。误区二：回归光看R²不管模型好不好看。效应项P值小说明模型有效，但失拟项P值小说明拟合得不行要重修模；弯曲项P值小就得加高阶项进去调整。误区三：多组比较老用多次T检验会出错。得用ANOVA一次性搞掂然后再用Tukey法事后检验看是哪两组有差异。因为老用T检验会把第一类错误的概率搞高。下面咱们实战举两个例子：案例1：看看新工艺是不是把合格率从85%提升到90%。这是单总体检验的事儿，类型是比率。用单比率检验一算结果P值小于0.05，咱们就把原来的假设给拒绝了。结论就是新工艺确实把合格率给提上来了。案例2：比比A、B、C三个供应商产品尺寸的稳定性。这是多总体检验方差的事儿。假设数据是正态分布的话用Bartlett检验一看结果P值小于0.05，说明方差不全相等这三家供应商的稳定性不太一样。接着还得再做事后检验去看看到底哪家最稳当。