第5章 统计推断

5.1 导论

  • 定义 用需要考虑不确定度的含噪音的统计学数据推断事实
  • 工具 随机化 随机采样 采样模型 假设检验 置信区间 概率模型 实验设计 bootstraping 排列交换随机
  • 类型
    • 频率派 使用概率的频率解释来控制错误率
    • 贝叶斯派 给定概率与数据概率哪个靠谱

5.2 概率

  • 术语
    • 样本空间 Ω
    • 事件 样本空间子集 E
    • 单独事件 ω
    • 空事件 ∅
    • ω∈E ω发生E发生
    • ω∉E ω发生E不发生
    • E⊂F E发生则F发生
    • E∩F EF一起发生
    • E∪F EF中至少一个发生
    • E∩F=∅ EF互斥
    • E^c\bar E E不发生
  • 概率
    1. 对事件 E\subset \Omega, 0 \leq P(E) \leq 1
    2. P(\Omega) = 1
    3. 如果 E_1E_2 互斥 有P(E_1 \cup E_2) = P(E_1) + P(E_2).
    4. 概率无限可加性 P(\cup_{i=1}^n A_i) = \sum_{i=1}^n P(A_i)
    5. P(\emptyset) = 0
    6. P(E) = 1 - P(E^c)
    7. P(A \cup B) = P(A) + P(B) - P(A \cap B)
    8. 如果 A \subset BP(A) \leq P(B)
    9. P\left(A \cup B\right) = 1 - P(A^c \cap B^c)
    10. P(A \cap B^c) = P(A) - P(A \cap B)
    11. P(\cup_{i=1}^n E_i) \leq \sum_{i=1}^n P(E_i)
    12. P(\cup_{i=1}^n E_i) \geq \max_i P(E_i)
  • 随机变量
    • 实验的数值输出
    • 离散随机变量取可数的概率 P(X = k)
    • 连续随机变量取连续区间子集概率 P(X \in A)
  • 概率质量函数(PMF)<- 离散随机变量
    1. 对于所有 x p(x) \geq 0
    2. \sum_{x} p(x) = 1
  • 概率密度函数(PDF)<- 连续随机变量
    1. 对于所有 x f(x) \geq 0
    2. f(x) 下面积为1
  • 累计概率函数(CDF)
    • 定义 F(x) = P(X \leq x)
    • 生存函数 S(x) = P(X > x) S(x) = 1 - F(x)
    • 对于连续函数 CDF是PDF的积分
  • 分位数 \alpha^{th}
    • F(x_\alpha) = \alpha
    • 50^{th} 分位数是中位数

5.3 期望

  • 离散随机变量均值 E[X] = \sum_x xp(x)

  • E[X] 代表质量与位置的中心 \{x, p(x)\}

  • 连续随机变量均值 E[X] = \mbox{the area under the function}~~~ t f(t)

  • 期望值是线性可加的

  • 如果 ab 不随机 XY 是随机变量

    • E[aX + b] = a E[X] + b
    • E[X + Y] = E[X] + E[Y]
  • 样本均值是总体均值\mu的无偏估计的证明

    \begin{eqnarray*} E\left[ \frac{1}{n}\sum_{i=1}^n X_i\right] & = & \frac{1}{n} E\left[\sum_{i=1}^n X_i\right] \\ & = & \frac{1}{n} \sum_{i=1}^n E\left[X_i\right] \\ & = & \frac{1}{n} \sum_{i=1}^n \mu = \mu. \end{eqnarray*}

5.4 方差

  • 描述随机变量的离散情况
  • 如果 X 是均值 \mu 的随机变量 其方差为Var(X) = E[(X - \mu)^2]
  • 离开均值距离期望的平方
  • 计算公式 Var(X) = E[X^2] - E[X]^2
  • 如果 a 是常数有 Var(aX) = a^2 Var(X)
  • 方差的开方是标准差 单位与 X 一致
  • 车比雪夫不等式(Chebyshev’s inequality)边界极为保守 P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2}

5.5 独立性

  • 独立事件

    • 两事件 ABP(A \cap B) = P(A)P(B) 下独立
    • P([X \in A] \cap [Y \in B]) = P(X\in A)P(Y\in B) 下两随机变量 XY 独立
    • 对于一组随机独立变量X_1, X_2, \ldots, X_nf(x_1,\ldots, x_n) = \prod_{i=1}^n f_i(x_i)
    • iid随机变量(independent and identically distributed) 来自同一分布相互独立的随机变量
  • 协方差(covariance)

    • Cov(X, Y) = E[(X - \mu_x)(Y - \mu_y)] = E[X Y] - E[X]E[Y]
    • Cov(X, Y) = Cov(Y, X)
    • Cov(X, Y) 可以有正负
    • |Cov(X, Y)| \leq \sqrt{Var(X) Var(y)}
  • 相关性(correlation)

    • XY 的相关性 Cor(X, Y) = Cov(X, Y) / \sqrt{Var(X) Var(y)}
    • -1 \leq Cor(X, Y) \leq 1
    • 只有对常数 ab满足 X = a + bYCor(X, Y) = \pm 1
    • Cor(X, Y) 无单位
    • Cor(X, Y) = 0XY 不相关
    • Cor(X,Y) 越接近1 XY 越正相关 反之接近-1 负相关
    • \{X_i\}_{i=1}^n 是一组随机变量 当 \{X_i\} 不相关时 Var\left(\sum_{i=1}^n a_i X_i + b\right) = \sum_{i=1}^n a_i^2 Var(X_i)
    • 如果一组随机变量\{X_i\}不相关 方差的和等于和的方差 非标准差
  • 样本均值方差的推导

    \begin{eqnarray*} Var(\bar X) & = & Var \left( \frac{1}{n}\sum_{i=1}^n X_i \right)\\ \\ & = & \frac{1}{n^2} Var\left(\sum_{i=1}^n X_i \right)\\ \\ & = & \frac{1}{n^2} \sum_{i=1}^n Var(X_i) \\ \\ & = & \frac{1}{n^2} \times n\sigma^2 \\ \\ & = & \frac{\sigma^2}{n} \end{eqnarray*}

    • X_i 独立且方差为 Var(\bar X) = \frac{\sigma^2}{n}
    • \sigma/\sqrt{n} 为样本均值的标准误
    • 样本均值的标准误就是样本均值分布的标准差
    • \sigma 是一次观察分布的标准差
    • 样本均值要比一次观察变化小 因此除以\sqrt{n}
  • 样本方差

    • S^2 = \frac{\sum_{i=1}^n (X_i - \bar X)^2}{n-1}
    • 总体方差 \sigma^2的估计
    • 计算 \sum_{i=1}^n (X_i - \bar X)^2 = \sum_{i=1}^n X_i^2 - n \bar X^2
    • 均值偏差平方的均值
    • 样本方差是总体方差的无偏估计

    \begin{eqnarray*} E\left[\sum_{i=1}^n (X_i - \bar X)^2\right] & = & \sum_{i=1}^n E\left[X_i^2\right] - n E\left[\bar X^2\right] \\ \\ & = & \sum_{i=1}^n \left\{Var(X_i) + \mu^2\right\} - n \left\{Var(\bar X) + \mu^2\right\} \\ \\ & = & \sum_{i=1}^n \left\{\sigma^2 + \mu^2\right\} - n \left\{\sigma^2 / n + \mu^2\right\} \\ \\ & = & n \sigma^2 + n \mu ^ 2 - \sigma^2 - n \mu^2 \\ \\ & = & (n - 1) \sigma^2 \end{eqnarray*}

  • 澄清

    • 假定 X_i 是 iid 均值 \mu 方差 \sigma^2
    • S^2 估计 \sigma^2
    • S^2 的计算涉及除 n-1
    • S / \sqrt{n} 估计 \sigma / \sqrt{n} 是均值的标准误

5.6 条件概率

  • B 为一个事件 有 P(B) > 0
  • B 出现条件下 A 的条件概率为 P(A ~|~ B) = \frac{P(A \cap B)}{P(B)}
  • 如果 AB 独立 有 P(A ~|~ B) = \frac{P(A) P(B)}{P(B)} = P(A)

5.7 贝叶斯定理

P(B ~|~ A) = \frac{P(A ~|~ B) P(B)}{P(A ~|~ B) P(B) + P(A ~|~ B^c)P(B^c)}.

  • 2*2 列联表 - 诊断测试

5.8 常见分布

  • 贝努力分布
    • 二元输出变量
    • 数值为0或1 概率p1-p
    • X的PMF是P(X = x) = p^x (1 - p)^{1 - x}
    • 均值 p 方差 p(1 - p)
    • 如果有iid的贝努力观察x_1,\ldots, x_n 似然函数 \prod_{i=1}^n p^{x_i} (1 - p)^{1 - x_i} = p^{\sum x_i} (1 - p)^{n - \sum x_i}
    • 似然函数依赖x_i的和 \sum_i x_i / n 包含了所有 p 的可能性
    • 最大化似然函数可以得到 p 的估计
  • 二项分布
    • PMF P(X = x) = \left( \begin{array}{c} n \\ x \end{array} \right) p^x(1 - p)^{n-x} 对于 x=0,\ldots,n
  • 正态分布
    • PDF (2\pi \sigma^2)^{-1/2}e^{-(x - \mu)^2/2\sigma^2}
    • X 为均值 E[X] = \mu 方差 Var(X) = \sigma^2 的iid随机变量
    • 写作X\sim \mbox{N}(\mu, \sigma^2)
    • 均值 \mu = 0 方差 \sigma = 1 是标准正态分布
    • 标准正态函数写作 \phi
    • 标准正态随机变量用 Z 表示
    • 如果 X \sim \mbox{N}(\mu,\sigma^2) 并且 Z = \frac{X -\mu}{\sigma} 是标准正态函数
    • 如果 Z 是标准正态函数 X = \mu + \sigma Z \sim \mbox{N}(\mu, \sigma^2)
    • 非标准正态密度函数 \phi\{(x - \mu) / \sigma\}/\sigma
    • 正态似然函数对方差的估计是有偏的
    • 正态的和是正态 样本均值正态
    • 正态的平方是卡方
    • 正态分布
  • 泊松分布
    • PMF P(X = x; \lambda) = \frac{\lambda^x e^{-\lambda}}{x!}
    • 均值方差均为 \lambda
    • 可看做很短时间间隔中发生事件的概率 模拟速率 其中\lambda * h小于1 则各时间段独立
    • X \sim Poisson(\lambda t) \lambda = E[X / t]是速率 t 是总时间
    • np 小是对二项分布的模拟
    • X \sim \mbox{Binomial}(n, p), \lambda = n p

5.9 渐进

  • 样本接近无穷大时统计量的行为
  • 频率派的基石
  • 大数理论(LLN) 样本数量越多 均值接近期望
  • 中心极限理论 (CLT) iid 变量均值的分布标准化后随样本数增加接近标准正态分布 \frac{\bar X_n - \mu}{\sigma / \sqrt{n}} = \frac{\mbox{Estimate} - \mbox{Mean of estimate}}{\mbox{Std. Err. of estimate}}
  • 可根据变量分布来 知道均值 方差 计算出样本均值标准误 就可以根据CLT计算逼近的统计量
  • 置信区间
    • 根据CLT随机区间\bar X_n \pm z_{1-\alpha/2}\sigma / \sqrt{n} 包括 \mu 的概率逼近于 100(1-\alpha)% z_{1-\alpha/2}为标准正态分布1-\alpha/2的分位数 100(1 - \alpha)% 为置信区间 \sigma 可用样本估计 s 来近似
    • 估计是基于分布假设的 如果分布有解析解 则置信区间可以更准确的得到估计
    • 先生成不依赖参数的统计量
    • 根据统计量的概率分布计算参数的边界

5.10 置信区间

  • 卡方分布
    • 假定 S^2 是来自n个 iid N(\mu,\sigma^2) 数据样本的方差 有\frac{(n - 1) S^2}{\sigma^2} \sim \chi^2_{n-1} 符合自由度n-1的卡方分布
    • 不对称分布
    • 均值是自由度 方差是两倍的自由度
    • 方差的置信区间

\begin{eqnarray*} 1 - \alpha & = & P \left( \chi^2_{n-1, \alpha/2} \leq \frac{(n - 1) S^2}{\sigma^2} \leq \chi^2_{n-1,1 - \alpha/2} \right) \\ \\ & = & P\left(\frac{(n-1)S^2}{\chi^2_{n-1,1-\alpha/2}} \leq \sigma^2 \leq \frac{(n-1)S^2}{\chi^2_{n-1,\alpha/2}} \right) \\ \end{eqnarray*}

  • \left[\frac{(n-1)S^2}{\chi^2_{n-1,1-\alpha/2}}, \frac{(n-1)S^2}{\chi^2_{n-1,\alpha/2}}\right]\sigma^2100(1-\alpha)\% 置信区间

  • 依赖正态性假设 开方后得到 \sigma 的置信区间

  • Gosset的 t 分布

    • 比正态分布尾厚
    • 考虑自由度 自由度大时接近正态分布
    • \frac{Z}{\sqrt{\frac{\chi^2}{df}}}
    • 假定 (X_1,\ldots,X_n) 是 iid N(\mu,\sigma^2)\frac{\bar X - \mu}{\sigma / \sqrt{n}} 是标准正态分布 \sqrt{\frac{(n - 1) S^2}{\sigma^2 (n - 1)}} = S / \sigma 是卡方除以自由度的开方
    • \frac{\frac{\bar X - \mu}{\sigma /\sqrt{n}}}{S/\sigma} = \frac{\bar X - \mu}{S/\sqrt{n}} 服从自由度n-1t分布
    • 均值的置信区间

    \begin{eqnarray*} & & 1 - \alpha \\ & = & P\left(-t_{n-1,1-\alpha/2} \leq \frac{\bar X - \mu}{S/\sqrt{n}} \leq t_{n-1,1-\alpha/2}\right) \\ \\ & = & P\left(\bar X - t_{n-1,1-\alpha/2} S / \sqrt{n} \leq \mu \leq \bar X + t_{n-1,1-\alpha/2}S /\sqrt{n}\right) \end{eqnarray*}

    t_{df,\alpha} 是t分布的 \alpha^{th} 分位数 自由度 df

    • t检验不适合有偏分布 置信区间中心也不在均值上

5.11 似然函数

  • 一组数据的似然函数是数据固定下参数的联合概率密度函数
  • 似然函数可用来估计参数 是参数的函数
  • 似然函数比估计两个可能参数值的可能性
  • 给定模型与数据 似然函数包含所有参数可能性
  • 样本独立时 参数的似然函数是各独立样本似然函数的乘积
  • 参数使似然函数概率取最大值时真实的可能性更大 更支持这组数据 这个估计是最大似然估计(MLE)

5.12 贝叶斯推断

  • \mbox{Posterior} \propto \mbox{Likelihood} \times \mbox{Prior}
  • 先验beta分布
    • 01之间
    • 依赖 \alpha \beta 的概率密度函数

\frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\Gamma(\beta)} p ^ {\alpha - 1} (1 - p) ^ {\beta - 1} ~~~~\mbox{for} ~~ 0 \leq p \leq 1

  • 均值 \alpha / (\alpha + \beta)
  • 方差 \frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)}
  • \alpha = \beta = 1 为均匀分布
  • 后验beta分布
    • 参数\tilde \alpha = x + \alpha \tilde \beta = n - x + \beta 的beta分布

\begin{align} \mbox{Posterior} &\propto p^x(1 - p)^{n-x} \times p^{\alpha -1} (1 - p)^{\beta - 1} \\ & = p^{x + \alpha - 1} (1 - p)^{n - x + \beta - 1} \end{align}

  • 后验均值

\begin{align} E[p ~|~ X] & = \frac{\tilde \alpha}{\tilde \alpha + \tilde \beta}\\ \\ & = \frac{x + \alpha}{x + \alpha + n - x + \beta}\\ \\ & = \frac{x + \alpha}{n + \alpha + \beta} \\ \\ & = \frac{x}{n} \times \frac{n}{n + \alpha + \beta} + \frac{\alpha}{\alpha + \beta} \times \frac{\alpha + \beta}{n + \alpha + \beta} \\ \\ & = \mbox{MLE} \times \pi + \mbox{Prior Mean} \times (1 - \pi) \end{align}

  • 后验均值是先验均值与最大似然估计的混合
  • n 变大 \pi 接近 1 先验作用小
  • n 很小 先验作用大
  • 当数据量够大时 先验概率作用就很小了
  • 当先验概率足够稳定 数据就作用不大了
  • 信任区间
    • 95\% 信任区间 [a, b] 会满足P(p \in [a, b] ~|~ x) = .95
    • 最高后验密度 (HPD) 区间

5.13 两独立样本t检验

  • X_1,\ldots,X_{n_x} 为 iid N(\mu_x,\sigma^2)

  • Y_1,\ldots,Y_{n_y} 为 iid N(\mu_y, \sigma^2)

  • \bar X, \bar Y, S_x, S_y 为均值与标准差

  • 根据均值与方差的线性组合 有 \bar Y - \bar X 也是正态 均值 \mu_y - \mu_x 方差 \sigma^2 (\frac{1}{n_x} + \frac{1}{n_y})

  • 混合方差为 S_p^2 = \{(n_x - 1) S_x^2 + (n_y - 1) S_y^2\}/(n_x + n_y - 2)\sigma^2的良好估计

  • 该估计为无偏估计

    \begin{eqnarray*} E[S_p^2] & = & \frac{(n_x - 1) E[S_x^2] + (n_y - 1) E[S_y^2]}{n_x + n_y - 2}\\ & = & \frac{(n_x - 1)\sigma^2 + (n_y - 1)\sigma^2}{n_x + n_y - 2} \end{eqnarray*}

  • 该估计独立于 \bar Y - \bar X 因为方差独立于均值

  • 两个独立的卡方变量之和是自由度之和的卡方值

    \begin{eqnarray*} (n_x + n_y - 2) S_p^2 / \sigma^2 & = & (n_x - 1)S_x^2 /\sigma^2 + (n_y - 1)S_y^2/\sigma^2 \\ \\ & = & \chi^2_{n_x - 1} + \chi^2_{n_y-1} \\ \\ & = & \chi^2_{n_x + n_y - 2} \end{eqnarray*}

  • 构建统计量 \frac{\frac{\bar Y - \bar X - (\mu_y - \mu_x)}{\sigma \left(\frac{1}{n_x} + \frac{1}{n_y}\right)^{1/2}}}{\sqrt{\frac{(n_x + n_y - 2) S_p^2}{(n_x + n_y - 2)\sigma^2}}} = \frac{\bar Y - \bar X - (\mu_y - \mu_x)}{S_p \left(\frac{1}{n_x} + \frac{1}{n_y}\right)^{1/2}}

  • 该统计量为符合自由度 n_x + n_y - 2t 分布

  • 置信区间 \bar Y - \bar X \pm t_{n_x + n_y - 2, 1 - \alpha/2}S_p\left(\frac{1}{n_x} + \frac{1}{n_y}\right)^{1/2}

  • 方差不等 \bar Y - \bar X \sim N\left(\mu_y - \mu_x, \frac{s_x^2}{n_x} + \frac{s_y^2}{n_y}\right)

  • 统计量 \frac{\bar Y - \bar X - (\mu_y - \mu_x)}{\left(\frac{s_x^2}{n_x} + \frac{s_y^2}{n_y}\right)^{1/2}} 近似于自由度 \frac{\left(S_x^2 / n_x + S_y^2/n_y\right)^2} {\left(\frac{S_x^2}{n_x}\right)^2 / (n_x - 1) + \left(\frac{S_y^2}{n_y}\right)^2 / (n_y - 1)} t分布

5.14 假设检验

  • 使用数据做决定
  • 空假设 H_0 无变化
  • 备择假设 H_a 或大 或小 或不等
  • 真值表
Truth Decide Result
H_0 H_0 Correctly accept null
H_0 H_a Type I error
H_a H_a Correctly reject null
H_a H_0 Type II error
  • Z检验
    • Z检验 H_0:\mu = \mu_0
      • H_1: \mu < \mu_0
      • H_2: \mu \neq \mu_0
      • H_3: \mu > \mu_0
    • 检验统计量 TS = \frac{\bar{X} - \mu_0}{S / \sqrt{n}}
    • 拒绝空假设条件
      • TS \leq -Z_{1 - \alpha}
      • |TS| \geq Z_{1 - \alpha / 2}
      • TS \geq Z_{1 - \alpha}
    • 样本数要足够 否则选 t 检验
    • 通过 \alpha 控制了 Type I error 但没控制 \beta Type II error 所以结论为没有拒绝 H_0 而不是接受 H_0
    • 拒绝 H_0 的值域为拒绝域
  • 二项分布不易做正态假设可精确计算拒绝域

5.15 P值

  • 假定没有事发生 出现状况的可能性
  • 先定义分布 然后计算相关统计量 对比常见阈值看数值是否够极端
  • 阈值为达到显著性水平 与p值有区别
  • p值可设定任意显著性水平 小于就可以拒绝
  • 两尾检验 单尾概率翻倍
  • 独立于假设检验 但常常一起使用

5.16 功效

  • 错误拒绝空假设的概率为功效(power)
  • Power = 1 - \beta 对 Type II error 的控制
  • 正态分布假设下的推导

\begin{align} 1 -\beta & = P\left(\frac{\bar X - 30}{\sigma /\sqrt{n}} > z_{1-\alpha} ~|~ \mu = \mu_a \right)\\ & = P\left(\frac{\bar X - \mu_a + \mu_a - 30}{\sigma /\sqrt{n}} > z_{1-\alpha} ~|~ \mu = \mu_a \right)\\ \\ & = P\left(\frac{\bar X - \mu_a}{\sigma /\sqrt{n}} > z_{1-\alpha} - \frac{\mu_a - 30}{\sigma /\sqrt{n}} ~|~ \mu = \mu_a \right)\\ \\ & = P\left(Z > z_{1-\alpha} - \frac{\mu_a - 30}{\sigma /\sqrt{n}} ~|~ \mu = \mu_a \right)\\ \\ \end{align}

sigma <- 10; mu_0 = 0; mu_a = 2; n <- 100; alpha = .05
plot(c(-3, 6),c(0, dnorm(0)), type = "n", frame = F, xlab = "Z value", ylab = "")
xvals <- seq(-3, 6, length = 1000)
lines(xvals, dnorm(xvals), type = "l", lwd = 3)
lines(xvals, dnorm(xvals, mean = sqrt(n) * (mu_a - mu_0) / sigma), lwd =3)
abline(v = qnorm(1 - alpha))

- 计算步骤 - 考虑 H_0 : \mu = \mu_0H_a : \mu > \mu_0 且在H_a\mu = \mu_a - 在 H_0 下统计量 Z = \frac{\sqrt{n}(\bar X - \mu_0)}{\sigma} 符合 N(0, 1) - 在H_aZN\left( \frac{\sqrt{n}(\mu_a - \mu_0)}{\sigma}, 1\right) - 如果 Z > Z_{1-\alpha} 拒绝空假设 也就是给定条件下功效不够 - 当检验 H_a : \mu > \mu_0, 如果功效为 1 - \beta 那么 1 - \beta = P\left(Z > z_{1-\alpha} - \frac{\mu_a - \mu_0}{\sigma /\sqrt{n}} ~|~ \mu = \mu_a \right) = P(Z > z_{\beta}) 也就是 z_{1-\alpha} - \frac{\sqrt{n}(\mu_a - \mu_0)}{\sigma} = z_{\beta} - \mu_a, \sigma, n, \beta, \mu_0, \alpha 给定五个可解出剩余的 - 两尾检验考虑 \alpha / 2 - 功效在 \alpha 提高 单尾检验功效高于两尾 \mu_1 距离 \mu_0 远功效大 样本数提高功效高 - 计算功效不需要特定样本 只需要指定 \frac{\mu_a - \mu_0}{\sigma} 也就是有效样本大小 无单位 - R 中使用 power.t.test 来计算 t 检验功效相关参数 指定多数求一个

5.17 多重比较

  • 多次进行比较会导致错误率与校正出现问题
  • False positive rate 错误结果是显著的比率 \alpha 样本数增大错误增加
  • Family wise error rate (FWER) 所有比较中至少一个假阳性比率
    • Bonferroni correction
    • 假设你进行m次测试 控制 \alpha 在某水平 计算所有测试的 p 值 将 \alpha 设为 \frac{\alpha}{m} 所有测试都在这个置信度下进行
    • 容易计算 过于保守
  • False discovery rate (FDR) 声称显著是错误的概率
    • m 次测试 水平 \alpha 计算 p
    • 排序 P_{(i)} \leq \alpha \times \frac{i}{m} 为显著
    • 相对容易计算 不保守 允许一定的假阳性
  • 调节p值
    • P_i^{fwer} = \max{m \times P_i,1} 类似FWER处理 \alpha 的方式处理 p 按照正常 \alpha 检测
  • 一般情况对 p 值用 bonferroni/BH矫正就够了
  • 对比间依赖强烈考虑 method=“BY”
  • 多重比较从原理到应用 从实用角度分类 适合常见科研实验结果处理

5.18 重采样推断

  • jackknife
    • 用来无偏估计偏差与标准误
    • 每次估计删掉一个数据 \bar \theta = \frac{1}{n}\sum_{i=1}^n \hat \theta_{i}
    • 偏差 (n - 1) \left(\bar \theta - \hat \theta\right)
    • 标准误 \left[\frac{n-1}{n}\sum_{i=1}^n (\hat \theta_i - \bar\theta )^2\right]^{1/2}
    • 可用来估计分位数 是bootstrap的线性逼近 但性质不好
    • 假观察量角度理解jackknife \mbox{Pseudo Obs} = n \hat \theta - (n - 1) \hat \theta_{i} 生成原数据集
  • bootstrap

5.19 概念可视化

  • 统计概念可视化
    • 构建置信区间与求标准误
    • 假定采样分布是总体分布 重采样估计统计量
    • 有放回的重采样 BN 个样本 得到估计统计量的一个分布 直接计算置信区间
    • 非参方法 偏差小 进阶指南
  • 置换检验
    • 分组对比时取消原分组随机分组
    • 重复进行 记录分组差异
    • 对比原参数与置换后参数差异进行推断