3 分布

3.1 正态分布的概率

想要算我十点半以前睡觉的概率有多大,属不属于小概率时间。因为我没有我每天的睡眠数据,只能取个一个月的样看一下。在这一个月里我可能没有在十点半之前睡觉,但并不是我就绝不会在10点半之前睡觉。如果把我每天的上床时间看作正态分布,我还是能算出一个概率的。 首先输入我一个月的睡觉时间。-1是晚上11点。

sleep.time <- c(0.5, 0.5, -1, 0.5, 3.5, 2, 1, 1.5, 1.5, 1.5, 3.5, 5.5,
    2, 3.5, 2.5, 1.5, 7.5, 0, 0, 1, 3.5, -1, 2, 1, 0.5, 6, 1, 1, 5, 1,
    4.5)

pnorm函数可以算比-1.5小的概率,也就是我睡觉时间早于10点半的概率。sd代表样本标准差\(s_{x}=\sqrt{\frac{1}{N-1} \sum_{i=1}^{N}\left(x_{i}-\bar{x}\right)^{2}}\),mean是均值。这里得出概率小于0.05,也就是说我睡觉时间早于10点半是个小概率事件。

pnorm(-1.5, mean(sleep.time), sd(sleep.time))
## [1] 0.04175538

qnorm函数可以算出我百分之九十五的情况下是从几点之后睡觉的。得出-1.32,也就是10点40之后。

qnorm(0.05, mean(sleep.time), sd(sleep.time))
## [1] -1.324852

3.2 几个离散分布的基础知识

3.2.1 太长不看版

被拟合的因变量都是正整数用泊松分布,只有 0 和 1 用二项分布,使用 brt 用伯努利分布。

3.2.2 伯努利分布

扔一个不均匀硬币,得到正面朝上的概率。

3.2.3 二项分布

扔几次骰子,得到m次正面朝上的概率。

3.2.4 泊松分布

一小时内随便扔,有可能扔一次,有可能扔无数次,得到m次正面朝上的概率。这里影响概率的唯一参数是均值。比如此实验尝试几次后,第一次得到2次正面朝上(不管扔了几次),第二次得到3次正面朝上,第三次得到4次正面朝上,则均值为3个。可代公式得到结果为任意个的概率。

泊松分布适用于一定时间或一定空间内的发生次数,如 - 每个早晨卖多少包子 - 每平方米地有多少虫子 - 半衰期:因为一定时间内有可能衰变一个也有可能衰变无数个。

p很小的时候二项分布近似于泊松分布。因为泊松分布就是p值无限小,重复次数无限多的二项分布。

均值越小,泊松分布越偏,均值大时(比如20)泊松分布近似于正态分布。比如硬币正面朝上的概率是 0.083


  1. 马同学. (2019, Mai 6). 泊松分布的现实意义是什么,为什么现实生活多数服从于泊松分布?—知乎. https://www.zhihu.com/question/26441147/answer/429569625↩︎