Binomial distribution

n次伯努利实验,样本相互独立,单次成功概率为p,服从参数为n和p的二项分布:

$$P\{ x= m\} =C_{n}^{m}p^{m}\left( 1-p\right) ^{n-m} \ \ (其中,0<p<1, m=0,1,...,n)$$

累计概率分布函数:

$$F\left( m\right) =P\{ X \leq m\} =\sum ^{m}_{i=0}C_{n}^{i}p^{i}\left( 1-p\right) ^{n-i}$$

二项分布的两种逼近:泊松分布 和 标准正态分布(拉普拉斯中心极限定理)

  • 当n很大,p较小(稀有事件,一般小于0.1),即np=$\lambda$较小,近似逼近泊松分布

  • 当n很大,p较大,即np也很大,近似逼近标准正态分布 $Z=\dfrac{X-np}{\sqrt{np\left( 1-p\right) }}$ ,$X=\sum ^{n}_{i=0}x_{i}$ 对于二项分布,$x_{i}$为所有事件和,即成功次数。

abnormality = scipy.stats.binom(total / 100, p).cdf((total - loss) / 100)
abnormality = ((total - loss) - total * p) /
                    more ...