离散分布

二项分布 \(B(n,p)\). \(P(X=k)\)\(n\) 重伯努利实验中概率为 \(p\) 的事件 \(A\) 发生次数为 \(k\) 的概率.

  • \(E(X)=np\)
  • \(E(X^2)=n(n-1)p^2+np\)
  • \(Var(X)=np(1-p)\)

多个二项分布加起来得到 \(B(\sum n,p)\).


泊松分布 \(\pi(\lambda)\)\(B(\lambda m,\frac{1}{m})\)\(m\to +\infty\) 的情况.

  • \(P(X_i=k)= \frac{\lambda^ke^{-\lambda}}{k!}\).
  • \(E(X)=\lambda\)
  • \(Var(X)=\lambda\)

实际上,任意一列 \(p_1,\dots\),只要 \(p_nn\to \lambda\),皆有 \(P(X_n=k)\to \frac{\lambda ^ke^{-\lambda}}{k!}\).

多个泊松分布加起来得到 \(\pi(\sum \lambda)\).


几何分布 \(G (p)\):结果 \(A\) 首次出现时的试验次数.

  • \(P(X_i=k)=p(1-p)^{k-1}\).
  • \(E(X)=\frac{1}{p}\).
  • \(Var(X)=\frac{1-p}{p^2}\).
  • 无记忆性:\(P(X>n+m|X>m)=P(X>n)\).

负二项分布 \(NB(r,p)\):结果 \(A\) 首次发生 \(r\) 次时的试验次数.

  • \(P(X_i=k)=\binom{k-1}{r-1}p^{r}(1-p)^{k-r}\).

  • 如何证明其的确是概率分布?即 \(\sum \binom{k-1}{r-1}p^r(1-p)^{k-r}=1\)

    \(l=k-r\),则即证 \(\sum \binom{l+r-1}{r-1}(1-p)^l=p^{-r}\)

    \(p^{-r}\) 写作 \((1-(1-p))^{-r}\) 后展开,得 \(\sum (-1)^{l}\binom{-r}{l}(1-p)^l=\sum \binom{l+r-1}{l}(1-p)^l\),即证.

  • \(NB(r,p)\) 可以看作 \(r\)\(G(p)\) 之和.

  • \(E=\frac{r}{p}\)

  • \(Var=\frac{r(1-p)}{p^2}\)

结论

二项分布

\(\sum \binom{n}{i}p^{i}(1-p)^{n-i}i=np\)

\(\sum \binom{n}{i}p^i(1-p)^{n-i}i^2=n(n-1)p^2+np\)

泊松分布

\(\sum \frac{\lambda^k e^{-\lambda}}{k!}=1\).

\(\sum \frac{\lambda^ke^{-\lambda}k}{k!}=\lambda\).

\(\sum \frac{\lambda^ke^{-\lambda}k^2}{k!}=\lambda^2+\lambda\).

几何分布

\(\sum p(1-p)^{k-1}k=\frac{1}{p}\)

\(\sum p(1-p)^{k-1}k^2=\frac{1-p}{p^2}\)

负二项分布

\(\sum_k \binom{k-1}{r-1}p^r(1-p)^{k-r}=1\)

\(\sum_k \binom{k-1}{r-1}p^r(1-p)^{k-r}k=\frac{r}{p}\)

\(\sum_k \binom{k-1}{r-1}p^r(1-p)^{k-r}k^2=\frac{2-p}{p^2}\).

misc

概率证法:\(P(X\ge E(X))> 0\).

Markov 不等式:对于非负随机变量 \(X\),若 \(E(X)>0\),则 \(P(X\ge cE(X))\le \frac{1}{c}\).

切比雪夫不等式\(P(|X-E|\ge c\sigma)\le\frac{1}{c^2}\).

证明考虑对随机变量 \(Y=(X-E)^2\) 使用 Markov 不等式.


协方差:\(Cov(X,Y)=E((X-E(X))(Y-E(Y)))=E(XY)-E(X)E(Y)\).

\(Var(X+Y)=Var(X)+Var(Y)+Cov(X,Y)\).

独立变量的 Cov 为 0,但是 Cov 为 0 的可能不独立(\(X\) 服从拉德马赫,\(Y=X^2\)).

计算 Cov 的时候可以记得拆成 \(Cov(X,Y)=Cov(Y+Z,Z)=Var(Y)\),如果 \(Y,Z\) 独立.

连续分布

高斯分布:记作 \(x\sim \mathcal N(\mu,\sigma^2)\).

\(f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-(x-\mu)^2/2\sigma^2}\).

标准化时,\(f(x)=\frac{1}{\sqrt{2\pi}}e^{-x^2/2}\)\(P(|X|\le 2)=0.9545\)\(P(|X|\le 3)=0.9973\).

p.s. 伯努利分布在标准化后变成拉德马赫分布(随机符号).


指数分布:记作 \(x\sim Exp(\lambda)\).

\(f(x)=[x>0]\lambda e^{-\lambda x}\)

\(F(x)=[x>0](1-e^{-\lambda x})\).

期望:\(\frac{1}{\lambda}\),方差:\(\frac{1}{\lambda^2}\)

注意到 \(P(X>x)=e^{-\lambda x}\),故指数函数显然拥有无记忆性.


伽马分布:记作 \(x\sim \Gamma(\alpha,\lambda)\)

\(f(x)=\frac{\lambda^{\alpha}}{\Gamma(\alpha)} x^{\alpha-1}e^{-\lambda x}\).

期望:\(\frac{\alpha}{\lambda}\),方差:\(\frac{\alpha}{\lambda^2}\)

\(\alpha=1\) 即指数分布.


\(\Gamma(\frac{n}{2},\frac{1}{2})\) 得到卡方分布 \(\chi^2(n)\).

期望:\(n\),方差:\(2n\)

\(n=1\) 时候,有\(f(x)=\frac{1}{\sqrt{2\pi x}} e^{-\frac{x}{2}}\).

另一方面,这个也是 \(X\sim \mathcal N(0,1)\)\(X^2\) 的分布.


结论

高斯分布

\(\int_{-\infty}^{+\infty} e^{-x^2/2}=\sqrt{2\pi}\)

\(\int_{-\infty}^{+\infty} e^{-x^2/2}x=0\)

\(\int_{-\infty}^{+\infty} e^{-x^2/2}x^2=\sqrt{2\pi}\)

指数分布

\(\int_{0}^{x}\lambda e^{-\lambda t}=1-e^{-\lambda x}\),对于 \(x>0\).

\(\int_{0}^{+\infty} \lambda e^{-\lambda x}x^n=\frac{n!}{\lambda^{n}}\).

伽马分布

\(\Gamma(\alpha)=\int_0^{+\infty} x^{\alpha-1}e^{-x}dx\).

\(\Gamma(\alpha+1)=\int_0^{+\infty} x^{\alpha}e^{-x}dx\).

\(\Gamma(n+\frac{1}{2})=\frac{(2n)!}{4^nn!}\sqrt{\pi}\).

\(\int_0^{+\infty}\frac{\lambda}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x}dx=1\). 证明考虑代 \(y=\lambda x\).

卡方分布

\(\int_0^{+\infty}\frac{1}{\sqrt{2\pi x}}e^{-\frac{x}{2}}dx=\int_0^{+\infty}\frac{\sqrt{x}}{\sqrt{2\pi}}e^{-\frac{x}{2}}dx=1\).

\(\int_0^{+\infty}\frac{\sqrt{x^3}}{\sqrt{2\pi}}e^{-\frac{x}{2}}dx=3\). 这些都为 \(\chi^2(1)\) 的直接结论.