信概统-期中cheatsheet

信概统 2025-11-05

信概统-期中cheatsheet

2025-11-05

信概统

离散分布

二项分布 \(B(n,p)\). \(P(X=k)\) 为 \(n\) 重伯努利实验中概率为 \(p\) 的事件 \(A\) 发生次数为 \(k\) 的概率.

\(E(X)=np\)
\(E(X^2)=n(n-1)p^2+np\)
\(Var(X)=np(1-p)\)

多个二项分布加起来得到 \(B(\sum n,p)\).

泊松分布 \(\pi(\lambda)\)：\(B(\lambda m,\frac{1}{m})\) 在 \(m\to +\infty\) 的情况.

\(P(X_i=k)= \frac{\lambda^ke^{-\lambda}}{k!}\).
\(E(X)=\lambda\)
\(Var(X)=\lambda\)

实际上，任意一列 \(p_1,\dots\)，只要 \(p_nn\to \lambda\)，皆有 \(P(X_n=k)\to \frac{\lambda ^ke^{-\lambda}}{k!}\).

多个泊松分布加起来得到 \(\pi(\sum \lambda)\).

几何分布 \(G (p)\)：结果 \(A\) 首次出现时的试验次数.

\(P(X_i=k)=p(1-p)^{k-1}\).
\(E(X)=\frac{1}{p}\).
\(Var(X)=\frac{1-p}{p^2}\).
无记忆性：\(P(X>n+m|X>m)=P(X>n)\).

负二项分布 \(NB(r,p)\)：结果 \(A\) 首次发生 \(r\) 次时的试验次数.

\(P(X_i=k)=\binom{k-1}{r-1}p^{r}(1-p)^{k-r}\).
如何证明其的确是概率分布？即 \(\sum \binom{k-1}{r-1}p^r(1-p)^{k-r}=1\)？

令 \(l=k-r\)，则即证 \(\sum \binom{l+r-1}{r-1}(1-p)^l=p^{-r}\)

将 \(p^{-r}\) 写作 \((1-(1-p))^{-r}\) 后展开，得 \(\sum (-1)^{l}\binom{-r}{l}(1-p)^l=\sum \binom{l+r-1}{l}(1-p)^l\)，即证.
\(NB(r,p)\) 可以看作 \(r\) 个 \(G(p)\) 之和.
\(E=\frac{r}{p}\)
\(Var=\frac{r(1-p)}{p^2}\)

结论

二项分布

\(\sum \binom{n}{i}p^{i}(1-p)^{n-i}i=np\)

\(\sum \binom{n}{i}p^i(1-p)^{n-i}i^2=n(n-1)p^2+np\)

泊松分布

\(\sum \frac{\lambda^k e^{-\lambda}}{k!}=1\).

\(\sum \frac{\lambda^ke^{-\lambda}k}{k!}=\lambda\).

\(\sum \frac{\lambda^ke^{-\lambda}k^2}{k!}=\lambda^2+\lambda\).

几何分布

\(\sum p(1-p)^{k-1}k=\frac{1}{p}\)

\(\sum p(1-p)^{k-1}k^2=\frac{1-p}{p^2}\)

负二项分布

\(\sum_k \binom{k-1}{r-1}p^r(1-p)^{k-r}=1\)

\(\sum_k \binom{k-1}{r-1}p^r(1-p)^{k-r}k=\frac{r}{p}\)

\(\sum_k \binom{k-1}{r-1}p^r(1-p)^{k-r}k^2=\frac{2-p}{p^2}\).

misc

概率证法：\(P(X\ge E(X))> 0\).

Markov 不等式：对于非负随机变量 \(X\)，若 \(E(X)>0\)，则 \(P(X\ge cE(X))\le \frac{1}{c}\).

切比雪夫不等式：\(P(|X-E|\ge c\sigma)\le\frac{1}{c^2}\).

证明考虑对随机变量 \(Y=(X-E)^2\) 使用 Markov 不等式.

协方差：\(Cov(X,Y)=E((X-E(X))(Y-E(Y)))=E(XY)-E(X)E(Y)\).

\(Var(X+Y)=Var(X)+Var(Y)+Cov(X,Y)\).

独立变量的 Cov 为 0，但是 Cov 为 0 的可能不独立（\(X\) 服从拉德马赫，\(Y=X^2\)）.

计算 Cov 的时候可以记得拆成 \(Cov(X,Y)=Cov(Y+Z,Z)=Var(Y)\)，如果 \(Y,Z\) 独立.

连续分布

高斯分布：记作 \(x\sim \mathcal N(\mu,\sigma^2)\).

\(f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-(x-\mu)^2/2\sigma^2}\).

标准化时，\(f(x)=\frac{1}{\sqrt{2\pi}}e^{-x^2/2}\)，\(P(|X|\le 2)=0.9545\)，\(P(|X|\le 3)=0.9973\).

p.s. 伯努利分布在标准化后变成拉德马赫分布（随机符号）.

指数分布：记作 \(x\sim Exp(\lambda)\).

\(f(x)=[x>0]\lambda e^{-\lambda x}\)

\(F(x)=[x>0](1-e^{-\lambda x})\).

期望：\(\frac{1}{\lambda}\)，方差：\(\frac{1}{\lambda^2}\)

注意到 \(P(X>x)=e^{-\lambda x}\)，故指数函数显然拥有无记忆性.

伽马分布：记作 \(x\sim \Gamma(\alpha,\lambda)\)

\(f(x)=\frac{\lambda^{\alpha}}{\Gamma(\alpha)} x^{\alpha-1}e^{-\lambda x}\).

期望：\(\frac{\alpha}{\lambda}\)，方差：\(\frac{\alpha}{\lambda^2}\)

取 \(\alpha=1\) 即指数分布.

\(\Gamma(\frac{n}{2},\frac{1}{2})\) 得到卡方分布 \(\chi^2(n)\).

期望：\(n\)，方差：\(2n\)

\(n=1\) 时候，有\(f(x)=\frac{1}{\sqrt{2\pi x}} e^{-\frac{x}{2}}\).

另一方面，这个也是 \(X\sim \mathcal N(0,1)\) 时 \(X^2\) 的分布.

结论

高斯分布

\(\int_{-\infty}^{+\infty} e^{-x^2/2}=\sqrt{2\pi}\)

\(\int_{-\infty}^{+\infty} e^{-x^2/2}x=0\)

\(\int_{-\infty}^{+\infty} e^{-x^2/2}x^2=\sqrt{2\pi}\)

指数分布

\(\int_{0}^{x}\lambda e^{-\lambda t}=1-e^{-\lambda x}\)，对于 \(x>0\).

\(\int_{0}^{+\infty} \lambda e^{-\lambda x}x^n=\frac{n!}{\lambda^{n}}\).

伽马分布

\(\Gamma(\alpha)=\int_0^{+\infty} x^{\alpha-1}e^{-x}dx\).

\(\Gamma(\alpha+1)=\int_0^{+\infty} x^{\alpha}e^{-x}dx\).

\(\Gamma(n+\frac{1}{2})=\frac{(2n)!}{4^nn!}\sqrt{\pi}\).

\(\int_0^{+\infty}\frac{\lambda}{\Gamma(\alpha)}x^{\alpha-1}e^{-\lambda x}dx=1\). 证明考虑代 \(y=\lambda x\).

卡方分布

\(\int_0^{+\infty}\frac{1}{\sqrt{2\pi x}}e^{-\frac{x}{2}}dx=\int_0^{+\infty}\frac{\sqrt{x}}{\sqrt{2\pi}}e^{-\frac{x}{2}}dx=1\).

\(\int_0^{+\infty}\frac{\sqrt{x^3}}{\sqrt{2\pi}}e^{-\frac{x}{2}}dx=3\). 这些都为 \(\chi^2(1)\) 的直接结论.