概率统计随机过程之母函数特征函数矩母函数

为什么要引入母函数、特征函数(矩母函数)?因为它们是处理概率论问题的有力工具。它们能把寻求独立随机变量法和的分布的卷积运算(积分运算)转换成函数的乘法运算,还能把求分布的各阶原点矩运算变成函数的微分运算,特别的,它能把寻求随机变量序列的极限分布转换成一般的函数极限问题。为概率论提供了数学分析方面的强大武器。

为何要定义概率母函数?概率论起步的时候由于其研究不确定性的特点,难以找到系统的方法,设计一个包含某一随机变量所有信息的函数使其具有解析性便成为处理概率问题的一种方法。

定义:非负整值随机变量的母函数:一个离散随机变量的概率母函数是指该随机变量的概率质量函数的幂级数表达式。

单变量情形

如果XX是在非负整数域{0,1,...}\{0,1, ...\}上取值的离散随机变量,那么XX的概率母函数定义为 G(z)=E(zX)=x=0p(x)zx,G(z)=\operatorname {E} (z^{X})=\sum _{x=0}^{\infty }p(x)z^{x}, 其中ppXX的概率质量函数。

多变量情形

如果X=(X1,...,Xd)X = (X1,...,Xd )是在dd-非负整数格{0,1,...}d\{0,1, ...\}^d上取值的离散随机变量, 那么XX的概率母函数定义为 G(z)=G(z1,,zd)=E(z1X1zdXd)=x1,,xd=0p(x1,,xd)z1x1zdxd,G(z)=G(z_{1},\ldots ,z_{d})=\operatorname {E} {\bigl (}z_{1}^{X_{1}}\cdots z_{d}^{X_{d}}{\bigr )}=\\ \sum _{x_{1},\ldots ,x_{d}=0}^{\infty }p(x_{1},\ldots ,x_{d})z_{1}^{x_{1}}\cdots z_{d}^{x_{d}}, 其中ppXX的概率质量函数。

由于p(x),有0p(x)1p(x)=1\forall p(x),有0≤p(x)≤1,\sum p(x)=1。所以概率母函数的收敛半径≥1。引进母函数的好处是它有很好的分析性质,而一旦知道了XX的母函数,那么XX的分布列可以通过下式获得: pk=g(k)(0)k!k=0,1,2,p_k=\frac{g^{(k)}(0)}{k!},k=0,1,2,\dotsb 分布列和母函数的项是一一对应的

注:以下各式中p+q=1P(X=0)=qp+q=1,P(X=0)=q

  • 伯努利分布(0-1分布):XB(1,p)X\sim B(1,p) g(z)=q+pzg(z)=q+pz
  • 二项分布:XB(n,p)X\sim B(n,p) g(z)=k=0Cnkpkqnkzk=(q+pz)ng(z)=\sum_{k=0}^∞ C_n^kp^kq^{n-k}z^k\\ =(q+pz)^n 0-1分布和二项分布的关系也体现出独立同分布概率联合概率的关系。
  • 泊松分布:XP(λ)X\sim P(\lambda) g(z)=k=0λkk!eλzk=eλ(z1)g(z)=\sum_{k=0}^∞\frac{\lambda^k}{k!}e^{-\lambda}z^k\\ =e^{\lambda(z-1)}
  • 几何分布::XGeo(p)X\sim Geo(p) g(z)=k=1qk1pzk=pzk=1qk1zk11<qz<1=pz×11qz=pz1qzg(z)=\sum_{k=1}^∞ q^{k-1}p z^k=pz\sum_{k=1}^∞ q^{k-1}z^{k-1}\\ \because -1<qz<1\\ =pz\times \frac{1}{1-qz}=\frac{pz}{1-qz}

定理:设非负整值随机变量X1,X2,,XnX_1,X_2,\dots,X_n相互独立,而g1,g2,,gng_1,g_2,\dots,g_n分别是他们的母函数,那么Y=1nXkY=\sum\limits_1^n X_k的母函数为 g(z)=g1(z)g2(z)gn(z)g(z)=g_1(z)g_2(z)\dotsb g_n(z)

期望:E(X)=g(1)=k=1kpkzk1z=1E(X)=g'(1)=\sum\limits_{k=1}^∞ kp_kz^{k-1}|_{z=1}。 相仿的,E(zX)=k=0zkpk=g(z)E(z^X)=\sum\limits_{k=0}^∞ z^kp_k=g(z)。从这里,我们可以看出母函数实际上是zXz^X的期望。

方差:Var(x)=g(1)+g(1)g(1)2Var(x)=g''(1)+g'(1)-g'(1)^2

母函数为我们处理概率提供了数学分析的角度与方法,极大方便了概率的处理,但是并不是所有随机变量都是有母函数的(只有离散的非负整数随机变量才有母函数),对于一般的随机变量是否具有类似的东西呢?这就是特征函数

定义:对任一随机变量XX,称 φX(t)=E(eitX)=eitxp(x)dx<t<+\varphi_X(t)=E(e^{itX})=\int_{-∞}^∞ e^{itx}p(x) \mathrm{d}x,-∞<t<+∞ 为随机变量XX的特征函数。

说明:

  1. 规定E(ξ+iη)=E(ξ)+iE(η)E(eitX)=E(costX)+iE(sintX)E(\xi+i\eta)=E(\xi)+iE(\eta)\Rightarrow E(e^{itX})=E(\cos tX)+iE(\sin tX)
  2. 由于eitX=1|e^{itX}|=1,所以对任一随机变量都有特征函数。对于离散随机变量,其为求和形式;对于连续随机变量为积分形式。
  3. 特征函数φ(t)\varphi(t)都是实变复值的。
  4. φ(0)=1\varphi(0)=1

注:以下各式中p+q=1P(X=0)=qp+q=1,P(X=0)=q

  • 伯努利分布(0-1分布):XB(1,p)X\sim B(1,p) φ(t)=q+peit\varphi(t)=q+pe^{it}
  • 二项分布:XB(n,p)X\sim B(n,p),0-1分布和二项分布的关系也体现出独立同分布概率联合概率的关系。 φ(t)=(q+peit)n\varphi(t)=(q+pe^{it})^n
  • 泊松分布:XP(λ)X\sim P(\lambda) φ(t)=k=0λkk!eλeλeit=eλ(eit1)\varphi(t)=\sum_{k=0}^∞\frac{\lambda^k}{k!}e^{-\lambda}e^{\lambda e^{it}}\\ =e^{\lambda(e^{it}-1)}
  • 几何分布::XGeo(p)X\sim Geo(p) φ(t)=peit1qeit\varphi(t)=\frac{pe^{it}}{1-qe^{it}}
  • 均匀分布:XU(a,b)X \sim U(a,b) φ(t)=eibteiati(ba)t\varphi(t)=\frac{e^{ibt}-e^{iat}}{i(b−a)t}
  • 正态分布:XN(μ,σ2)X\sim N(\mu,\sigma^2) φ(t)=eiutσ2t22\varphi(t)=e^{iut-\frac{\sigma^2t^2}{2}}
  • 指数分布:Xexp(λ)X \sim \exp(\lambda) φ(t)=(1itλ)1\varphi(t)=(1-\frac{it}{\lambda})^{-1}
  • gamma分布:XGa(α,λ)X \sim Ga(\alpha,\lambda) φ(t)=(1itλ)α\varphi(t)=(1-\frac{it}{\lambda})^{-\alpha}

其他分布的特征函数可见茆诗松《概率论与数理统计教程 第二版》P219

性质1:φ(t)φ(0)=1|\varphi(t)|\leq \varphi(0)=1

证明: φ(t)=eitxp(x)dx柯西不等式eitxp(x)dxeitx=cos2(tx)+sin2(tx)=1=eix0φ(t)=1p(x)dx=φ(0)=1 |\varphi(t)|=|\int_{-∞}^∞ e^{itx}p(x) \mathrm{d}x|\overset{\text{柯西不等式}}{\le}\int_{-∞}^∞ |e^{itx}|p(x) \mathrm{d}x\\ |e^{itx}|=\sqrt{\cos^2(tx)+\sin^2(tx)}=1=e^{ix\cdot 0}\\ \Rightarrow|\varphi(t)|=\int_{-∞}^∞ 1\cdot p(x) \mathrm{d}x=\varphi(0)=1

性质2:φ(t)=φ(t)\varphi(-t)=\overline{\varphi(t)},其中φ(t)\overline{\varphi(t)}表示φ(t)\varphi(t)的复共轭。

证明: φ(t)=eitxp(x)dx=eitxp(x)dx\varphi(-t)=\int_{-∞}^∞ e^{-itx}p(x) \mathrm{d}x=\int_{-∞}^∞ \overline{e^{itx}}p(x) \mathrm{d}x 由于p(x)p(x)是非负实数,不影响虚数,所以eitxp(x)dx=eitxp(x)dx=φ(t)\int_{-∞}^∞ \overline{e^{itx}}p(x) \mathrm{d}x=\overline{\int_{-∞}^∞ e^{itx}p(x)}\mathrm{d}x=\overline{\varphi(t)},所以φ(t)=φ(t)\varphi(-t)=\overline{\varphi(t)}

性质3:XX的特征函数为φ(t)\varphi(t),则Y=aX+bY=aX+b的特征函数为eitbφ(at)e^{itb}\varphi(at).

证明: φY(t)=E(eitY)=E(eit(aX+b))=E(eitaX)eitb\varphi_Y(t)=E(e^{itY})=E(e^{it(aX+b)})=E(e^{itaX})\cdot e^{itb} 如果我们将tata作为变量整体,则有E(eitaX)=φ(at)E(e^{itaX})=\varphi(at),综上所述有φY(t)=eitbφ(at)\varphi_Y(t)=e^{itb}\varphi(at)

性质4:独立随机变量的和的特征函数为每个随机变量的特征函数的积,即设X1,X2,XnX_1,X_2,\dotsb X_n相互独立,则Y=k=1nXkY=\sum_{k=1}^n X_kφY(t)=k=1nφXk(t)\varphi_{Y}(t)=\prod_{k=1}^n \varphi_{X_k}(t)

证明:因为X1,X2,,XnX_1,X_2,\dotsb,X_n相互独立,所以其随机变量的函数E(eitX1),E(eitX2),,E(eitXn)E(e^{itX_1}),E(e^{itX_2}),\dotsb,E(e^{itX_n})也是相互独立的,从而有 φY(t)=E(eitY)=E(eitk=1nXi)=E(k=1neitXk)=独立性k=1nE(eitXk)=k=1nφXk(t)\begin{aligned} \varphi_{Y}(t)&=E(e^{itY})=E(e^{it\sum_{k=1}^n X_i})=E(\prod_{k=1}^n e^{itX_k})\\ &\overset{\text{独立性}}{=}\prod_{k=1}^n E(e^{itX_k})=\prod_{k=1}^n \varphi_{X_k}(t) \end{aligned}

性质5:若E(Xl)E(X^l)存在,则XX的特征函数φ(t)\varphi(t)ll次求导,且对1kl1\leq k \leq l,有 φ(k)(0)=ikE(Xk)\varphi^{(k)}(0)=i^kE(X^k)

证明可以从特征函数的积分式进行微分即可。从性质5我们也可以用以下方式求期望和方差: E(X)=φ(0)i,Var(X)=φ(0)+(φ(0))2 E(X)=\frac{\varphi'(0)}{i},\text{Var}(X)=-\varphi''(0)+(\varphi'(0))^2

性质6:一致连续性。随机变量XX的特征函数φ(t)\varphi(t)(,)(-\infty,\infty)上一致连续。

证明略。

性质7:非负定性。随机变量XX的特征函数φ(t)\varphi(t)是非负定的,即对任意正整数nnnn个实数t1,t2,,tnt_1,t_2,\dotsb,t_nnn个复数z1,z2,,znz_1,z_2,\dotsb,z_n,有 k=1nj=1nφ(tktj)zkzjˉ0\sum_{k=1}^n\sum_{j=1}^n \varphi(t_k-t_j)z_k\bar{z_j}\geq 0

证明略。

由特征函数的定义可知,随机变量的分布唯一地确定了它的特征函数。我们也可以同样推出特征函数完全决定了分布,也就是说,两个分布函数相等当且仅当它们所对应的特征函数相等。我们不加具体证明给出如下定理:

定理:随机变量的分布函数由其特征函数唯一决定。且当XX为连续随机变量,其密度函数为p(x)p(x),特征函数为φ(t)\varphi(t),如果φ(t)dt<\int_{-\infty}^\infty |\varphi(t)|\mathrm{d}t<\infty,则 p(x)=12πeitxφ(t)dtp(x)=\frac{1}{2\pi} \int_{-\infty}^\infty e^{itx}\varphi(t)\mathrm{d}t

我们可以称由分布转换为特征函数的过程为傅里叶变换,由特征函数转换成分布的过程为傅里叶逆变换。需要指出:这里定义的傅里叶正逆变换和我们通常在通信、复变函数中定义的傅里叶变换ee的指数上相差了一个负号

由于分布函数和特征函数的一一对应关系,我们可以把随机变量序列的收敛问题和函数的收敛问题联系起来,从而有以下定理:

定理:分布函数序列{Fn(x)}\{F_n(x)\}弱收敛于分布函数F(x)F(x)的充要条件是{Fn(x)}\{F_n(x)\}的特征函数序列{φn(t)}\{\varphi_n(t)\}收敛于F(x)F(x)的特征函数φ(t)\varphi(t)

例题: 特征函数列收敛

Figure 1: 特征函数列收敛