5 随机分析

5.1 Introduction

一般地,我们称系数可以是随机的微分方程为随机微分方程(Stochastic Differential Equation),显然随机微分方程的解一定具有随机性,因此我们只期望得到关于解的概率分布。

5.1.1 1.4 最优停时(Optimal Stopping)

假定某人计划卖掉一个资产,在开放的市场中,他的资产在\(t\)时刻的价格\(X_t\)满足随机微分方程
\[ \frac{dX_t}{dt}=rX_t+\alpha X_t\cdot [\text{noise}], \] 这里的\(r,\alpha\)为已知的常数,折现率为已知常数\(\rho\),那么在什么时候卖掉该资产为最好?

假设知道现在时刻\(t\)以前的资产表现\(X_s(s<t)\)但是由于系统中的噪声,当然无法确信选择卖的时间是否为最优,因此要找一个停时策略,在长期运行中它应该是最好的结果,即把通胀考虑进去以后的最大化期望利润。这是一个最优停时问题。

5.1.2 1.5 随机控制(Stochastic Control)

假设某人有两个投资可能性:

  1. 无风险投资(如债券).在\(t\)时刻每单位的价格\(X_0(t)\)按指数增长:
    \[ \frac{dX_0}{dt}=\rho X_0 \] 这里的\(\rho\)为大于0的常数

  2. 有风险投资(如股票).在\(t\)时刻每单位的价格\(X_1(t)\)满足随机微分方程:
    \[ \frac{dX_1}{dt}=(\mu+\sigma\cdot[\text{noise}])X_1 \]

在每个时刻\(t\),该投资者选择他的财富\(V_t\)中多大比例\(u_t\)用于风险投资,从而另一部分用于无风险投资,给定效用函数\(U\)和终端时刻\(T\),该投资问题是找到一个最优证券组合,使得终端时刻财富\(V_T\)的期望效用最大
\[ \mathop{max}\limits_{0\leq u_t\leq1}\{E[U(V_T^{(u)})]\} \]

5.2 预备知识

5.2.1 概率空间 随机变量 随机过程

定义2.1.1

给定全集合\(\Omega\),那么\(\Omega\)上的\(\sigma\)代数\(\mathcal{F}\)是由\(\Omega\)的某些子集构成的集合族且具有下列性质

  1. \(\varnothing\in\mathcal{F}\);
  2. \(F\in\mathcal{F}\Rightarrow F^C\in\mathcal{F}\);
  3. \(A_1,A_2,\dots\in\mathcal{F}\Rightarrow A:=\mathop{\cup}\limits_{i=1}^{\infty}A_i\in\mathcal{F}\).

\((\Omega,\mathcal{F})\)为一个可测空间,这个可测空间的概率测度\(P\)是一个实值函数,将\(\mathcal{F}\)映射到\([0,1]\)上,满足概率测度的两个条件

  1. \(P(\varnothing)=0,P(\Omega)=1\);

  2. \(A_1,A_2,\dots\in\mathcal{F}\)\(\{A_i\}_{i=1}^{\infty}\)是互不相交,那么
    \[ P(\mathop{\cup}_{i=1}^{\infty}A_i)=\mathop{\sum}_{i=1}^{\infty}P(A_i). \]

\((\Omega,\mathcal{F},P)\)为一个概率空间。我们假定所有概率空间都是完备的,即\(\mathcal{F}\)包括了\(\Omega\)\(P\)外测度为零的所有子集。

\(\Omega\)中的某一子集\(F\),如果\(F\in\mathcal{F}\),则称\(F\)\(\mathcal{F}\)可测集,在概率上称为事件,\(P(F)\)就称为事件\(F\)发生的概率。特别地,\(P(F)=1\)则说事件\(F\)为依概率1发生或者几乎必然(a.s.)发生。

对给定的\(\Omega\)的一个集合族\(\mathcal{U}\),存在一个包含\(\mathcal{U}\)的最小\(\sigma\)代数\(\mathcal{H}_\mathcal{U}\),即
\[ \mathcal{H}_\mathcal{U}=\cap\{\mathcal{H}:\mathcal{H}为\Omega上的\sigma代数,\mathcal{U}\subset\mathcal{H}\} \] ,称\(\mathcal{H}_{\mathcal{U}}\)是由\(\mathcal{U}\)生成的\(\sigma\)代数(包含\(\mathcal{U}\)的最小集合,所以做了交集)。

例如,\(\mathcal{U}\)是拓扑空间\(\Omega\)的所有开子集构成的集合(如\(\Omega=\mathbf{R}^n\)),那么\(\mathcal{B}=\mathcal{H}_\mathcal{U}\)称为\(\Omega\)上的Borel \(\sigma\)代数。对任意元素\(B\in\mathcal{B}\)称为Borel可测集。\(\mathcal{B}\)包含所有的开子集、所有的闭子集、所有的可数个闭子集的并集以及所有的可数个这种并集的交集等等。

\((\Omega,\mathcal{F},P)\)是给定的概率空间,如果
\[ Y^{-1}(U):=\{\omega\in\Omega;Y(\omega)\in U\}\in\mathcal{F} \] 对所有开集\(U\in\mathbf{R}^n\)(或等价地,对所有Borel集\(U\in\mathbf{R}^n\))均成立,那么函数\(Y:\Omega\rightarrow\mathbf{R}^n\)称为\(\mathcal{F}\)可测的。(这实际上有点像 Y是一个随机变量?)

\(X:\Omega\rightarrow \mathbf{R}^n\)是任意一个函数,那么由\(X\)生成的\(\sigma\)代数\(\mathcal{H}_X\)\(\Omega\)上的包含所有形如\(X^{-1}(U)\)\(U\in\mathbf{R}^n\)为开集)的最小\(\sigma\)代数。不难证明
\[ \mathcal{H}_X=\{X^{-1}(B);B\in\mathcal{B}\}, \] 这里\(\mathcal{B}\)\(\mathbf{R}^n\)上的Borel \(\sigma\)代数。显然\(X\)\(\mathcal{H}_X\)可测的,而\(\mathcal{H}_X\)是具有上述性质的最小\(\sigma\)代数。(可以当作事件域?)

引理2.1.2

如果\(X,Y:\Omega\rightarrow\mathbf{R}^n\)是两个给定的函数,\(Y\)\(\mathcal{H}_X\)可测的充要条件是存在一个Borel可测函数\(g:\mathbf{R}^n\rightarrow\mathbf{R}^n\)使得\(Y=g(X)\).

下面,设\((\Omega,\mathcal{F},P)\)是一个给定的完备概率空间,一个随机变量\(X\)是一个\(\mathcal{F}\)可测函数\(X:\Omega\rightarrow\mathbf{R}^n\).每个随机变量诱导了\(\mathbf{R}^n\)上的概率测度\(\mu_X\),定义为
\[ \mu_X(B)=P(X^{-1}(B)), \] \(\mu_X\)称为\(X\)的分布(!!!)。(\(B\)是随机变量映射的像,\(X:\Omega\rightarrow\mathcal{B}\)

如果\(\int_{\Omega}|X(\omega)|dP(\omega)<\infty\),那么
\[ E[X]:=\int_{\Omega}X(\omega)dP(\omega)=\int_{\mathbf{R}^n}xd\mu_X(x) \] 称为\(X\)的期望。更一般地,如果\(f:\mathbf{R^n}\rightarrow\mathbf{R}\)是Borel可测的,且\(\int_{\Omega}|f(X(\omega))|dP(\omega)<\infty\),那么
\[ E[f(X)]:=\int_{\Omega}f(X(\omega))dP(\omega)=\int_{\mathbf{R}^n}f(x)d\mu_X(x). \]

5.2.1.1 \(L^p\)空间

如果\(X:\Omega \rightarrow\mathbf{R}^n\)是一个随机变量,\(p\in[1,\infty)\)是一个常数,定义\(X\)上的\(L^p\)范数\(||X||_p:\)
\[ ||X||_p=||X||_{L^p(P)}=(\int_\Omega|X(\omega)|^pdP(\omega))^{\frac{1}{p}}. \] 如果\(p=\infty\),定义
\[ ||X||_{\infty}=||X||_{L^{\infty}(P)}=\text{inf}\{N\in\mathbf{R};|X(\omega)|\leq N\, a.s.\}, \] 相应的\(L^p\)空间定义为
\[ L^p(P)=L^p(\Omega)=\{X:\Omega\rightarrow\mathbf{R}^n;||X||_p<\infty\}, \] 在该范数定义下,\(L^p\)空间是Banach空间即完备的赋范空间。如果\(p=2\),空间\(L^2(P)\)是一个Hilbert空间,即完备的内积空间,其中内积
\[ (X,Y)_{L^2(P)}:=E[X\cdot Y],\quad X,Y\in L^2(P). \] 定义2.1.3

两个子集\(A,B\in\mathcal{F}\)称为独立的,如果
\[ P(A\cap B)=P(A)\cdot P(B). \] 集族\(\mathcal{A}=\{\mathcal{H_i};i\in I\}\),如果
\[ P(H_{i_1}\cap \dots \cap H_{i_k})=P(H_{i_1}) \cdots P(H_{i_k}), \]\(\forall H_{i_1}\in \mathcal{H_{i_1}},...,H_{i_k}\in\mathcal{H_{i_k}}\)成立,\(i_1,i_2,...i_k\)互不相同。

如果由随机变量族\(X_i,i\in I\)生成的\(\sigma\)代数\(\mathcal{H}_{X_i}\)构成的集族是独立的,那么随机变量族也是独立的。

度过两个随机变量\(X,Y:\omega\rightarrow\mathbf{R}\)是独立的,假设\(E[|X|]<\infty,E[|Y|]<\infty\),则\(E[XY]=E[X]E[Y]\).

定义2.1.4

随机过程是带参数的一族随机变量:\(\{X_t\}_{t\in T}\)定义于概率空间\((\Omega,\mathcal{H},P)\)上,取值于\(\mathbf{R}^n\)中。

参数空间\(T\)通常是射线\([0,\infty).\)注意对每个固定的\(t\in T\),有随机变量
\[ \omega\rightarrow X_t(\omega);\quad \omega\in \Omega. \] 另一方面,固定\(\omega\in \Omega\),可以考虑函数
\[ t\rightarrow X_t(\omega);\quad t\in T, \] 称之为\(X_t\)的路径。

一般地,可以直观地把\(t\)当作时间,而每个\(\omega\)可认为单个的“质子”或者“实验”。\(X_t(\omega)\)表示在时刻\(t\)时质子(实验)\(\omega\)的位置(或结果)。有时可以用\(X(t,\omega)\)代替\(X_t(\omega)\),因此可以把随机过程看作一个从\(T\times\Omega\)\(\mathbf{R}^n\)的函数,随机过程关于\((t,\omega)\)二元可测的。

最后注意到,可以认为,对每个\(\omega\),函数\(t\rightarrow X_t(\omega)\)是从\(T\)\(\mathbf{R}^n\)的函数,因此可认为\(\Omega\)是空间\(\widetilde{\Omega}=(\mathbf{R}^n)^T\)(即从\(T\)\(\mathbf{R}^n\)的所有的函数全体集合)的子集。此时,\(\sigma\)代数\(\mathcal{F}\)将包含下述形式集合生成的\(\sigma\)代数\(\mathcal{B}\):
\[ \{\omega;\omega(t_1)\in F_1,...,\omega(t_k)\in F_k\},\quad F_i\subset \mathbf{R}^n为Borel集 \] 因此,我们可以将随机过程视为可测空间\(((\mathbf{R}^n)^T,\mathcal{B})\)上的一个概率测度\(P\).

过程\(X=\{X_t\}_{t\in T}\)的有限维分布是定义在\(\mathbf{R}^{nk},k=1,2,...\)上的测度\(\mu_{t_1,...,t_k}\),其中
\[ \mu_{t_1,...,t_k}(F_1\times F_2\times \dots F_k)=P[X_{t_1}\in F_1,...,X_{t_k}\in F_k];t_i\in T, \] \(F_1,...,F_k\)定义为\(\mathbf{R}^n\)中的Borel集。

反之,给定\(\mathbf{R}^{nk},k=1,2,...\)上的概率测度\(\nu_{t_1,...,t_k}\)以后,能否构造一个随机过程\(\{Y_t\}_{t\in T}\)使得\(\nu_{t_1,...,t_k}\)作为它的有限维分布?

定理2.1.5(Kolmogorov存在定理)

对任意的\(t_1,...,t_k\in T,k\in\mathbf{N},\)\(\nu_{t_1,...,t_k}\)\(\mathbf{R}^{nk}\)上的概率测度,满足

  • (K1) \(\nu_{t_{\sigma(1)},...,t_{\sigma(k)}}(F_1\times...\times F_k)=\nu_{t_1,...,t_k}(F_{\sigma^{-1}(1)}\times...\times F_{\sigma^{-1}(k)})\)其中\(\sigma\)\(\{1,2,...,k\}\)的任意一个排列。

  • (K2) \(\nu_{t_1,...,t_k}(F_1\times ...\times F_k)=\nu_{t_{\sigma(1)},...,t_{\sigma(k)},t_{\sigma_{k+1}},...,t_{\sigma_{k+m}}}(F_1\times...\times F_k\times \mathbf{R}^n\times...\mathbf{R}^n)\),对任意\(m\in\mathbf{N},\)此处右边总共有\(k+m\)个因素。

    则存在一个概率空间\((\Omega,\mathcal{F},P)\)\(\Omega\)上的随机过程\(\{X_t\},X_t:\Omega\rightarrow \mathbf{R}^n\).对任意的\(t_i\in T,k\in\mathbf{N}\)及任意的Borel集\(F_i\)满足
    \[ \mu_{t_1,...,t_k}(F_1\times F_2\times \dots F_k)=P[X_{t_1}\in F_1,...,X_{t_k}\in F_k]. \]

5.2.2 布朗运动(Brownian Motion)

为了构造\(\{B_t\}_{t\geq0}\),由Kolmogorov存在定理,只需要指定一族概率测度\(\{\nu_{t_1,...,t_k}\}\)满足条件(K1),(K2)且这些测度与观察到的花粉表现一致:固定\(x\in\mathbf{R}^n\),定义 \[ p(t,x,y)=(2\pi t)^{-\frac{n}{2}}\cdot \exp \Big ( -\frac{|x-y|^2}{2t}\Big),\quad y\in\mathbf{R}^n,t>0. \] 如果\(0\leq t_1\leq t_2\leq ... \leq t_k\),在\(\mathbf{R}^{nk}\)上定义一个测度\(\nu_{t_1,...,t_k}\)使得 \[ \begin{aligned} &\nu_{t_1,...,t_k}(F_1\times ...\times F_k)\\ =&\int_{F_1\times...\times F_k}p(t_1,x,x_1)p(t_2-t_1,x_2,x_2)\cdots p(t_k-t_{k-1},x_{k-1},x_k)dx_1\cdots dx_k, \end{aligned} \] 此处\(dy=dy_1\cdots dy_k\)为Lebesgue测度,\(p(0,x,y)dy=\delta_x(y)\)是在\(x\)处的单位质点。

​ 利用(K1),把它延拓到所有\(t_i\)的有限序列。由于对\(\forall t\geq0,\int_{\mathbf{R}^n}p(t,x,y)dy=1,\)故(K2)满足,由Kolmogorow定理,存在一个概率空间\((\Omega,\mathcal{F},P^x)\)和一个\(\Omega\)上的随机过程\(\{B_t\}_{t\geq0},\)使得\(B_t\)的有限维分布为上式,即 \[ \begin{aligned} &P^x(B_{t_1}\in F_1,...,B_{t_k}\in F_k)\\ =&\int_{F_1\times...\times F_k}p(t_1,x,x_1)p(t_2-t_1,x_2,x_2)\cdots p(t_k-t_{k-1},x_{k-1},x_k)dx_1\cdots dx_k. \end{aligned} \]

定义2.2.1

​ 上述过程称为初值为\(x\)的布朗运动的修正,注意\(P^x(B_0=x)=1\).

​ 下面叙述布朗运动的基本性质:

  1. \(B_t\)是一个Gauss过程,即对所有的\(0\leq t_1\leq...t_k,\)随机变量\(Z=(B_{t_1},...,B_{t_k})\in \mathbf{R}^{nk}\)是服从多重正态分布的,即存在一个向量\(M\in \mathbf{R}^{nk}\)和一个半正定矩阵\(C=[c_{jm}]\in\mathbf{B}^{nk\times nk}\)使得 \[ E^x\Big[\exp\Big(i\sum_{j=1}^{nk}u_jZ_j\Big)\Big]=\exp\Big(-\frac{1}{2}\sum_{j,m}u_jc_{jm}u_m+i\sum_{j}u_jM_j\Big) \] 对所有的\(u=(u_1,...,u_{nk})\in \mathbf{R}^{nk}\)成立,这里的\(i\)是虚数单位,\(E^x\)表示关于概率\(P^x\)​所取的数学期望。 \[ M=E^x[Z] \]\(Z\)的均值, \[ c_{jm}=E^x[(Z_j-M_j)(Z_m-M_m)] \]\(Z\)的协方差矩阵。

    ​ 经过计算可知, \[ M=E^x[Z]=(x,x,...,x)\in\mathbf{R}^{nk}, \]

    \[ \begin{aligned} C= \begin{pmatrix} t_1I_n & t_1I_n &...&t_1I_n\\ t_1I_n & t_2I_n &...&t_2I_n\\ \vdots & \vdots& &\vdots\\ t_1I_n&t_2I_n&...&t_kI_n \end{pmatrix}, \end{aligned} \]

因此 \[ E^x[B_t]=x, \quad \text{for all}\,\,t\geq0 \]\[ E^x[(B_t-x)^2]=nt,\quad E^x[(B_t-x)(B_s-x)]=n\,\min(s,t), \] 而且,如果\(t\geq s,\)则有 \[ E^x[(B_t-B_s)^2]=n(t-s). \]

  1. \(B_t\)具有独立增量,即对任意的\(0\leq t_1<t_2<...<t_k,\) \[ B_{t_1},B_{t_2}-B_{t_1},...,B_{t_k}-B_{t_{k-1}}是独立的. \]