5 随机分析

5.1 Introduction

一般地，我们称系数可以是随机的微分方程为随机微分方程（Stochastic Differential Equation），显然随机微分方程的解一定具有随机性，因此我们只期望得到关于解的概率分布。

5.1.1 1.4 最优停时（Optimal Stopping）

假定某人计划卖掉一个资产，在开放的市场中，他的资产在\(t\)时刻的价格\(X_t\)满足随机微分方程
\[ \frac{dX_t}{dt}=rX_t+\alpha X_t\cdot [\text{noise}], \] 这里的\(r,\alpha\)为已知的常数，折现率为已知常数\(\rho\)，那么在什么时候卖掉该资产为最好？

假设知道现在时刻\(t\)以前的资产表现\(X_s(s<t)\)但是由于系统中的噪声，当然无法确信选择卖的时间是否为最优，因此要找一个停时策略，在长期运行中它应该是最好的结果，即把通胀考虑进去以后的最大化期望利润。这是一个最优停时问题。

5.1.2 1.5 随机控制（Stochastic Control）

假设某人有两个投资可能性：

无风险投资（如债券）.在\(t\)时刻每单位的价格\(X_0(t)\)按指数增长：
\[ \frac{dX_0}{dt}=\rho X_0 \] 这里的\(\rho\)为大于0的常数
有风险投资（如股票）.在\(t\)时刻每单位的价格\(X_1(t)\)满足随机微分方程：
\[ \frac{dX_1}{dt}=(\mu+\sigma\cdot[\text{noise}])X_1 \]

在每个时刻\(t\)，该投资者选择他的财富\(V_t\)中多大比例\(u_t\)用于风险投资，从而另一部分用于无风险投资，给定效用函数\(U\)和终端时刻\(T\),该投资问题是找到一个最优证券组合，使得终端时刻财富\(V_T\)的期望效用最大
\[ \mathop{max}\limits_{0\leq u_t\leq1}\{E[U(V_T^{(u)})]\} \]

5.2 预备知识

5.2.1 概率空间随机变量随机过程

定义2.1.1

给定全集合\(\Omega\)，那么\(\Omega\)上的\(\sigma\)代数\(\mathcal{F}\)是由\(\Omega\)的某些子集构成的集合族且具有下列性质

\(\varnothing\in\mathcal{F}\);
\(F\in\mathcal{F}\Rightarrow F^C\in\mathcal{F}\);
\(A_1,A_2,\dots\in\mathcal{F}\Rightarrow A:=\mathop{\cup}\limits_{i=1}^{\infty}A_i\in\mathcal{F}\).

称\((\Omega,\mathcal{F})\)为一个可测空间，这个可测空间的概率测度\(P\)是一个实值函数，将\(\mathcal{F}\)映射到\([0,1]\)上，满足概率测度的两个条件

\(P(\varnothing)=0,P(\Omega)=1\);
若\(A_1,A_2,\dots\in\mathcal{F}\)且\(\{A_i\}_{i=1}^{\infty}\)是互不相交，那么
\[ P(\mathop{\cup}_{i=1}^{\infty}A_i)=\mathop{\sum}_{i=1}^{\infty}P(A_i). \]

称\((\Omega,\mathcal{F},P)\)为一个概率空间。我们假定所有概率空间都是完备的，即\(\mathcal{F}\)包括了\(\Omega\)中\(P\)外测度为零的所有子集。

对\(\Omega\)中的某一子集\(F\)，如果\(F\in\mathcal{F}\),则称\(F\)为\(\mathcal{F}\)可测集，在概率上称为事件，\(P(F)\)就称为事件\(F\)发生的概率。特别地，\(P(F)=1\)则说事件\(F\)为依概率1发生或者几乎必然(a.s.)发生。

对给定的\(\Omega\)的一个集合族\(\mathcal{U}\),存在一个包含\(\mathcal{U}\)的最小\(\sigma\)代数\(\mathcal{H}_\mathcal{U}\),即
\[ \mathcal{H}_\mathcal{U}=\cap\{\mathcal{H}:\mathcal{H}为\Omega上的\sigma代数，\mathcal{U}\subset\mathcal{H}\} \] ，称\(\mathcal{H}_{\mathcal{U}}\)是由\(\mathcal{U}\)生成的\(\sigma\)代数（包含\(\mathcal{U}\)的最小集合，所以做了交集）。

例如，\(\mathcal{U}\)是拓扑空间\(\Omega\)的所有开子集构成的集合(如\(\Omega=\mathbf{R}^n\))，那么\(\mathcal{B}=\mathcal{H}_\mathcal{U}\)称为\(\Omega\)上的Borel \(\sigma\)代数。对任意元素\(B\in\mathcal{B}\)称为Borel可测集。\(\mathcal{B}\)包含所有的开子集、所有的闭子集、所有的可数个闭子集的并集以及所有的可数个这种并集的交集等等。

设\((\Omega,\mathcal{F},P)\)是给定的概率空间，如果
\[ Y^{-1}(U):=\{\omega\in\Omega;Y(\omega)\in U\}\in\mathcal{F} \] 对所有开集\(U\in\mathbf{R}^n\)（或等价地，对所有Borel集\(U\in\mathbf{R}^n\)）均成立，那么函数\(Y:\Omega\rightarrow\mathbf{R}^n\)称为\(\mathcal{F}\)可测的。（这实际上有点像 Y是一个随机变量？）

若\(X:\Omega\rightarrow \mathbf{R}^n\)是任意一个函数，那么由\(X\)生成的\(\sigma\)代数\(\mathcal{H}_X\)是\(\Omega\)上的包含所有形如\(X^{-1}(U)\)（\(U\in\mathbf{R}^n\)为开集）的最小\(\sigma\)代数。不难证明
\[ \mathcal{H}_X=\{X^{-1}(B);B\in\mathcal{B}\}, \] 这里\(\mathcal{B}\)是\(\mathbf{R}^n\)上的Borel \(\sigma\)代数。显然\(X\)是\(\mathcal{H}_X\)可测的，而\(\mathcal{H}_X\)是具有上述性质的最小\(\sigma\)代数。（可以当作事件域？）

引理2.1.2

如果\(X,Y:\Omega\rightarrow\mathbf{R}^n\)是两个给定的函数，\(Y\)为\(\mathcal{H}_X\)可测的充要条件是存在一个Borel可测函数\(g:\mathbf{R}^n\rightarrow\mathbf{R}^n\)使得\(Y=g(X)\).

下面，设\((\Omega,\mathcal{F},P)\)是一个给定的完备概率空间，一个随机变量\(X\)是一个\(\mathcal{F}\)可测函数\(X:\Omega\rightarrow\mathbf{R}^n\).每个随机变量诱导了\(\mathbf{R}^n\)上的概率测度\(\mu_X\),定义为
\[ \mu_X(B)=P(X^{-1}(B)), \] \(\mu_X\)称为\(X\)的分布（！！！）。（\(B\)是随机变量映射的像，\(X:\Omega\rightarrow\mathcal{B}\)）

如果\(\int_{\Omega}|X(\omega)|dP(\omega)<\infty\),那么
\[ E[X]:=\int_{\Omega}X(\omega)dP(\omega)=\int_{\mathbf{R}^n}xd\mu_X(x) \] 称为\(X\)的期望。更一般地，如果\(f:\mathbf{R^n}\rightarrow\mathbf{R}\)是Borel可测的，且\(\int_{\Omega}|f(X(\omega))|dP(\omega)<\infty\),那么
\[ E[f(X)]:=\int_{\Omega}f(X(\omega))dP(\omega)=\int_{\mathbf{R}^n}f(x)d\mu_X(x). \]

5.2.1.1 \(L^p\)空间

如果\(X:\Omega \rightarrow\mathbf{R}^n\)是一个随机变量，\(p\in[1,\infty)\)是一个常数，定义\(X\)上的\(L^p\)范数\(||X||_p:\)
\[ ||X||_p=||X||_{L^p(P)}=(\int_\Omega|X(\omega)|^pdP(\omega))^{\frac{1}{p}}. \] 如果\(p=\infty\),定义
\[ ||X||_{\infty}=||X||_{L^{\infty}(P)}=\text{inf}\{N\in\mathbf{R};|X(\omega)|\leq N\, a.s.\}, \] 相应的\(L^p\)空间定义为
\[ L^p(P)=L^p(\Omega)=\{X:\Omega\rightarrow\mathbf{R}^n;||X||_p<\infty\}, \] 在该范数定义下，\(L^p\)空间是Banach空间即完备的赋范空间。如果\(p=2\),空间\(L^2(P)\)是一个Hilbert空间，即完备的内积空间，其中内积
\[ (X,Y)_{L^2(P)}:=E[X\cdot Y],\quad X,Y\in L^2(P). \] 定义2.1.3

两个子集\(A,B\in\mathcal{F}\)称为独立的，如果
\[ P(A\cap B)=P(A)\cdot P(B). \] 集族\(\mathcal{A}=\{\mathcal{H_i};i\in I\}\),如果
\[ P(H_{i_1}\cap \dots \cap H_{i_k})=P(H_{i_1}) \cdots P(H_{i_k}), \] 对\(\forall H_{i_1}\in \mathcal{H_{i_1}},...,H_{i_k}\in\mathcal{H_{i_k}}\)成立，\(i_1,i_2,...i_k\)互不相同。

如果由随机变量族\(X_i,i\in I\)生成的\(\sigma\)代数\(\mathcal{H}_{X_i}\)构成的集族是独立的，那么随机变量族也是独立的。

度过两个随机变量\(X,Y:\omega\rightarrow\mathbf{R}\)是独立的，假设\(E[|X|]<\infty,E[|Y|]<\infty\)，则\(E[XY]=E[X]E[Y]\).

定义2.1.4

随机过程是带参数的一族随机变量：\(\{X_t\}_{t\in T}\)定义于概率空间\((\Omega,\mathcal{H},P)\)上，取值于\(\mathbf{R}^n\)中。

参数空间\(T\)通常是射线\([0,\infty).\)注意对每个固定的\(t\in T\),有随机变量
\[ \omega\rightarrow X_t(\omega);\quad \omega\in \Omega. \] 另一方面，固定\(\omega\in \Omega\),可以考虑函数
\[ t\rightarrow X_t(\omega);\quad t\in T, \] 称之为\(X_t\)的路径。

一般地，可以直观地把\(t\)当作时间，而每个\(\omega\)可认为单个的“质子”或者“实验”。\(X_t(\omega)\)表示在时刻\(t\)时质子（实验）\(\omega\)的位置（或结果）。有时可以用\(X(t,\omega)\)代替\(X_t(\omega)\)，因此可以把随机过程看作一个从\(T\times\Omega\)到\(\mathbf{R}^n\)的函数，随机过程关于\((t,\omega)\)二元可测的。

最后注意到，可以认为，对每个\(\omega\)，函数\(t\rightarrow X_t(\omega)\)是从\(T\)到\(\mathbf{R}^n\)的函数，因此可认为\(\Omega\)是空间\(\widetilde{\Omega}=(\mathbf{R}^n)^T\)(即从\(T\)到\(\mathbf{R}^n\)的所有的函数全体集合)的子集。此时，\(\sigma\)代数\(\mathcal{F}\)将包含下述形式集合生成的\(\sigma\)代数\(\mathcal{B}\):
\[ \{\omega;\omega(t_1)\in F_1,...,\omega(t_k)\in F_k\},\quad F_i\subset \mathbf{R}^n为Borel集 \] 因此，我们可以将随机过程视为可测空间\(((\mathbf{R}^n)^T,\mathcal{B})\)上的一个概率测度\(P\).

过程\(X=\{X_t\}_{t\in T}\)的有限维分布是定义在\(\mathbf{R}^{nk},k=1,2,...\)上的测度\(\mu_{t_1,...,t_k}\),其中
\[ \mu_{t_1,...,t_k}(F_1\times F_2\times \dots F_k)=P[X_{t_1}\in F_1,...,X_{t_k}\in F_k];t_i\in T, \] \(F_1,...,F_k\)定义为\(\mathbf{R}^n\)中的Borel集。

反之，给定\(\mathbf{R}^{nk},k=1,2,...\)上的概率测度\(\nu_{t_1,...,t_k}\)以后，能否构造一个随机过程\(\{Y_t\}_{t\in T}\)使得\(\nu_{t_1,...,t_k}\)作为它的有限维分布？

定理2.1.5（Kolmogorov存在定理）

对任意的\(t_1,...,t_k\in T,k\in\mathbf{N},\)设\(\nu_{t_1,...,t_k}\)为\(\mathbf{R}^{nk}\)上的概率测度，满足

(K1) \(\nu_{t_{\sigma(1)},...,t_{\sigma(k)}}(F_1\times...\times F_k)=\nu_{t_1,...,t_k}(F_{\sigma^{-1}(1)}\times...\times F_{\sigma^{-1}(k)})\)其中\(\sigma\)为\(\{1,2,...,k\}\)的任意一个排列。
(K2) \(\nu_{t_1,...,t_k}(F_1\times ...\times F_k)=\nu_{t_{\sigma(1)},...,t_{\sigma(k)},t_{\sigma_{k+1}},...,t_{\sigma_{k+m}}}(F_1\times...\times F_k\times \mathbf{R}^n\times...\mathbf{R}^n)\),对任意\(m\in\mathbf{N},\)此处右边总共有\(k+m\)个因素。

则存在一个概率空间\((\Omega,\mathcal{F},P)\)和\(\Omega\)上的随机过程\(\{X_t\},X_t:\Omega\rightarrow \mathbf{R}^n\).对任意的\(t_i\in T,k\in\mathbf{N}\)及任意的Borel集\(F_i\)满足
\[ \mu_{t_1,...,t_k}(F_1\times F_2\times \dots F_k)=P[X_{t_1}\in F_1,...,X_{t_k}\in F_k]. \]

5.2.2 布朗运动（Brownian Motion）

为了构造\(\{B_t\}_{t\geq0}\),由Kolmogorov存在定理，只需要指定一族概率测度\(\{\nu_{t_1,...,t_k}\}\)满足条件(K1),(K2)且这些测度与观察到的花粉表现一致：固定\(x\in\mathbf{R}^n\),定义 \[ p(t,x,y)=(2\pi t)^{-\frac{n}{2}}\cdot \exp \Big ( -\frac{|x-y|^2}{2t}\Big),\quad y\in\mathbf{R}^n,t>0. \] 如果\(0\leq t_1\leq t_2\leq ... \leq t_k\)，在\(\mathbf{R}^{nk}\)上定义一个测度\(\nu_{t_1,...,t_k}\)使得 \[ \begin{aligned} &\nu_{t_1,...,t_k}(F_1\times ...\times F_k)\\ =&\int_{F_1\times...\times F_k}p(t_1,x,x_1)p(t_2-t_1,x_2,x_2)\cdots p(t_k-t_{k-1},x_{k-1},x_k)dx_1\cdots dx_k, \end{aligned} \] 此处\(dy=dy_1\cdots dy_k\)为Lebesgue测度，\(p(0,x,y)dy=\delta_x(y)\)是在\(x\)处的单位质点。

利用(K1)，把它延拓到所有\(t_i\)的有限序列。由于对\(\forall t\geq0,\int_{\mathbf{R}^n}p(t,x,y)dy=1,\)故(K2)满足，由Kolmogorow定理，存在一个概率空间\((\Omega,\mathcal{F},P^x)\)和一个\(\Omega\)上的随机过程\(\{B_t\}_{t\geq0},\)使得\(B_t\)的有限维分布为上式，即 \[ \begin{aligned} &P^x(B_{t_1}\in F_1,...,B_{t_k}\in F_k)\\ =&\int_{F_1\times...\times F_k}p(t_1,x,x_1)p(t_2-t_1,x_2,x_2)\cdots p(t_k-t_{k-1},x_{k-1},x_k)dx_1\cdots dx_k. \end{aligned} \]

定义2.2.1

上述过程称为初值为\(x\)的布朗运动的修正，注意\(P^x(B_0=x)=1\).

下面叙述布朗运动的基本性质：

\(B_t\)是一个Gauss过程，即对所有的\(0\leq t_1\leq...t_k,\)随机变量\(Z=(B_{t_1},...,B_{t_k})\in \mathbf{R}^{nk}\)是服从多重正态分布的，即存在一个向量\(M\in \mathbf{R}^{nk}\)和一个半正定矩阵\(C=[c_{jm}]\in\mathbf{B}^{nk\times nk}\)使得 \[ E^x\Big[\exp\Big(i\sum_{j=1}^{nk}u_jZ_j\Big)\Big]=\exp\Big(-\frac{1}{2}\sum_{j,m}u_jc_{jm}u_m+i\sum_{j}u_jM_j\Big) \] 对所有的\(u=(u_1,...,u_{nk})\in \mathbf{R}^{nk}\)成立，这里的\(i\)是虚数单位，\(E^x\)表示关于概率\(P^x\)所取的数学期望。 \[ M=E^x[Z] \] 是\(Z\)的均值， \[ c_{jm}=E^x[(Z_j-M_j)(Z_m-M_m)] \] 是\(Z\)的协方差矩阵。

经过计算可知， \[ M=E^x[Z]=(x,x,...,x)\in\mathbf{R}^{nk}, \]

\[ \begin{aligned} C= \begin{pmatrix} t_1I_n & t_1I_n &...&t_1I_n\\ t_1I_n & t_2I_n &...&t_2I_n\\ \vdots & \vdots& &\vdots\\ t_1I_n&t_2I_n&...&t_kI_n \end{pmatrix}， \end{aligned} \]

因此 \[ E^x[B_t]=x, \quad \text{for all}\,\,t\geq0 \] 及 \[ E^x[(B_t-x)^2]=nt,\quad E^x[(B_t-x)(B_s-x)]=n\,\min(s,t), \] 而且，如果\(t\geq s,\)则有 \[ E^x[(B_t-B_s)^2]=n(t-s). \]

\(B_t\)具有独立增量，即对任意的\(0\leq t_1<t_2<...<t_k,\) \[ B_{t_1},B_{t_2}-B_{t_1},...,B_{t_k}-B_{t_{k-1}}是独立的. \]