# 第 63 章 縱向研究數據 longitudinal data 2

## 63.1 邊際結構 marginal structures

### 63.1.1 隨機截距模型

$Y_{ij} = (\beta_0 + u_{0j}) + \beta_1 t_{ij} + e_{ij}$

\begin{aligned} Y_{ij} | t_{ij}, u_{0j} & \sim N(\beta_0 + \beta_1t_{ij} + u_{0j}, \sigma^2_e)\\ u_{0j}|t_{ij} & \sim N(0, \sigma^2_u) \\ \text{Var}(Y_{ij} | t_{ij}, u_{0j}) & = \sigma^2_e \end{aligned}

$$Y_{ij}$$ 針對 $$u_j$$ 的邊際期望 (marginal espectation with respect to $$u_j$$):

$E(Y_{ij}|t_{ij}) = \beta_0 + \beta_1 t_{ij}$

### 63.1.2 隨機系數模型

$Y_{ij} = (\beta_0 + u_{0j}) + (\beta_1 + u_{1j})t_{ij} + e_{ij}$

$Y_{ij} = (\beta_0 + \beta_1t_{ij}) + (u_{0j} + u_{1j}t_{ij}) + e_{ij}$

$Y_{ij}|t_{ij},u_{0j},u_{1j} \sim N( \beta_0 + \beta_1t_{ij} + u_{0j} + u_{1j}t_{ij}, \sigma^2_e)$

$\mathbf{\sum}_{\mathbf{u}} =\left( \begin{array}{cc} \sigma^2_{u_{00}} & \sigma_{u_{01}} \\ \sigma_{u_{01}} & \sigma^2_{u_{11}} \\ \end{array} \right) \\ \text{Cov} (Y_{ij}, Y_{i*j}|t_{ij}, t_{i*j}, u_{oj}, u_{1j}) = 0$

\begin{aligned} E(Y_{ij}|t_{ij}) & = \beta_0 + \beta_1t_{ij} \\ \text{Var}(Y_{ij}) & = \sigma^2_{u_{00}} +2\sigma_{u_{01}}t_{ij} + \sigma^2_{u_{11}}t_{ij}^2 + \sigma^2_e \\ \text{Cov}(Y_{ij}, Y_{i*j}) & = \text{Cov}(u_{0j} + u_{1j}t_{ij} + e_{ij}, u_{0j} + u_{1j}t_{i*j} + e_{i*j}) \\ & = \sigma^2_{u_{00}} + \sigma_{u_{01}}(t_{ij} + t_{i*j}) + \sigma^2_{u_{11}}t_{ij}t_{i*j} \text{ (for } i \neq i*) \\ \text{Cov}(Y_{ij}, Y_{i*j*}) & = \text{Cov}(u_{0j} + u_{1j}t_{ij} + e_{ij}, u_{0j*} + u_{1j*}t_{i*j*} + e_{i*j*}) \\ & = 0 \text{ (for } j \neq j*) \end{aligned}

## 63.2 矩陣記法

• $$j$$ 是每個患者 (第二層級)，$$\mathbf{Y}_j, \mathbf{e}_j$$ 向量被定義爲:

\begin{aligned} \mathbf{Y}_j & = \left( \begin{array}{c} Y_{1j} \\ Y_{2j} \\ \cdots \\ \cdots \\ Y_{nj} \end{array} \right) \\ \mathbf{e}_j & = \left( \begin{array}{c} e_{1j} \\ e_{2j} \\ \cdots \\ \cdots \\ e_{nj} \end{array} \right) \\ \end{aligned}

$\mathbf{T} = \left(\begin{array}{c} 1 & t_1 \\ 1 & t_2 \\ 1 & t_3 \end{array} \right) \\ \mathbf{\beta} = \left( \begin{array}{c} \beta_0 \\ \beta_1 \end{array} \right) \\ \mathbf{u}_j = \left(\begin{array}{c} u_{0j} \\ u_{1j} \end{array} \right)$

$\mathbf{Y = T\beta + Tu + e} \\ \text{Where } \mathbf{u} \sim N(0, \mathbf{\Sigma}_u) \\ \mathbf{e} \sim N(0, \sigma^2_e\mathbf{I})$

$\text{Var}(\mathbf{Y}) = \mathbf{T\Sigma}_u\mathbf{T}^T + \sigma^2_e \mathbf{I}$

## 63.3 混合效應模型的一般化公式

$\mathbf{Y = T\beta + Zu + e}$

$\text{Var}(\mathbf{Y}) = \mathbf{Z\Sigma}_u\mathbf{Z}^T + \mathbf{\Sigma}_e \\ \mathbf{Y} \sim N(\mathbf{T\beta}, \mathbf{Z\Sigma}_u\mathbf{Z}^T + \mathbf{\Sigma}_e )$

## 63.4 其他可選擇的方差協方差矩陣特徵

• 復合對稱結構 (compound symmetry structure - compound symmetry model) 又名爲可交換結構 (exchangeable structure)

$\mathbf{\sum}_{\mathbf{u}} =\left( \begin{array}{cc} \sigma^2_{u} + \sigma^2_e & \sigma^2_{u} & \sigma^2_{u} \\ \sigma^2_{u} & \sigma^2_{u} + \sigma^2_e& \sigma^2_{u} \\ \sigma^2_{u} & \sigma^2_{u} & \sigma^2_{u} + \sigma^2_e \\ \end{array} \right)$

• 隨機系數結構 random coefficient (RC) structure

$\mathbf{\sum}_{\mathbf{u}} =\left( \begin{array}{cc} \sigma^2_{u_{00}} + \sigma^2_e & \sigma^2_{u_{00}} + \sigma_{u_{01}} & \sigma^2_{u_{00}} + 2\sigma_{u_{01}} \\ \sigma^2_{u_{00}} + \sigma_{u_{01}} & \sigma^2_{u_{00}} + 2\sigma_{u_{01}} + \sigma^2_{u_{11}} + \sigma^2_e& \sigma^2_{u_{00}} + 3\sigma_{u_{01}} + 2\sigma^2_{u_{11}} \\ \sigma^2_{u_{00}} + 2\sigma_{u_{01}} & \sigma^2_{u_{00}} + 3\sigma_{u_{01}} + 2\sigma^2_{u_{11}} & \sigma^2_{u_{00}} + 4\sigma_{u_{01}} + 4\sigma^2_{u_{11}}+\sigma^2_e \\ \end{array} \right)$

• 自回歸結構 (autoregressive structure):

$\frac{\phi}{1-\alpha^2} \left(\begin{array}{ccc} 1 & \alpha & \alpha^2 \\ \alpha & 1 & \alpha \\ \alpha^2 & \alpha & 1 \end{array} \right)$

• 無固定結構 (unstructure):

$\left(\begin{array}{ccc} \sigma_{11} & \sigma_{12} &\sigma_{13} \\ \sigma_{21} & \sigma_{22} &\sigma_{23} \\ \sigma_{31} & \sigma_{32} &\sigma_{33} \end{array} \right)$

$\sigma^2\left(\begin{array}{ccc} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{array} \right)$

## 63.5 其他要點評論

• 各種結構模型之間的相互比較

• 似然比檢驗法 the likelihood ratio test (LRT)
前提是模型的固定結構不發生改變，兩個嵌套式模型之間的比較是可以使用死然比檢驗的。缺點是統計學效能可能不太理想 (low power)
• 模型的比較指標 information criteria
就算是同一個數據，如果不同的協方差結構矩陣模型的固定效應部分也不同，似然比檢驗也不使用，這時候應該求助於赤池信息量 (Akaike’s Information Criterion, AIC)，或者貝葉斯信息量 (Bayesian Criterion, BIC) 的比較。這兩個信息量都是使用的模型的似然減去相應模型的參數數量作爲評判標準。差別是 BIC 對參數的調整更加大些。但是，沒人可以保證這些信息會永遠相互認證，他們可能出現互相矛盾，也沒人可以保證使用這些信息的比較可以證明你的模型是“最佳”模型。

## 63.6 不平衡數據

• 有缺失值的數據，我們無法使用已知的協方差結構矩陣;
• 隨機效應模型，隨機系數模型可以用於不平衡數據，所以即使有缺失值，我們可以從混合效應模型的結果來推測數據暗示我們數據中存在着怎樣的協方差結構;