7 Súvis medzi náhodnými premennými

Potrebujeme matematický aparát na to, aby sme vedeli pracovať s viacerými náhodnými premennými naraz. Potrebujeme vedieť, ako rôzne náhodné premenné spolu súvisia. Začneme s dvomi náhodnými premennými \(X\) a \(Y\). Dve náhodné premenné dokopy tvoria dvojrozmerný náhodný vektor \((X,Y)^T\). Skúmať súvis medzi náhodnými premennými sa preto nedá bez toho, že by sme vedeli ako udalosti nastávajú spolu.

Združená kumulatívna distribučná funkcia \(F_{XY}: \mathbb{R}^2 \rightarrow [0,1]\) náhodného vektora \((X,Y)^T\) je definovaná nasledovne:

\[F_{XY}(s,t) = P(X \leq s \cap Y \leq t) = P(X \leq s, Y \leq t).\] Ide len o dvojrozmerný ekvivalent toho, čo sme už videli predtým.

Diskrétne náhodné premenné

Ak sú elementy náhodného vektora diskrétne rozdelené náhodné premenné, potom alternatívne môžeme na popis náhodnosti použiť združenú pravdepodobnostnú funkciu

\[p_{XY}(x,y) = P(X=x \cap Y=y) = P(X=x, Y=y).\]

Aby táto bola korektná, tak musí platiť

  • \(\forall x \in \mathcal{S}_X, y \in \mathcal{S}_Y: p_{XY}(x,y) \geq 0,\)
  • \(\sum_{x \in \mathcal{S}_X}\sum_{y \in \mathcal{S}_Y}p_{XY}(x,y)=1,\)
  • \(\forall x \in \mathcal{S}_X: \sum_{y \in \mathcal{S}_Y} p_{XY}(x,y)= p_X(x),\)
  • \(\forall y \in \mathcal{S}_Y: \sum_{x \in \mathcal{S}_X} p_{XY}(x,y)= p_Y(y).\)

Spojité náhodné premenné

Ak sú elementy náhodného vektora spojite rozdelené, tak potrebujeme združenú funkciu hustoty \(f_{XY}(x,y): \mathbb{R}^2 \rightarrow \mathbb{R}^{+},\) ktorá spĺňa nasledovnú vlastnosť

\[P\left(X \in [a,b] \cap Y \in [c,d] \right) = P\left(X \in [a,b], Y \in [c,d] \right) = \int_{a}^{b} \int_{c}^{d} f_{XY}(x,y) dy dx.\]

Funkcia hustoty musí spĺňať nasledovné vlastnosti

  • \(\forall x \in \mathbb{R}, y \in \mathbb{R}: f_{XY}(x,y) \geq 0,\)
  • \(\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f_{XY}(x,y) dx dy =1,\)
  • \(\forall x \in \mathbb{R}: \int_{-\infty}^{\infty} f_{XY}(x,y) dy= f_X(x),\)
  • \(\forall y \in \mathbb{R}: \int_{-\infty}^{\infty} f_{XY}(x,y) dx= f_Y(y).\)

Vzťah medzi \(f_{XY}\) a \(F_{XY}\) je nasledovný:

\[F_{XY}(s,t) = \int_{-\infty}^{s} \int_{-\infty}^{t} f_{XY}(x,y) dy dx\] a

\[ f_{XY}(x,y) = \frac{\partial^2}{\partial x \partial y }F_{XY}(x,y).\]

Tu je vizualizovanú jeden konkrétny príklad pre \(f_{XY}\) a \(F_{XY}\)

7.1 Nezávislé náhodné premenné

Hovoríme, že dve náhodné premenné \(X\) a \(Y\) sú nezávislé ak

\[\forall x \in \mathcal{S}_X, y \in \mathcal{S}_Y: p_{XY}(x,y) = p_{X}(x) p_Y(y),\] ak sú diskrétne rozdelené a

\[\forall x \in \mathbb{R}, y \in \mathbb{R}: f_{XY}(x,y) = f_{X}(x) f_Y(y),\] ak sú spojite rozdelené. Informácia o pravdepodobnostných správaniach \(X\) a \(Y\) je preto dostatočná na to, aby sme vedeli, ako sa budú správať spolu.

Príklad 7.1 Majme nasledovnú združenú hustotu pravdepodobnosti pre náhodný vektor \((X,Y).\)

\[\begin{equation*} f_{XY}(x,y)= \begin{cases} \frac{1}{4}, & \text{ak}\ x,y \in [0,2], \\ 0, & \text{inak} \end{cases} \end{equation*}\]

\(X\) a \(Y\) nezávislé náhodné premenné?

7.2 Miera závislosti

Zatiaľčo \(p_{XY}, f_{XY}, F_{XY}\) popisujú súvis náhodných premenných úplne, niekedy máme potrebu charakterizovať súvis jediným číslom. Podobne ako sme pomocou strednej hodnoty vyjadrovali centrum distribúcie a pomocou variancie to, ako veľmi sa náhodná premenná menila.

Kovarianciou dvoch náhodných premenných nazývame

\[\text{Cov}[X,Y] \equiv \text{E}[(X-\text{E}[X])(Y-\text{E}[Y])].\]

Pre kovarianciu platí \(\text{Cov}[X,Y] = \text{E}[XY] - \text{E}[X]\text{E}[Y]\) a \(\text{Cov}[X,X] = \text{Var}[X].\)

Koreláciou dvoch náhodných premenných nazývame

\[\text{Corr}[X,Y] \equiv \frac{\text{Cov}[X,Y]}{\text{sd}[X] \cdot \text{sd}[Y] } = \frac{ \text{E}[(X-\text{E}[X])(Y-\text{E}[Y])]}{\sqrt{\text{E}[(X-\text{E}[X])^2]}\cdot\sqrt{\text{E}[(Y-\text{E}[Y])^2]}}.\]

Pre koreláciu platí:

  • \(-1 \leq \text{Corr}[X,Y] \leq 1\), je bezrozmerná, t.j. nemá žiadne jednotky,
  • \(\text{Corr}[X,Y] = \text{Corr}[Y,X]\) takže korelácia je symetrická,
  • \(\text{Corr}[X,Y] = \pm 1 \implies \exists a,b \in \mathbf{R}: Y = aX+b\), nadobúda hodnoty \(\pm 1\) práve vtedy, keď je jedná náhodná premenná lineárnou funkciou druhej,
  • \(X\) a \(Y\) sú nezávislé \(\implies \text{E}[XY] = \text{E}[X]\text{E}[Y] \implies \text{Corr}[X,Y]=0\)

Skutočnosť, že súvis dvoch náhodných premenných vyjadríme jediným číslom so sebou nesie aj náklady. Kompaktnejší popis musí nutne nejakú informáciu vynechať, čo môže ale nemusí byť problematické. Nasledujúci obrázok demonštruje realizácie 12 rôznych dvojích náhodných premenných \((X,Y)\), ktoré majú rovnaké \(\text{E}[X],\text{E}[Y],\text{Var}[X],\text{Var}[Y],\text{Corr}[X].\) (Zdroj: https://cran.r-project.org/web/packages/datasauRus/vignettes/Datasaurus.html). V týchto prípadoch sú závislosti medzi týmito premennými veľmi veľmi rôzne. Pozerať sa len na sumárne charakteristiky je preto zavádzajúce.

Korelácia je miera lineárnej závislosti. Z toho, že \(\text{Corr}[X,Y]=0\), nevyplýva, že \(X\) a \(Y\) sú nezávislé. A to jednoducho preto, že medzi nimi môže byť aj iná ako lineárna závislosť ako demonštruje nasledovný príklad.

Príklad 7.2 Majme \(X \sim \text{Unif}[-1,1]\) a \(Y = X^2.\) Tomuto zodpovedajú nasledovné funkcie hustoty

\[\begin{equation*} f_X(x)= \begin{cases} \frac{1}{2}, & \text{ak}\ x \in [-1,1], \\ 0, & \text{inak} \end{cases} \end{equation*}\]

a

\[\begin{equation*} f_Y(y)= \begin{cases} \frac{1}{2\sqrt{y}}, & \text{ak}\ y \in [0,1], \\ 0, & \text{inak}, \end{cases} \end{equation*}\]

  1. Združená hustota \(f_{XY}\) je \(0\) všade tam, kde \(Y>X\) ale \(f_X \times f_Y\) tam nie je nutne \(0\), preto \(X\) a \(Y\) nie sú nezávislé. Zároveň však platí (ukážte prečo) \(\text{E}[X] = 0,\text{E}[Y] = \frac{1}{3}\) a \(\text{Cov[X,Y]} = \text{E}[(X-\text{E}[X])(Y-\text{E}[Y])] = \text{E}\left[\left(X-0\right)\left(X^2-\frac{1}{3}\right)\right] = 0.\)

Teda \(X\) a \(Y\) sú závislé (však \(Y\) je priamo funkciou \(X\)!) ale nekorelované (teda lineárne nezávislé).

Príklad 7.3 Nech \(X \sim N(0,1)\) a nech

\[\begin{equation*} Y= \begin{cases} X, & \text{ak}\ |X| \leq c, \\ -X, & \text{inak}, \end{cases} \end{equation*}\]

Pre hodnotu \(c\) veľmi malú je \(\text{Corr}[X,Y] \approx -1\), naopak, pre \(c\) veľmi veľké je to \(\text{Corr}[X,Y] \approx 1.\) Nakoľko sa táto korelácia spojite mení s \(c\), podľa Vety o strednej hodnote musí existovať hodnota \(c\) taká, že \(\text{Corr}[X,Y]=0.\) Na druhej strane \(X\) a \(Y\) nemôžu byť nezávislé nakoľko \(Y\) je deterministickou funkciou \(X.\)

Takto vyzerá realizácia 100 náhodných vektorov \((X,Y)\) s rôznymi koreláciami.

Korelácia hovorí o asociácii, ale pozor, nie o kauzalite. Skutočnosť, že hodnoty \(X\) a \(Y\) nejakým spôsobom nastávajú naraz neznamená, že \(X\) spôsobuje \(Y\) alebo naopak. Napríklad predaje zmrzliny (\(X\)) sú korelované s napadnutiami žralakom (\(Y\)). Neznamená to ale, že tieto premenné spolu kauzálne súvisia. Ľudia skrátka jedia zmrzlinu ako aj surfujú viacej vtedy, keď je teplo.

Teraz nejaký príklad na počítanie:

Príklad 7.4 Majme \(X,Y\) pre ktoré je \(p_{XY}\) vyjadrená nasledovnou tabuľkou.
Pravdedpodobnostná funkcia
Y=1 Y=2 Y=3 Y=4
X=1 0.1 0 0.1 0
X=2 0.3 0 0.1 0.2
X=3 0 0.2 0 0

Vypočítajte \(\text{Corr}[X,Y].\)

\[\begin{eqnarray*} \text{E}[X] &=& 1 \cdot (0.1+0+ 0.1+0) + 2 \cdot (0.3+0+0.1+0.2)+ \\ && 3 \cdot (0 + 0.2 + 0 + 0) = 2, \\ \text{E}[X^2] &=& 1^2 \cdot (0.1+0+ 0.1+0) + 2^2 \cdot (0.3+0+0.1+0.2)+ \\ && 3^2 \cdot (0 + 0.2 + 0 + 0) = 4.4, \\ \text{Var}[X] &=& \text{E}[X^2] - (\text{E}[X])^2 = 4.4-4 =0.4,\\ \text{sd}[X] &=&\sqrt{\text{Var}[X]} \approx \sqrt{0.632},\\ \text{E}[Y] &=& 1 \cdot(0.1+0.3+0) + 2 \cdot(0+0+0.2) +\\ && 3 \cdot(0.1+0.1+0) + 4 \cdot(0+0.2+0) = 2.2,\\ \text{E}[Y^2] &=& 1^2 \cdot(0.1+0.3+0) + 2^2 \cdot(0+0+0.2) +\\ && 3^2 \cdot(0.1+0.1+0) + 4^2 \cdot(0+0.2+0) = 6.2,\\ \text{Var}[Y] &=& \text{E}[Y^2] - (\text{E}[Y])^2 = 6.2-4.84 = 1.36,\\ \text{sd}[Y] &=&\sqrt{\text{Var}[Y]} \approx \sqrt{1.166},\\ \text{E}[XY] &=& 1\cdot 1 \cdot 0.1 + 1 \cdot 2 \cdot 0 + 1 \cdot 3 \cdot 0.1 + 1 \cdot 4 \cdot 0 + \\ && 2\cdot 1 \cdot 0.3 + 2 \cdot 2 \cdot 0 + 2 \cdot 3 \cdot 0.1 + 2 \cdot 4 \cdot 0.2 + \\ && 3\cdot 1 \cdot 0 + 3 \cdot 2 \cdot 0.2 + 3 \cdot 3 \cdot 0 + 3 \cdot 4 \cdot 0 = 4.4, \\ \text{Cov}[X,Y] &=& \text{E}[XY] - \text{E}[X]\text{E}[Y] = 4.4 - 2 \cdot 2.2 = 0,\\ \text{Corr}[X,Y] &=& 0. \end{eqnarray*}\]

7.3 Cvičenia

Cvičenie 7.1 Nech \(X \sim N(0,1)\) a nech \(W\) má nasledovnú pravdepodobnostnú funkciu

\[\begin{equation*} p_W(w)= P(W=w) = \begin{cases} \frac{1}{2}, & \text{ak}\ w = 1 , \\ \frac{1}{2}, & \text{ak}\ w = -1 , \\ 0, & \text{inak}. \end{cases} \end{equation*}\]

Zadefinujme \(Y = X W.\) Ukážte, že \(\text{Cov}[X,Y]=0\) a že \(X\) a \(Y\) nie sú nezávislé.

Cvičenie 7.2 Majme náhodné premenné \(X,Y\) s nasledovnou združenou funkciou hustoty

\[\begin{equation*} f_{XY}(x,y)= \begin{cases} cy^2, & \text{ak}\ x \in [0,2], \ y \in [0,1],\\ 0, & \text{inak}. \end{cases} \end{equation*}\]

Vypočítajte

  • hodnotu konštanty \(c,\)
  • \(P(X+Y > 2),\)
  • \(P(X > Y),\)
  • \(P(X = 3Y),\)
  • \(\text{E}[Y],\)
  • \(\text{Cov}[X,Y].\)

Cvičenie 7.3 Zostrojte združenú pravdepodobnostnú funkciu pre \(X,Y\) tak, aby súčasne platilo:

  • \(\text{E}[X] = 2,\)
  • \(\text{E}[Y] = 2,\)
  • \(\text{Cov}[X,Y] = 0.5,\)
  • \(P(X\geq Y) = 0.4.\)

Ak sa to nedá dokážte prečo.

Domáca úloha 8

Cvičenie 7.4 (DÚ 8.1) Majme \(X,Y\) pre ktoré je \(p_{XY}\) vyjadrená nasledovnou tabuľkou.
Pravdedpodobnostná funkcia
Y=0 Y=1 Y=2
X=0 0.1 0.2 0.1
X=1 0.05 0.1 0.15
X=2 0.05 0.05 0.05
X=3 0.05 0.05 0.05

Vypočítajte

  • \(P(X=2),\)
  • \(P(X\leq 2 \cap Y \leq 2),\)
  • \(P(X > Y),\)
  • \(P(X = Y),\)
  • \(\text{Corr}[X,Y].\)

Cvičenie 7.5 (DÚ 8.2) Majme náhodné premenné \(X,Y\) s nasledovnou združenou kumulatívnou distribučnou funkciou

\[\begin{equation*} F_{XY}(s,t) = P(X\leq s, Y \leq t)= \begin{cases} \frac{1}{156}st(s^2+t), & \text{ak}\ s \in [0,3], \ t \in [0,4],\\ 1, & \text{ak}\ s>3, \ t>4, \\ 0, & \text{ak}\ s<0, \\ 0, & \text{ak}\ t<0, \\ \end{cases} \end{equation*}\]

Overte, že \(F_{XY}\) je korektná združená kumulatívna distribučná funkcia.

Vypočítajte

  • \(f_X(x)\) a \(f_Y(y),\)
  • \(\text{E}[X],\)
  • \(\text{sd}[Y],\)
  • \(\text{Cov}[X,Y],\)
  • \(P(Y \leq X).\)

Cvičenie 7.6 (DÚ 8.3) Majme náhodné premenné \(X,Y\) s nasledovnou združenou pravdepodobnostnou funkciou

\[\begin{equation*} p_{XY}(x,y)= \begin{cases} c|x+y|, & \text{ak}\ x \in \{-2,-1,0,1,2 \},\\ & \ y \in \{-2,-1,0,1,2 \},\\ 0, & \text{inak}. \end{cases} \end{equation*}\]

Vypočítajte

  • hodnotu konštanty \(c,\)
  • \(P(X = 1),\)
  • \(P(X = 3Y),\)
  • \(\text{E}[X],\)
  • \(\text{Corr}[X,Y].\)

Cvičenie 7.7 (DÚ 8.4) Zostrojte združenú pravdepodobnostnú funkciu pre \(X,Y\) tak, aby súčasne platilo:

  • \(\mathcal{S}_X = \{1,2,3\}\)
  • \(\mathcal{S}_Y = \{0,1,2\}\)
  • \(\text{E}[XY] = \text{E}[X]\text{E}[Y]\)
  • Existuje nejaké \(x \in \mathcal{S}_X\) a \(y \in \mathcal{S}_Y,\) že platí \(p_X(x)p_Y(y) > p_{XY}(x,y)\).

Cvičenie 7.8 (DÚ 8.5) Zostrojte združenú pravdepodobnostnú funkciu pre \(X,Y\) tak, aby súčasne platilo:

  • \(\text{E}[X] = 3,\)
  • \(\text{Corr}[X,Y] = 0,\)
  • \(P(X\geq 2Y) = 0.1.\)

Ak sa to nedá dokážte prečo.

Cvičenie 7.9 (DÚ 8.6) Majme náhodné premenné \(X,Y\) s nasledovnou združenou funkciou hustoty.

\[\begin{equation*} f_{XY}(x,y) = \begin{cases} cx, & \text{ak}\ x,y > 0, \ x+y < 2,\\ 0, & \text{inak}, \end{cases} \end{equation*}\]

Vypočítajte

  • konštantu \(c\) tak, aby bola \(f_{XY}\) korektná združená funkcia hustoty.
  • \(\text{E}[X],\)
  • \(P(Y \leq 3X^2).\)

Cvičenie 7.10 (DÚ 8.7 (nepovinná a nehodnotená)) Vyfarbite nasledujúci obrázok veľkonočnými farbami.

Zdroj: vectorstock.com/1816075.

Obrázok 7.1: Zdroj: vectorstock.com/1816075.