Capítulo 5 Variables aleatorias

En los temas 1 y 2 hemos visto como analizar un conjunto de datos. La metodología general consistía en disponer de una muestra de una población, y resumir el contenido de esa muestra mediante análisis gráficos y numéricos.

La muestra, habitualmente, consiste de una serie de variables (numéricas o no), que llamábamos variables estadísticas. Esta variable es el valor de una característica concreta (estatura, peso, color… ) en cada uno de los individuos de la muestra.

Centrémonos ahora en variables numéricas. Si en vez de referirnos a los valores de la variable en una muestra concreta (que es una parte de una población) nos referimos a los valores de la variable en toda la población, tendremos una variable aleatoria.

Recordemos, antes de nada, el esquema de trabajo de la estadística matemática

Gráfico del proceso científico del estudio estadístico

Gráfico del proceso científico del estudio estadístico

El objetivo es conocer lo mejor posible una población a partir de una muestra de individuos. Para ello se elige una muestra de la población lo más representativa y grande posible de la misma y se analiza, extrayendo toda la información posible de la misma.

Para poder extrapolar los resultados de la muestra a la población necesitaremos extender los conceptos vistos de una variable estadística a la población general.

La variable en la población general se llama variable aleatoria.

Cuando tenemos una base de datos de una población, en general tenemos una muestra de dicha población. Un fichero de datos de pacientes de un hospital concreto es una muestra de la población total de pacientes. En este fichero de datos podemos tener mediciones de diferentes variables: altura, peso, temperatura corporal, niveles en sangre, si tiene una enfermedad o no (variable que podría estar representada con ceros y unos, cero si no tiene la enfermedad, uno si la tiene)… Las variables que hemos citado: altura, peso, temperatura, etc., son ejemplos de variables aleatorias.
Esquema general de relación entre variables aleatorias y estadísticas

Esquema general de relación entre variables aleatorias y estadísticas

El nombre de variable aleatoria hace referencia a que los valores de esta variable dependen del azar, mediante alguna ley concreta. El proceso de comprensión o interpretación matemática de esa aleatoriedad es el que realizaremos en este tema.

Cuando lanzamos una moneda, por ejemplo, cien veces, y anotamos \(1\) si sale cara y \(0\) si sale cruz, tenemos una variable estadística que toma los valores \(0\) y \(1\), con frecuencias de aparición de, por ejemplo, \(56\) y \(44\), respectivamente. Cuando consideramos el proceso general de lanzar una moneda, tenemos una variable aleatoria que toma los valores \(0\) y \(1\) con probabilidad \(0.5\), respectivamente.