Una variable es simplemente una característica suceptible de ser medida u observada y que puede tomar valores diferentes (o variables). En otras palabras, es una caraterística que cambia (difiere, varia) de sujeto a sujeto (sujeto, entendiéndose como un unidad de lo que sea: tiempo, espacio, persona). El contrario de una variable es una constante pues sus valores no cambian.
Variables: el color del pelo, la altura de los edificios, el nombre de los objetos inanimados, los adjetivos para describir una fiesta, la gramos de hemoglobina de un paciente.
Todas son variables. Y ¿Se dio cuenta? Hay muchas unidades distintas.
Una variable puede ser tan vaga u espécifica como se desee. Sin embargo, es ideal que al escribir un protcolo esta sea lo más específica posible. Recuerde que el nombre de la variable incluye la operacionalización del valor que quiere medir. Una persona debe entender exactamente lo que usted quiere medir y como lo quiere medir cuando define una variable. Es diferente asumir anemia por clínica que asumir anemia por hemoglobina. En un protocolo buscamos que esto quede claro al definir nuestras variables de estudio.
Una variable puede ser tan espécifica como:
O puede ser tan simple como:
!Qué bien! ya sabemos que es una variable. Ahora podemos clasificarlas. El objetivo de clasificarlas es ser conscientes de que tipo de cálculos podemos efectuar con cada una da las variables y por ende que tipo de pruebas podemos aplicar. Tenga en cuenta que, como todo, esto también debe estar en acuerdo con sus objetivos y preguntas de investigación. Si el tipo de variables no es ideal para efectuar ciertos cálculos pero igual los realizamos, los resultados pueden ser falsos o espurios (jerga estadística para decir falso).
Antes de empezar dejemos algo claro: no se embolate. Existen varias formas de clasificar las variables y todas tienen una utilidad, el truco está en el nombre de la categoría o sub categoría. Existen varias formas de nombrar estas clasificaciones, lo importante es el concepto detrás del nombre. Veamos:
La primera forma de clasificar las variables es por su naturaleza. Cuando se clasifica por la naturaleza se escoge entre dos sabores: Variables Discretas o Variables Continuas.
Otro caso que es importante mencionar es aquel de las denominadas “variables de conteo”. Estas son variables discretas que representan el número de eventos. Por ejemplo: número de infartos, número de mujeres, etc. Las mencionaremos de nuevo más adelante.
Acuerdése, variable discreta, solo valores enteros. ¡Nada de rodeos, esto o aquello!
Entonces, las continuas, piénselas como infinitas. Siempre puede continuar agregándole valores.
La segunda forma de clasificar las variables es por la forma en que son medidas. Aquí hay más variedad pero vamos despacio.
Por la manera en que son medidas las variables pueden ser de dos tipos:
Las primeras, como su nombre lo indica, se refieren a cualidades o posiciones de los valores de esas variables. Esto puede ser confuso pues, las cualitativas pueden representarse con números. Pero ahí está la cosa, son solo representaciones. Este es el tipíco caso de variables que describen posiciones en un orden.
Las segundas son variables que describen valores ordenados con números. Estas pueden ser continuas o discretas. Las continuas serán variables denominadas “numéricas” y las discretas las “variables de conteo”.
Para no confundirnos, en este documento hablaremos de variables cualitativas para las primeras y cuantitativas.
¡Ojo! Las dos categorías van a tener sub-categrías excluyentes. Es decir, una variable cualitativa no puede pertenecer a los sub-grupos de las cuantitativas y vice-versa, porque una variable cualitativa no puede ser una variable cuantitativa.
Las variables cualitativas pueden, a su vez, ser medidas en dos escalas. Las nominales y las ordinales.
Aquí es importante un aspecto adicional. Cuando decimos que es confuso llamarlas “no numéricas” es porque a veces, las variables cualitativas pueden ser representadas con números. Pero estos números no son valores númericos, son nombres. Como el caso de un equipo de algún deporte colectivo. Los números en sus uniformes son representaciones. Mire al “26”. Como algunos individuos de generaciones pasadas que se llaman “Segundo”. No suelen ser segundos en ninguna categoría pero se llaman de tal forma.
Listo, estos eran los dos subgrupos de las variables cualitativas. Piense en que estos dos tipos de variables sólo van a poder tener una naturaleza: ¡Sí, discreta!.
Aquí tenemos que definir algo importante. Esta clasificación varia de autor a autor, usted quedése con la que le parezca útil. Sepa que existen discusiones sobre cuál es la mejor pero no hay consenso. Entonces, seamos parsimoniosos, recordemos que toda variable se puede clasificar por naturaleza (discreta o continua) y ahora por la manera de ser medida. Pero, si quiere pensar en una relación entre la naturaleza y la manera de ser medida, piense que las variables cuantitativas discretas son las variables de conteo y las cuantitativas continuas las numéricas.
Las variables cuantitativas, al igual que las cualitativas, se dividen en dos subgrupos: aquellas que pueden ser medidas bajo una escala de razón y aquellas que púeden ser medidas bajo una escala de intervalo. Aquí, la gran diferencia va a ser la intepretación del 0. Aquí hay discusión también, pero nosotros consideramos que tanto las cuanititativas discretas como las continuas pueden clasificarse en estos dos sub-grupos.
El calendario gregoriano (el calendario que siempre usamos) nos permite entender esto facilmente. Este calendario divide el tiempo en dos grandes fragmentos, antes de Cristo y después de Cristo. Este cero, al menos a nivel histórico y no por el valor que pueda tener ese evento, fue elegido arbitrariamente. Entonces, si nos preguntamos cuál es la mitad de 2000 años transcurridos, intuitivamente resolveremos que 1000 años. Es muy diferente decir cual es la mitad del tiempo transcurrido para el año 2000 según el calendario Gregoriano. Aunque inicialmente pensariamos que por tratarse de una mitad la respuesta es 2000 dividido en 2, dado que el cero es arbitrario, debemos también contar los años negativos. Así, la mitad debe ser 2000 (los positivos) + todos los años transcurridos desde que se originó el tiempo. No sabemos exactamente esa fecha porque si la supiéramos tendríamos un 0 absoluto.
Otros ejemplos: Los grados celsius, la presión tóracica, algunas cuentas bancarias (cuando hay deuda).
Estas variables nos permitirán realizar todos los cálculos que creamos convenientes excepto, razones (fracciones).
Estas se llaman de intervalo pues, los intervalos entre los valores es el mismo. Los años entre 2000 A.C y el nacimiento de Jesucristo es el mismo tiempo transcurrido desde el nacimiento hasta el 2000 D.C.
Si entendimos lo que son las variables de intervalo, las de razón son bastante sencillas. En este caso el cero es absoluto, lo que se traduce en ausencia de valor. Dado que el cero es absoluto, con estas variables si podemos realizar razones. Este tipo de variables es el que nos permitirá hacer todos los cálculos que consideremos necesarios. De ahí el nombre, se pueden hacer razones con los valores, y tiene sentido!!
Se entiende que existen múltiples preguntas de investigación y que de estas depende como se organizará la clasificación de las variables. No obstante, piense que en términos generales su investigación intentará describir la frecuencia de cierta característica (variable) en cierta población o tratar de establecer una relación entre dos características (variables). Esto hace referencia al modulo 1, ahí se mencionaban las preguntas descriptivas y las preguntas analíticas.
Para este caso, las variables se dividen en 5 sub-categorías: variables dependientes, independientes, variables de confusión, variables modificadoras del efecto y variables intermediarias.
Estas son denominadas también variables desenlace pues, se trata de aquellas variables cuyo comportamiento según otras variables (independientes). Es decir queremos ver si esa variable desenlace depende de otras.
En un estudio, si quisiera ver si la falla cardíaca es más frecuente en los fanáticos de las alitas de pollo picantes que en aquellos que no, mi variable dependiente es la falla cardíaca.
Estas también se conocen como variables de exposición y como su nombre lo indica, estas no dependen de otras variables. Se pueden medir de varias formas según la prgunta de investigación.
En nuestro ejemplo, la variable independiente sería consumo de las alitas de pollo picantes. Esta no sé modfica, lo que se modifica es la presencia de falla cardíaca según se consuman alitas o no. Lo que queremos vver es si consumir alitas (y tal vez, en que magnitud) aumenta el reisgo de tener falla cardíaca.
Sin embargo, entre las dos caractéristicas, usted habrá deducido que existen muchos factores que se entromenten para poder concluir que en efecto, consumir alitas de pollo picantes es causa de falla cardíaca. Aquí entran al ruedo los otros 3 tipos de variables.
Dentro de estas existen tres tipos: las variables de confusión, las variables modificadoras del efecto y las variables intermediarias.
Se trata de variables que se relacionan de alguna forma con la variable dependiente y con la variable independiente. Y que pueden estar confundiendo el resultado. Pero tiene que estar relacionda con ambos. Es decir, se sabe que esta variable tiene un efecto en la variable dependiente y además, esta variable suele relacionarse también con la variable independiente.
En nuestro ejemplo tenemos:
¡Momento! Será que no se nos está olvidando algo. Las personas que son fanáticas de las alitas de pollo picantes, suelen comer muchas alitas de pollo picantes y por ende, suelen ser obesos. Además ser obeso es un factor de riesgo para falla cardíaca.
¿Si ve? Se relaciona con ambas variables y puede confundir el resultado. No era que consumieran alitas de pollo picantes, era que eran obesos. Nuestra variable de confusión sería estado nutricional.
Estas son variables que interactuán con la variable independiente. Estas variables no representan por sí mismas un factor de riesgo para presentar el desenlace. Son variables que suelen magnificar el efecto de la variable independiente.
En nuestro muy esperado estudio, una variable modificadora del efecto podría ser la ciudad de residencia. No es porque yo viva en “Pollopólis” que tenga un mayor riesgo de falla cardíaca. Pero, si al final descubrimos que el consumo de alitas de pollo picantes si es un factor de riesgo, de pronto es mucho mas grande el efecto si vivo en “Pollopólis” que en “Ciudad Verdura”. Pero no es el hecho de yo vivir en alguna de estas dos ciudad lo que me aumenta el riesgo, es el hecho de comer alitas en alguna de las dos ciudades.
En este caso la variable modificadora del efecto es la ciudad de residencia.
¡Alerta terminológica! Esta variables (confusión y modificadoras del efecto) suelen denominarse variables de control. Esto porque cuando yo intento ver una asociación entre dos variables voy a intentar controlar estas variables ya sea por medio de una metodología y diseño sólidos o por medio de análiss estadístico robusto.
Estas variables se ubican en la vía causal de ambas variables (dependiente e independiente). Es decir, suele relacionarse como variable dependiente para la variable independiente e independiente para la variabe dependiente.
Imaginese que el comer alitas de pollo picantes sea causa (demostrada) de una enfermedad llamada “pollorrea picantocóccica” y que además también se sabe, que esta enfermedad causa falla cardíaca.
En nuestro ejemplo, la “pollorrea picantocóccica” sería una variable intermediaria.
Otro ejemplo más real:
¿Será que la intolerancia a los carbohidratos causa ceguera?
La intolerancia a los carbohidratos suele traducirse en una Diabetes Mellitus. Y esta, suele traducirse (a largo plazo) en retinopatía. Que a su vez puede devenir ceguera.
La intolerancia a los carbohidratos era nuestra variable independiente y la dependiente era la ceguera. Como variables intermediarias estan tener diabetes mellitus y tener retinopatía diabética.
Las variables se pueden clasificar por naturaleza, según la manera en que son medidas o según la función que cumplen dentro de una pregunta de investigación.
La utilidad de clasificarlas yace en que según como se clasifique se pueden realizar cierto tipo de cálculos y cierto tipo de pruebas estadísticas.
No se preocupe por ponerle todos los apellidos posibles a la variable. Sea práctico:
Las variables cualitativas siempre son discretas. No hace falta recordarlo cada vez.