Capítulo 4 Divide y vencerás

En estos momentos tu fobia a las fórmulas debe haber disminuido por lo que probablemente puedas leer la ecuación (4.1) de frecuencias relativas. Ilustrándola con nuestro ejemplo de fumadores, decimos que los \(n\) sujetos que fuman \(i\) es igual a la cuenta del subconjunto \(i\); es decir, la frecuencia absoluta \(f_{i}\), dividida entre la cuenta total del conjunto de sujetos \(N\).

\[\begin{equation} n_{i}=\frac{f_{i}}{N} \tag{4.1} \end{equation}\]

En términos prácticos, sabes que se trata de un porcentaje; sin embargo, hay mucho que aprender de esta fórmula tan sencilla. Haz memoria para recordar cuál fue el nivel de complejidad con el que fuiste aprendiendo en la escuela primaria. Primero aprendiste a sumar y restar, luego a multiplicar, eso era más difícil que sólo sumar o restar, pero podías salir avante utilizando nuevamente tus dedos y un poco de imaginación. Después de todo, multiplicar era sólo sumas con esteroides. Sin que te dieras cuenta, una vez libradas esas primeras dificultades, diste un salto cuántico cuando aprendiste a dividir. Desde tu primer encuentro con una división conociste el rostro de Shiva3. ¡Eso sí que trauma a cualquiera! ¿Sabes por qué? Porque, ¡para oreja!, la división es el as debajo de la manga de la ciencia. El mundo y los fenómenos naturales no se encuentran separados; los científicos necesitan dividirlos para estudiarlos. Siempre que usas una división tu mente inquisidora está buscando explicaciones. La división es el equivalente al por qué. La respuesta a ese porqué es el denominador de cualquier división. Después de las frecuencias absolutas ya no queda nada en la estadística que no use la división para comparar o explicar los fenómenos. Hay un patrón en todas las ecuaciones estadísticas: la diversidad (varianza, otra forma de decir diversidad), la independencia (aleatoriedad, otra forma de decir independencia) siempre son el común denominador de esas ecuaciones. Si crees que esto se empieza a poner turbio, no te desanimes; sigue leyendo y poco a poco irás entendiendo el enunciado anterior.

Vamos a repasar la ecuación (4.1). Primero se calcula la frecuencia absoluta \(f_{i}\), o sea, contamos las veces que sucede lo que nos interesa (recuerda que \(i\) se lee como un subconjunto, una clase o categoría de algo). Posteriormente, al dividirlo por \(N\), esto es, el total de casos o la variación total, se busca una respuesta a cuánto equivale esa categoría o clase; es decir, cuál es su peso. \(N\) es la variable independiente; la que explica ese cuánto. La frecuencia \(f_{i}\) y su porcentaje dependen del total de casos o variación. Una vez que se ha separado \(f_{i}\) y descubierto el peso que tiene es posible compararlo con otro fenómeno de su misma naturaleza para analizar si tienen causas comunes o están relacionados de alguna forma. Por ejemplo, supón que entrevistamos \(200\) personas: \(N=200\) y \(60\) de ellas nos dicen que fuman la marca Camel: \(f_{c}=60\), nota que cambié \(i\) por \(c\) para identificar que se trata de la categoría Camel, entonces el peso de esa marca es del \(30\%\): \(\frac{60}{200}=.30\). Por otro lado, la suma de los que fuman Marlboro es de \(120\): \(f_{m}=120\), lo cual corresponde al \(60\%\): \(\frac{120}{200}=.60\). Si comparamos estos dos resultados entre sí, es obvio que Marlboro es más importante que Camel. En general, así es como se presentan los resultados de cualquier estudio, en porcentajes; nunca en frecuencias absolutas4. De esta forma es posible comparar en el tiempo si el consumo, conocimiento, crecimiento, etc. aumentó o disminuyó. No importa si una vez se entrevistaron a \(200\) consumidores y otra a \(300\); el colocar al total de esas entrevistas en el denominador de la ecuación el resultado queda explicado por el tamaño de la muestra; la variable independiente. Ten presente que la muestra es la suma total de todas las respuestas; o sea, la variación total, esa siempre va en el denominador de la ecuación porque es la explicación de la variación que observas. Esta relación: independencia o variación y explicación es tan importante que volveremos a hablar de ella en la sección Barcos de papel (13). Con eso deberá de quedarte claro el truco que usaron los grandes genios de la estadística: Pearson, Gauss, Galton, y muchos otros; y que siguen usando los científicos de nuestra época.


  1. Shiva es el Dios hindú de la creación y destrucción del universo. Posiblemente, la mejor forma de dimensionar esta metáfora sea buscando una imagen y la historia del monumento que hay a la entrada del antiguo CERN (European Organization for Nuclear Research), actualmente gran colisionador de hadrones (LHC).

  2. Como en todo hay excepciones, en un estudio en el que las muestras son pequeñas, 20 casos o menos, quizá sea preferible mostrar los resultados en frecuencias absolutas porque los porcentajes nos inducen a pensar en grandes poblaciones.