Capítulo 3 Jack en el fin del mundo

No existe lo absoluto; todos dependemos de algo o alguien. Nadie puede subsistir solo, como Jack Sparrow en el fin del mundo. Lo absoluto, así como Jack Sparrow, no depende de nada ni de nadie para existir. El caso es que en la estadística sí existe el término absoluto y, en efecto, no depende de nada. Vamos a ver cómo se dice esto matemáticamente. Te apuesto 10 a 1 a que cuando ves este símbolo \(\sum\) en alguna fórmula matemática o estadística, te suda la amígdala2. Esto se debe a que nos causa estrés lo que no conocemos. Hasta una ecuación tan simple como la (3.1) tiene el poder de activar tu sistema de alarma.

\[\begin{equation} \sum_{i=1}^{n}f_{i}=N \tag{3.1} \end{equation}\]

Esta ecuación es la fórmula más sencilla que hay en estadística; se trata de contar palitos. Sí, aunque no lo creas, hubo un tiempo en que los investigadores de mercado contaban palitos. Cuando no existían las computadoras o no era fácil ni barato tener acceso a ellas se tabulaban las respuestas de cada cuestionario sobre un papel cuadriculado o milimétrico llamado sábana. Por ejemplo, para contar cuántas marcas de cigarros conocían los consumidores, el investigador trazaba un palito inclinado (\(/\)) por cada marca distinta que conocía el consumidor. Cuando el investigador llegaba a la cuenta de cinco palitos de una misma marca cruzaba los cuatro palitos anteriores con el quinto palito; algo parecido a esto ////. Efectivamente, te imaginas bien, igualito que un matón del viejo oeste marcando en la cacha de su Colt el número de muertitos que tenía en su haber, o el preso contando los días que lleva encerrado en la cárcel. Eso es lo que representa este símbolo \(\sum\). Se llama sigma por el alfabeto griego, se conoce como sumatoria y te indica que debes sumar lo que aparece a su derecha. ¿Verdad que hay algo familiar en la letra sigma que nos recuerda el símbolo que se formaba cuando la cuenta del investigador llegaba a cinco marcas: //// -> \(\sum\)?

La igualdad debajo del símbolo de la sumatoria de la ecuación (3.1) \(i=1\), se llama índice y señala que hay que hacer la suma iniciando con el elemento \(1\); la \(n\), en la parte superior de la sumatoria, expresa que se termina de contar hasta que se llega a \(n\), el cual es un número también, pero se desconoce porque depende del total de objetos dentro de una categoría o clase específica. Asimismo, tampoco se dice qué elemento es \(i\), sólo se sabe que empezaremos a contarlo desde el primero. Sin embargo, podemos mencionarle como los que fuman camel, los que votan por el PAN, los católicos, las universitarias, etc. Es decir, cualquier persona, animal o cosa que se pueda contar. Como en la teoría de conjuntos, son subconjuntos de un conjunto más grande. Entonces, la idea es contar los elementos, empezando desde el primero para cada subconjunto y sumarlos. A eso se refiere la \(fi\); frecuencias de una clase, categoría o subconjunto. Al final, la suma de las frecuencias de todos los subconjuntos: \(\sum_{i = 1}^{n}f_{i}\) es igual a toda la población de estudio: \(N\). Disponer las cosas de esta manera hace que la ecuación pueda ser aplicada a cualquier cosa o fenómeno que queramos contar.

La siguiente historia te va a sonar familiar. Para el común de los mortales un número es un número y nada más, no tiene ninguna característica especial con respecto a los otros; ni modo que los haya con pedigrí. Sin embargo, para los griegos no era así, ellos clasificaban a los números de acuerdo a su función. Por ejemplo, los que usamos para contar, ellos los llamaban números naturales; o sea, el uno, el dos, el tres, el cuatro, y así sucesivamente. Posiblemente, fijándose en esto los matemáticos decidieron usar el símbolo \(N\), de natural, para recordarnos que la \(N\) es un conjunto de números que se cuentan; no son decimales ni fracciones, sino enteros. La diferencia con la \(n\) minúscula es que ésta representa un elemento \(n\) del conjunto \(N\). En este caso \(n\) representa a cada elemento o caso del conjunto total \(N\). En términos generales, en matemáticas siempre se usan mayúsculas para referirse a conjuntos y minúsculas para hablar de sus elementos. ¿Entiendes ahora porque Einstein escribió su famosa ecuación de la relatividad con una \(E\) (Energía) mayúscula y las letras \(m\) y \(c\) minúsculas? Exacto, porque la \(E\) es un conjunto y la \(m\) y \(c\) son tan sólo dos elementos o casos particulares de masa y velocidad de un conjunto infinito de posibilidades.

En resumen, la fórmula de la ecuación (3.1) nos dice que las frecuencias absolutas, simbolizadas por \(f_{i}\), se obtienen sumando todas las frecuencias (número de veces) de una misma clase \(i\) de una población \(N\). Nota que usamos el verbo contar para referirnos a los símbolos que están debajo y encima de la sumatoria y usamos sumar cuando nos referimos a lo que está a la derecha de la sumatoria. Es una diferencia sutil, pero sustancial. Contar y sumar no es lo mismo. Cuando cuentas lo haces de uno en uno, empleando números naturales; es decir, enteros y consecutivos. Cuando sumas no existe tal restricción, lo puedes hacer por bloques, números no consecutivos, decimales, etc.

Cualquier resultado de sumar así las cosas depende del número de sujetos o cosas que se tienen para contar. ¿Cuántos fumadores de Marlboro hay? Bueno, depende del tamaño de muestra que hayas escogido. Es decir, no es lo mismo entrevistar 1,000 fumadores que 100. Hay más fumadores de Marlboro en una muestra de 1,000 que en una de 100; eso nadie lo discute. Ese es el problema con el cálculo de las frecuencias absolutas: te dice cuántos, pero no te ayuda a entender el fenómeno, o a comparar y relacionar las cosas; porque son absolutas, no dependen de ninguna otra cosa más que de sí mismas. El número de fumadores depende exclusivamente de cuántas personas entrevistes. En otras palabras, si haces publicidad, bajas el precio del producto, cambias el empaque, o cualquier otra cosa que hagas, no se ve reflejado en el número absoluto de fumadores. Jamás se puede saber si hay una variación, a menos de que el experimento se repita bajo las mismas condiciones; específicamente hablando, se entreviste al mismo número de sujetos. Claramente, no se puede llegar a ninguna conclusión cuando un investigador nos dice que hay 35 personas que fuman Marlboro y otro investigador independiente comenta que él encontró 170 personas que fuman dicha marca. Necesitamos un indicador que nos de una buena idea de los resultados de ambas investigaciones; que ayude a comparar entre investigaciones y establecer diferencias. Ese indicador es la frecuencia relativa, el principal instrumento de medición de cualquier investigador social y, algo que no imaginas, es la semilla de una mente científica. En términos vulgares, se le dice porcentaje.


  1. La amígdala es un parte del cerebro humano que se encarga de regular las emociones.