1.1 De la aritmética política a la estadística

La mayoría de las ideas y notas que se ofrecen en esta introducción han sido tomadas de dos libros: Los orígenes de la estadística: de investigación socio-política empírica a conjunto de técnicas para el análisis de datos, de Juan I. Piovani (Piovani 2007)) y Masa Crítica: cambio, caos y complejidad, de Philip Ball (Ball 2004), cuya lectura recomiendo para el que le gusten estos temas.

“La concepción estadístico-probabilística de la realidad ha pasado a ser uno de esos sistemas de ideas que el hombre contemporáneo ha naturalizado. Concebir los hechos de la vida —incluso aquellos de la vida cotidiana— desde una perspectiva estadística se encuentra tan difundido que frecuentemente ni siquiera el hombre de ciencia se detiene a pensar que se trata en realidad de una construcción socio-histórica, un producto del pensamiento humano; no de una característica natural intrínseca a la realidad misma”.

— J.I. Piovani

Es muy común entender como estadística cualquier estudio (más o menos breve) que consista en una descripción gráfica y/o numérica de un conjunto de datos. Sin embargo, lo que se conoce como teoría estadística o estadística matemática corresponde, desde hace ya tiempo, a la disciplina científica dedicada a los instrumentos conceptuales y operativos para el análisis cuantitativo de datos.

La estadística como ciencia (de los datos y las probabilidades) surge como un proceso de transformación de tres disciplinas que se iniciaron a mediados del siglo XVII: la Political Arithmetic inglesa, la Statistik alemana y la Théorie mathématique des probabilités francesa. En un principio, la estadística se dedicaba exclusivamente a la recolección de información a través de datos que realizaban entes oficiales. Posteriormente, este tipo de estudios se enlazaron con la teoría matemática de las probabilidades, para converger en la actual ciencia de los datos.

A continuación, detallamos un poco más los comienzos de esta disciplina:

Desde muy antiguo, los distintos gobiernos realizaron, continua o discontinuamente, los llamados censos de población, principalmente encaminados al control de las cifras de habitantes y al pago de los impuestos. Se conocen censos en fechas muy antiguas en China, en Egipto, en el imperio Romano…

A partir del siglo XVII algunos investigadores comenzaron a pensar que los datos numéricos obtenidos de estos censos tal vez podían ser utilizados para interpretar el comportamiento de la sociedad. A través de la observación de los datos a lo largo del tiempo se comprobó que existían ciertas pautas que se mantenían invariablemente, o bien cambiaban de alguna forma que permitía intuir el modo y la magnitud de dicho cambio. Los que primero observaron esta cualidad de los datos fueron los ingleses. El primero en utilizar el análisis estadístico para estudiar los problemas sociales fue John Graunt (considerado el primer demógrafo, fundador de la bioestadística y precursor de la epidemiología; 1620-1674), mediante su trabajo Natural and Political Observations on the Bills of Mortality.

Figura 1.1: John Graunt (izquierda) y William Petty (derecha).

Las London Bills of Mortality fueron la primera recopilación de datos demográficos de Gran Bretaña. En ellas se recogieron tablas de mortalidad y también las causas de los mismas. Dicha recopilación de datos se llevó a cabo por organismos gubernativos, como se haría también en otros estados europeos, fundamentalmente en Francia y Prusia. El trabajo de John Graunt fue precursor en el tipo de análisis, puesto que no se limitó a describir las cifras, sino en darles contenido y sentar las bases de los trabajos que más tarde serían necesarios para la introducción de cualquier reforma social.

Más tarde, William Petty (filósofo, médico y economista inglés, 1623-1687), introdujo la expresión political arithmethic (Cullen 1975), que más tarde derivaría en estadística social. Esta se definió como una ciencia de la sociedad cuyas conclusiones dependen de números y medidas.

Entre 1780 y 1830 comenzaron a manifestarse algunas señales de expansión y diversificación de las técnicas y usos de las estadísticas sociales en Gran Bretaña: se instituyó un censo nacional, se reforzó el desarrollo de las estadísticas médicas, se propusieron nuevas técnicas de análisis y se aplicaron técnicas ya conocidas a problemas hasta entonces no cuantificados (Cullen 1975). En este periodo apareció el término statistics en la lengua inglesa, como una traducción que Hooper (1770) hizo del vocablo alemán Statistik. Siguiendo la tradición alemana, el neologismo inglés fue definido como la ciencia que enseña el ordenamiento político de los estados modernos conocidos en el mundo.

En Alemania, sin embargo, la palabra Statistik tenía un significado diferente, definiéndose como la ciencia que se ocupa de los estados naturales de la sociedad. Uno de los precursores de la disciplina, J.P. Süssmilch (presbítero, estadístico y demógrafo alemán; 1707-1767), por ejemplo, sostenía en su libro El orden divino que las diferencias de las tasas de natalidad y de mortalidad de niños y niñas se equilibraban perfectamente a fin de que todos los ciudadanos tuvieran perspectivas de matrimonio. De esta forma, empezó a considerarse la idea de que la sociedad mantenía reglas que ningún gobernante decretaba. El mismo Immanuel Kant habló de “leyes universales”. En 1752, Gottfried Achenwall, (economista y profesor en Göttingen; 1719-1772) presentó un trabajo sobre las constituciones de varios estados europeos, describiendo, de una forma similar a lo que hoy llamaríamos estadística, detalles sobre su agricultura, industria y comercio.

Uno de los primeros trabajos de estadística, en este mismo sentido, apareció por primera vez en lengua inglesa en 1791, con la publicación del primero de los 21 volúmenes de Statistical Account of Scotland. En ellos, John Sinclair (1754-1835) describió a la investigación estadística como aquella que hace referencia a la población, las circunstancias políticas, la producción y otros aspectos del Estado. Mientras las investigaciones alemanas llamadas statistik se interesaban por las cuestiones del Estado, aquellas propuestas por Sinclair buscaban determinar la forma del progreso para el pueblo. Fue la primera persona que usó el término “estadística” en el lenguaje inglés.

El desarrollo de las estadísticas numéricas comenzó en Gran Bretaña en la primera mitad del siglo XIX. La recolección y compilación de datos numéricos estaba ya bien establecida en esas fechas, pero todavía no se realizaba ningún tratamiento matemático avanzado de los mismos. Según la dinámica habitual, los datos “crudos”, sin “opiniones”, constituían la característica esencial de la ciencia y el fundamento de la estadística. Así, la primera regla de la Royal Statistical Society (fundada en 1834 como Statistical Society de Londres) fue excluir los pareceres. William Farr (epidemiólogo inglés; 1807-1883), en nombre de esta Sociedad, escribió a Florence Nightingale (enfermera, escritora y estadística británica; 1820-1910): “no queremos impresiones, sólo hechos”, refiriéndose a los números, puesto que Florence Nightingale se preocupaba no solo de analizar y describir estos hechos (o números), sino de interpretar los mismos, a la manera en que actualmente se realizan los análisis estadísticos de datos. Más adelante, sin embargo, la opinión de Farr cambiaría, cuando F. Nightingale le ayudó a analizar los datos de la guerra de Crimea (1853-1856), revelándose que la causa de 16.000 de las 18.000 muertes de soldados británicos no fueron heridas sufridas en batallas, sino enfermedades provocadas por falta de higiene.

Figura 1.2: William Farr (izquierda) y Florence Nightingale (derecha).

Figura 1.3: Diagrama polar, presentado por Florence Nightingale.

En 1832 se fundó el Departamento de Estadística del Ministerio de Comercio (Board of Trade), una oficina centralizada capaz de generar estadísticas para la ayuda de las reformas promovidas por importantes actores políticos y sociales de la época. Los estudios estadísticos de aquellos años se encaminaban, fundamentalmente, a intentar establecer las causas de problemas sociales, como el aumento de los crímenes, la inestabilidad social, etc. Los promotores de estas investigaciones solían ser, en general, contrarios a la intervención del gobierno en la economía, pero sí partidarios de la intervención en sanidad y educación. Progresivamente, fueron incorporándose técnicas analíticas de contenido matemático más avanzado -ya muy habituales en astronomía- y, de esta forma, comenzaron a identificarse muchas regularidades, lo que a su vez se reforzó con el uso de las probabilidades (Porter 1986).

Paralelamente, en Francia surgirían dos figuras que pasarían a la posteridad, al igual que sus homólogos ingleses: el abogado André-Michel Guerry (1802-1866) y el astrónomo Adolph Quetelet (Bélgica, 1796-1874)

André Guerry (izquierda) y Adolphe Quetelet (derecha), considerado uno de los padres de la sociología, y creador del índice de masa corporal.

Figura 1.4: André Guerry (izquierda) y Adolphe Quetelet (derecha), considerado uno de los padres de la sociología, y creador del índice de masa corporal.

“La estadística se puede aplicar a la observación de los actos criminales de forma idéntica a cualquier otro acto. Cuando uno sabe cómo tratar hechos establecidos, los datos se agrupan de tal manera que se separen las circunstancias meramente accidentales. Los resultados que se presentan entonces aparecen con una regularidad tal que es imposible atribuirlos al azar. Cada año se registran el mismo número de delitos del mismo tipo. Cada clase de delito tiene su peculiar distribución por sexo, por edad, por estación… Estamos obligados a reconocer que muchos aspectos de las estadísticas judiciales representan una certeza absoluta. Nos vemos obligados a reconocer que los hechos del orden moral están sujetos, lo mismo que los del orden físico, a leyes invariables.”

— Carta de Guerry a Quetelet; julio de 1931.

Guerry había constatado estos hechos a partir de los datos de la publicación anual Recherches statistiques sur la ville de París et le départment de la Seine, cuyo director era el matemático Joseph Fourier (1768-1830). De los mismos, se deducían impresionantes estabilidades sobre los delitos, los crímenes y los suicidios.

En Francia, el suicidio más común era mediante asfixia por carbón de leña y por arrojarse al agua. En Londres, por ahorcamiento o por arma de fuego. No solo se estimaba que los procedimientos suicidas eran regulares, sino que los suicidios variaban según las estaciones. Igual que ahora, los habitantes de Inglaterra y Gales son los menos suicidas de Europa (excluyendo a los irlandeses). De la misma forma, los europeos de cualquier nación eran más suicidas durante el verano que durante el invierno.

Guerry había sido contratado en 1827 por el Ministerio de Justicia francés para estudiar los datos sobre los delitos en París. En 1829 publicó, junto con el geógrafo veneciano Adriano Balbi, una serie de mapas de Francia analizando y comparando los delitos contra la propiedad y contra las personas, en los distintos departamentos. De este modo, no logró encontrarse una relación directa entre educación y criminalidad. El trabajo de Guerry fue el precursor de los mapas geográficos criminológicos. Como puede comprobarse en el trabajo de M. Friendly (Friendly 2007), la obra de Guerry es “una oportunidad” para aprender y/o enseñar análisis multivariante con datos de corte histórico (disponibles en el paquete de R Guerry).

En 1864, Guerry publicó Statistique morale de l’Angleterre comparée avec la statistique morale de la France. En esta obra, analizó 226.000 casos de delitos contra las personas en Francia e Inglaterra, a lo largo de 25 años, y más de 85.000 registros de suicidios, indicando su supuesta causa.

El avance fundamental, sin embargo, que acabaría derivado en la teoría estadística moderna, no surgiría hasta finales del siglo XIX, cuando se empezó a estudiar la variabilidad de los procesos que regían no sólo la sociedad, sino los comportamientos y características individuales. Francis Galton (1822-1911) fue el máximo responsable de lo que sería un paso de gigante en el avance de la disciplina que nos compete.

Sir Francis Galton (izquierda), primo de Charles Darwin, y Pierre Simon Laplace (derecha), dos de las más importantes figuras de la probabilidad y la estadística.

Figura 1.5: Sir Francis Galton (izquierda), primo de Charles Darwin, y Pierre Simon Laplace (derecha), dos de las más importantes figuras de la probabilidad y la estadística.

La teoría darwinista de la evolución llevó a Galton a interesarse por el problema de la herencia de los diferentes atributos humanos. Para ello, estudió la teoría de los errores (la curva Gaussiana o Normal) que ya Quetelet había utilizado para estudiar las características físicas y psicológicas humanas. Profundamente influenciado por los trabajos de Laplace (1749-1827), Quetelet se convenció, hacia 1830, de la posibilidad de tratar las cuestiones humanas aplicando los métodos estadísticos que se usaban ya en astronomía, yendo más allá de la mera recolección y clasificación de los datos.

References

Ball, Philip. 2004. Masa Crítica. Cambio, Caos y Complejidad. Turner Publicaciones.

Cullen, Michael J. 1975. The Statistical Movement in Early Victorian Britain: The Foundations of Empirical Social Research. Harvester Press.

Friendly, Michael. 2007. “A.-M. Guerry’s‘ Moral Statistics of France’: Challenges for Multivariable Spatial Analysis.” Statistical Science. JSTOR, 368–99.

Piovani, Juan Ignacio. 2007. “Los orígenes de La Estadística: De Investigación Socio-Política Empírica a Conjunto de Técnicas Para El análisis de Datos.” Revista de Ciencia Política Y Relaciones Internacionales 1 (1): 25–44.

Porter, Theodore M. 1986. The Rise of Statistical Thinking, 1820-1900. Princeton University Press.