1.1 Antecedentes históricos: de la aritmética política a la estadística

Fuentes principales: Los orígenes de la estadística: de investigación socio-política empírica a conjunto de técnicas para el análisis de datos, de Juan I. Piovani (Piovani 2007)) y Masa Crítica: cambio, caos y complejidad, de Philip Ball (Ball 2004), cuya lectura recomiendo para el que le gusten estos temas.

“La concepción estadístico-probabilística de la realidad ha pasado a ser uno de esos sistemas de ideas que el hombre contemporáneo ha naturalizado. Concebir los hechos de la vida —incluso aquellos de la vida cotidiana— desde una perspectiva estadística se encuentra tan difundido que frecuentemente ni siquiera el hombre de ciencia se detiene a pensar que se trata en realidad de una construcción socio-histórica, un producto del pensamiento humano; no de una característica natural intrínseca a la realidad misma”.

— J.I. Piovani

Es muy común entender como estadística cualquier estudio (mas o menos breve) consistente en una descripción gráfica y/o numérica de un conjunto de datos. Sin embargo, lo que se conoce como teoría estadística o estadística matemática corresponde, desde hace ya tiempo, a la disciplina científica dedicada a los instrumentos conceptuales y operativos para el análisis cuantitativo de datos.

La estadística como ciencia (de los datos y las probablidades) surge como un proceso de transformación de tres disciplinas que se iniciaron a mediados del siglo XVII: la Political Arithmetic inglesa, la Statistik alemana y la Théorie mathématique des probabilités francesa. En un principio, la estadística se dedicaba exclusivamente a la recolección de información a través de datos que realizaban entes oficiales. Posteriormente, este tipo de estudios se enlazaron con la teoría matemática de las probabilidades, para devenir en la actual ciencia de los datos.

A continuación, detallamos un poco más los comienzos de esta disciplina.

De antiguo, los distintos gobiernos realizaron, continua o descontinuamente, los llamados censos de población, fundamentalmente encaminados al control de las cifras de habitantes y al pago de los impuestos. Se conocen censos en fechas muy antiguas, en China, en Egipto, en el imperio Romano…

A partir del siglo XVII algunos investigadores comenzaron a pensar que los datos numéricos que se obtenían podrían utilizarse para interpretar el comportamiento de la sociedad. A través de la observación de los datos a lo largo del tiempo se comprobó que existían ciertas pautas que se mantenían invariablemente, o bien cambiaban de alguna forma que permitía intuir el modo y la magnitud de dicho cambio. Los que primero se fijaron en esta posibilidad fueron los ingleses. Se conviene que el precursor del análisis estadístico de los problemas sociales fue John Graunt (considerado el primer demógrafo, fundador de la bioestadística y precursor de la epidemiología, 1620-1674), mediante su trabajo Natural and Political Observations on the Bills of Mortality.

John Graunt.

Figura 1.1: John Graunt.

Las London Bills of Mortality constituían la recopilación de datos demográficos existente en Gran Bretaña. En este libro se recogieron tablas de mortalidad y también las causas de los mismas. Dicha recopilación de datos era desarrollada por organismos gubernativos, como se haría también en otros estados europeos, fundamentalmente en en Francia y Prusia. El trabajo de John Graunt fue precursor en el tipo de análisis, puesto que no se limitó a describir las cifras, sino en darles contenido y sentar las bases de los trabajos que más tarde serían necesarios para la introducción de cualquier reforma social. Así, La Aritmética Política se definió como una ciencia de la sociedad cuyas conclusiones dependen de números y medidas.

Más tarde, William Petty (filósofo, médico, economista y estadístico inglés, 1623-1687), introdujo la expresión political arithmethic (Cullen 1975), que más tarde derivaría en estadística social.

William Petty.

Figura 1.2: William Petty.

Emtre 1780 y 1830 comenzaron a manifestarse algunas señales de expansión y diversificación de las estadísticas sociales en Gran Bretaña: se instituyó un censo nacional, se reforzó el desarrollo de las estadísticas médicas, se propusieron nuevas técnicas de análisis y se aplicaron técnicas ya conocidas a problemas hasta entonces no cuantificados (Cullen 1975). En este periodo apareció el término statistics en la lengua inglesa, como una traducción que Hooper (1770) hizo del vocablo alemán Statistik. Siguiendo la tradición alemana, el neologismo inglés fue definido como la ciencia que enseña el ordenamiento político de los estados modernos conocidos en el mundo.

En Alemania, sin embargo, la palabra Statistik tenía un significado diferente, pues correspondía a la ciencia que se ocupaba de los estados naturales de la sociedad. Uno de los precursores de la disciplina, J.P. Süssmilch (presbítero, pastor protestante, estadístico y demógrafo alemán; 1707-1767), por ejemplo, sostenía en su libro El orden divino que las diferencias de las tasas de natalidad y de mortalidad de niños y niñas se equilibraban perfectamente a fin de que todos los ciudadanos tuvieran perspectivas de matrimonio. De esta forma, empezó a considerarse la idea de que la sociedad mantenía reglas que ningún gobernante decretaba. El mismo Immanuel Kant habló de “leyes universales”. En 1752, Gottfried Achenwall, (economista y profesor en Göttingen, 1719-1772) presentó un trabajo sobre las constituciones de varios estados europeos, describiendo, de una forma similar a lo que hoy llamaríamos estadística, detalles sobre su agricultura, industria y comercio.

Uno de los primeros trabajos de estadística, en este mismo sentido, apareció por primera vez en lengua inglesa en 1791, con la publicación del primero de los 21 volúmenes de Statistiscal Account of Scotland. En ellos, John Sinclair (1754-1835) describió a la investigación estadística como aquella que hace referencia a la población, las circunstancias políticas, la producción y otros aspectos del Estado. Mientras las investigaciones alemanas llamadas statistik se interesaban por las cuestiones del Estado, aquellas propuestas por Sinclair buscaban determinar la forma del progreso para el pueblo. Fue la primera persona que usó el término “estadística” en el lenguaje inglés.

El desarrollo de las estadísticas numéricas comenzó en Gran Bretaña en la primera mitad del siglo XIX. La recolección y compilación de datos numéricos estaba ya bien establecida en esas fechas, pero todavía no se realizaba ningún tratamiento matemático avanzado de los mismos. Según la dinámica habitual, los datos “crudos”, sin “opiniones”, constituían la característica esencial de la ciencia y el fundamento de la estadística. Así, la primera regla de la Royal Statistical Society (fundada en 1834 como Statistical Society de Londres) fue excluir los pareceres. William Farr (epidemiólogo inglés, 1807-1883), en nombre de la Sociedad, escribió a Florence Nightingale (enfermera, escritora y estadística británica, 1820-1910): “no queremos impresiones, sólo hechos”. Los números eran los hechos, pero Florence Nightingale abogaba por analizar y describir estos hechos (o números). Mas adelante, sin embargo, la opinión de Farr cambiaría, cuando le ayudó a analizar los datos de la guerra de Crimea (1853-1856), revelándose que la causa de 16.000 de las 18.000 muertes de soldados británicos no fueron heridas sufridas en batallas, sino enfermedades provocadas por falta de higiene.

William Farr.

Figura 1.3: William Farr.

Florence Nightingale, considerada precursora de la enfermería profesional moderna.

Figura 1.4: Florence Nightingale, considerada precursora de la enfermería profesional moderna.

Diagrama polar, presentado por Florence Nightingale.

Figura 1.5: Diagrama polar, presentado por Florence Nightingale.

En 1832 se fundó el Departamento de Estadística del Ministerio de Comercio (Board of Trade), una oficina centralizada capaz de generar estadísticas para la ayuda de las reformas promovidas por importantes actores políticos y sociales de la época. Los estudios estadísticos de aquellos años se encaminaban, fundamentalmente, a intentar establecer las causas de problemas sociales, como el aumento de los crímenes, la inestabilidad social, etc. Los promotores de estas investigaciones solían ser, en general, contrarios a la intervención del gobierno en la economía, pero si partidarios de la intervención en sanidad y educación. Progresivamente, fueron incorporándose técnicas análiticas de contenido matemático más avanzado -ya muy habituales en astronomía-, y de este modo se empezaron a identificar regularidades estocásticas, lo que a su vez reforzó con nuevas bases el uso de las probabilidades (Porter 1986).

Paralelamente, en Francia surgirían dos figuras que habrían de pasar a la posteridad igual que sus homólogos ingleses: el abogado André-Michel Guerry (1802-1866) y y el astrónomo Adolph Quetelet (Bélgica, 1796-1874)

André Guerry.

Figura 1.6: André Guerry.

Lambert Adolphe Jacques Quetelet, considerado uno de los padres de la sociología, y creador del índice de masa corporal.

Figura 1.7: Lambert Adolphe Jacques Quetelet, considerado uno de los padres de la sociología, y creador del índice de masa corporal.

“La Estadística criminal se hace tan positiva cómo en las otras Ciencias de observación. Cuando uno sabe cómo tratar hechos establecido se agrupan los de manera que quieren separadas las circunstancias meramente accidentales, Resultados que se presentan entonces tienen una regularidad tal qué es imposible atribuirlos al azar. Cada año se registran el mismo numero de delitos del mismo tipo. Cada clase de delito tiene su peculiar distribución por sexo, por edad, por estación… Estamos obligados a reconocer que muchos aspectos de las estadísticas judiciales representan una certeza absoluta. Nos vemos obligados a reconocer que los hechos del orden moral están sujetos, lo mismo que los del orden físico, a leyes invariables.”

— Carta de Guerry a Quetelet, julio de 1931

Guerry había constatado estos hechos a partir de los datos de la publicación anual Recherches statistiques sur la ville de París et le départment de la Seine, cuyo director era el matermático Joseph Fourier (1768-1830). De los mismos, se deducían impresionantes estabilidades sobre los delitos, los crímenes y los suicidios.

Joseph Fourier.

Figura 1.8: Joseph Fourier.

En Francia, el sucidio mas común era el carbon de leña y arrojarse al agua. En Londres se ahorcaban o usabam un arma de fuego. No solo se estimaba que los procedimientos suicidas eran regulares sino que los suicidios variaban según las estaciones. Igual que ahora, los habitantes de Inglaterra y Gales son los menos suicidas de Europa (excluyendo a los irlandeses). Entonces como ahora, los europeos de cualquier nación eran más suicidas durante el verano que durante el invierno.

Guerry había sido contratado en 1827 por el Ministerio de Justicia francés para estudiar los datos sobre los delitos en París. En 1829 publicó, junto con el geógrafo veneciano Adriano Balbi, una serie de mapas de Francia analizando y comparando los delitos contra la propiedad y contra las personas, en los distintos departamentos. De este modo, no logró encontrarse relación directa entre educación y criminalidad. El trabajo de Guerry fue el precursor de los mapas geográficos criminológicos. Como puede comprobarse en el trabajo de Friendly (Friendly 2007), la obra de Guerry es “una oportunidad” para aprender y/o enseñar análisis multivariante con datos de corte histórico (disponibles en el paquete de R Guerry).

En 1864, Guerry publicó Statistique morale de l’Angleterre comparée avec la statistique morale de la France. En esta obra, analizó 226.000 casos de delitos contra las personas en Francia e Inglaterra, a lo largo de 25 años, y más de 85.000 registros de suicidios, indicando su supuesta causa.

El avance más fundamental, sin embargo, que acabaría derivado en la teoría estadística moderna, no surgiría hasta finales del siglo XIX, cuando se empezó a estudiar la variabilidad de los procesos que regían no sólo la sociedad, sino los comportamientos y características individuales. Francis Galton (1822-1911) fue el máximo responsable de lo que sería un paso de gigante en el avance de la disciplina que nos compete.

Sir Francis Galton, primo de Charles Darwin. Recomendamos leer su biografía por la increible cantidad de avances que aportó a la ciencia.

Figura 1.9: Sir Francis Galton, primo de Charles Darwin. Recomendamos leer su biografía por la increible cantidad de avances que aportó a la ciencia.

La teoría darwinista de la evolución llevó a Galton a interesarse por el problema de la herencia de los diferentes atributos humanos. Para ello, estudió la teoría de los errores (la curva Gaussiana o Normal) que ya Quetelet había utilizado profusamente para estudiar las características físicas y psicológicas humanas. Profundamente influenciado por los trabajos de Simon Laplace (1749-1827) (ver capítulo 4), Quetelet se convenció, hacia 1830, de la posibilidad de tratar las cuestiones humanas aplicando los métodos ya comunes en astronomía, yendo más allá de la mera recolección y clasificación de los datos.

Pierre Simon Laplace.

Figura 1.10: Pierre Simon Laplace.

Bibliografía

Piovani, Juan Ignacio. 2007. “Los orígenes de La Estadística: De Investigación Socio-Política Empírica a Conjunto de Técnicas Para El análisis de Datos.” Revista de Ciencia Política Y Relaciones Internacionales 1 (1): 25–44.

Ball, Philip. 2004. Masa Crítica. Cambio, Caos y Complejidad. Turner Publicaciones.

Cullen, Michael J. 1975. The Statistical Movement in Early Victorian Britain: The Foundations of Empirical Social Research. Harvester Press.

Porter, Theodore M. 1986. The Rise of Statistical Thinking, 1820-1900. Princeton University Press.

Friendly, Michael. 2007. “A.-M. Guerry’s‘ Moral Statistics of France’: Challenges for Multivariable Spatial Analysis.” Statistical Science. JSTOR, 368–99.