Capítulo 4 Análisis estadístico

Comenzando con el análisis estadístico, podemos empezar con algo simple, graficando los datos en cuestión:

4.1 Gráficos de barras de cada variable

4.1.1 Edades

## # A tibble: 6 x 9
##   `¿En qué rango … `¿Alguna vez ha… `Marca que tan … `¿Crees que el …
##   <chr>            <chr>            <chr>            <chr>           
## 1 Entre 22 y 26 a… Si               Algo eficiente   Si              
## 2 Entre 22 y 26 a… Si               Nada eficiente   Si              
## 3 Mayor a 26 años  No               Poco eficiente   Si              
## 4 Entre 22 y 26 a… Si               Algo eficiente   Si              
## 5 Entre 22 y 26 a… Si               Algo eficiente   Si              
## 6 Entre 22 y 26 a… No               Algo eficiente   Si              
## # … with 5 more variables: `¿Preferirías pagar una pequeña cuota en el sistema
## #   de salud público con tal de que sea más eficiente que ahora?` <chr>, `¿Cuál
## #   de las siguientes consideras que es la mayor debilidad del sistema de salud
## #   público?` <chr>, `¿Consideras que se debería invertir más en salud pública
## #   por parte del gobierno?` <chr>, `¿Consideras que el personal médico de
## #   hospitales públicos debería tener una mayor remuneración a la que tiene
## #   actualmente?` <chr>, `Escribe un breve comentario sobre los aspectos que
## #   consideras el sistema de salud pública en México debería mejorar.` <chr>

4.1.2 Uso del sistema

4.1.3 Eficiencia

4.1.4 Público vs privado

4.1.5 Cuota por uso

4.1.6 Debilidad del sistema

4.1.7 Inversión en salud

4.1.8 Remuneración a personal médico

4.2 Nube de palabras

La última pregunta del cuestionario es abierta, ya que se quiere conocer las perspecivas de la gente respecto al uso del sistema de salud de manera más específica, por lo que se puede crear una nube de palabras, con el objetivo de conocer las ideas más frecuentes de las personas. Comenzaremos por renombrar la variable de la última pregunta.

## [1] "Considero que debería haber mejores evaluaciones al personal de salud"                                                  
## [2] "Deberían mejorar la burocracia y agilizar los trámites"                                                                 
## [3] "Necesita mas presupuesto"                                                                                               
## [4] "Sí "                                                                                                                    
## [5] "Debería de existir mayor infraestructura y mayor cantidad de personal para dar abasto a la demanda y sea más eficiente "
## [6] "Lo de la anterior respuesta "
## character(0)

4.3 Estadística descriptiba de los resultados.

A partir de los resultados anteriores podemos obtener una tabla con los principales datos obtenidos de la siguiente manera:

## # A tibble: 6 x 9
##    Edad `¿Alguna vez ha… `Marca que tan … `¿Crees que el … `¿Preferirías p…
##   <dbl>            <dbl>            <dbl>            <dbl>            <dbl>
## 1     3                1                2                1                1
## 2     3                1                4                1                1
## 3     4                2                3                1                1
## 4     3                1                2                1                2
## 5     3                1                2                1                1
## 6     3                2                2                1                2
## # … with 4 more variables: `¿Cuál de las siguientes consideras que es la mayor
## #   debilidad del sistema de salud público?` <dbl>, `¿Consideras que se debería
## #   invertir más en salud pública por parte del gobierno?` <dbl>, `¿Consideras
## #   que el personal médico de hospitales públicos debería tener una mayor
## #   remuneración a la que tiene actualmente?` <dbl>, `Comentario final` <chr>
##       Edad      
##  Min.   :1.000  
##  1st Qu.:2.000  
##  Median :2.000  
##  Mean   :2.591  
##  3rd Qu.:3.000  
##  Max.   :4.000  
##  ¿Alguna vez has utilizado el sistema de salud público de México (IMSS/ISSTE)?
##  Min.   :1.000                                                                
##  1st Qu.:1.000                                                                
##  Median :1.000                                                                
##  Mean   :1.091                                                                
##  3rd Qu.:1.000                                                                
##  Max.   :2.000                                                                
##  Marca que tan eficiente lo consideras al sistema de salud público 
##  Min.   :1.000                                                     
##  1st Qu.:2.000                                                     
##  Median :3.000                                                     
##  Mean   :2.591                                                     
##  3rd Qu.:3.000                                                     
##  Max.   :4.000                                                     
##  ¿Crees que el sistema de salud privado es mejor que el público?
##  Min.   :1.000                                                  
##  1st Qu.:1.000                                                  
##  Median :1.000                                                  
##  Mean   :1.045                                                  
##  3rd Qu.:1.000                                                  
##  Max.   :2.000                                                  
##  ¿Preferirías pagar una pequeña cuota en el sistema de salud público con tal de que sea más eficiente que ahora?
##  Min.   :1.000                                                                                                  
##  1st Qu.:1.000                                                                                                  
##  Median :1.000                                                                                                  
##  Mean   :1.318                                                                                                  
##  3rd Qu.:2.000                                                                                                  
##  Max.   :2.000                                                                                                  
##  ¿Cuál de las siguientes consideras que es la mayor debilidad del sistema de salud público?
##  Min.   :1.000                                                                             
##  1st Qu.:1.750                                                                             
##  Median :3.000                                                                             
##  Mean   :2.682                                                                             
##  3rd Qu.:4.000                                                                             
##  Max.   :4.000                                                                             
##  ¿Consideras que se debería invertir más en salud pública por parte del gobierno?
##  Min.   :1.000                                                                   
##  1st Qu.:1.000                                                                   
##  Median :1.000                                                                   
##  Mean   :1.045                                                                   
##  3rd Qu.:1.000                                                                   
##  Max.   :2.000                                                                   
##  ¿Consideras que el personal médico de hospitales públicos debería tener una mayor remuneración a la que tiene actualmente?
##  Min.   :1.000                                                                                                             
##  1st Qu.:1.000                                                                                                             
##  Median :1.000                                                                                                             
##  Mean   :1.273                                                                                                             
##  3rd Qu.:2.000                                                                                                             
##  Max.   :2.000                                                                                                             
##  Comentario final  
##  Length:44         
##  Class :character  
##  Mode  :character  
##                    
##                    
## 

4.4 ¿Cuál es la perspectiva de los ciudadanos encuestados respecto al sistema de salud pública?

Ciertamente la perspectiva no es nada buena, ya que si consideramos el promedio global de las personas encuestadas, podemos asumir que en su mayoría tendríamos a personas en un rango de edad entre 17 y 21 años, las cuales han tenido que acudir al sistema de salud pública, ya sea para llevar a un familiar o por una emergencia médica respecto a ellos, quienes consideran que el sistema de salud pública es poco eficiente y es superado por mucho por el sistema privado. En su mayoría, las personas consideran que valdría la pena pagar una pequeña cuota en el sistema de salud pública, con tal de tener un mejor trato, mayores recursos e insumos, lo cual de hecho es la principal debilidad que consideran tiene el sistema de salud: falta de instrumentos médicos. Además de lo anterior, las personas consideran que el gobierno debería destinar una mayor cantidad de recursos al sistema de salud, esto probablemente se vea aún más respaldado por la coyuntura actual, en la que observamos que estamos en semáforo rojo, al tener un 98% de ocupación hospitalaria, sumado a que se le debería aumentar la remuneración neta a los trabajadores de la salud, al hacer una labor tan árdua y agotadora constantemente.

De la nube de palabras podemos observar que lo que la muestra de personas encuestadas considera más importante respecto a las mejoras del sistema de salud es, principalmente, una mejor atención médica, un mejor trato, abasto en medicamentos y, en general, una mejora en el sistema de salud.

4.5 Relación entre las variables

Para saber que tan relacionadas se encuentran las variables de la encuesta entre si, sería bueno hacer uso de una matriz de correlación, la cual nos da valores de entre 1 y -1, teniendo una relación directamente proporcional aquellas variables que se acerquen a 1 e inversamente proporcional aquellas variables que se acerquen a -1.

Númericamente, la matriz de correlación nos dice lo siguiente:

##                       Edad Uso sistema  Eficiencia Sist. Privado Cuota por uso
## Edad           1.000000000  0.16626801  0.13651877   -0.16572953   -0.01710381
## Uso sistema    0.166268010  1.00000000  0.06465978   -0.06900656   -0.04629100
## Eficiencia     0.136518771  0.06465978  1.00000000   -0.16572953    0.17103807
## Sist. Privado -0.165729528 -0.06900656 -0.16572953    1.00000000   -0.14907120
## Cuota por uso -0.017103807 -0.04629100  0.17103807   -0.14907120    1.00000000
## Debilidad      0.006735861  0.01823043  0.08083033    0.15096231    0.01875344
## Inversión      0.114735827 -0.06900656  0.11473583   -0.04761905    0.31943828
## Remuneración  -0.071550359 -0.01613743  0.12521313    0.11135885    0.23904572
##                  Debilidad   Inversión Remuneración
## Edad           0.006735861  0.11473583 -0.071550359
## Uso sistema    0.018230431 -0.06900656 -0.016137431
## Eficiencia     0.080830331  0.11473583  0.125213129
## Sist. Privado  0.150962307 -0.04761905  0.111358851
## Cuota por uso  0.018753443  0.31943828  0.239045722
## Debilidad      1.000000000 -0.12580192 -0.007845128
## Inversión     -0.125801922  1.00000000  0.111358851
## Remuneración  -0.007845128  0.11135885  1.000000000

Las variables que se encuentran mayormente relacionadas, dada la matriz de correlación, serían la remuneración a personal médico y la inversión a este sistema de salud respecto a pagar una cuota por usar el sistema, por lo que más adelante haremos un rápido modelo de regresión lineal para ver que se puede encontrar respecto a estas tres variables, ya que puede ser importante para el análisis final.

4.6 Análisis de la varianza (ANOVA) y modelos lineales

4.6.1 ANOVA para datos independientes

Respecto a este punto, hay que consderar que el análisis de la varianza considera el efecto de uno o más factores sobre la media de una variable continua, por tanto, cuando se quiere comparar la media de varias variables se hace uso de este test. La hipótesis nula del ANOVA es que la media de las diferentes variables es la misma. En este caso, haremos uso del estadístico \(F\), el cual es el ratio entre la varianza de las medias de los grupos y el promedio de la varianza dentro del grupo. Tendríamos que la formula del estadístico \(F\) es igual a:

\[\begin{equation} F = \frac{S_1^2 / \sigma_1^2 }{ S_2^2 / \sigma_2^2} \tag{4.1} \end{equation}\]

Donde \(S_1^2\) y \(S_2^2\) son las varianzas de una muestra extraidas de una población normal de varianza \(\sigma_1^2\) y \(\sigma_2^2\).

Ahora bien, vamos a trabajar con las variables considerando que la edad depende en cierta medida del resto de perspectivas que se hayan tenido en el cuestionario.

## Analysis of Variance Table
## 
## Response: Edad
##               Df  Sum Sq Mean Sq F value Pr(>F)
## `Uso sistema`  1  0.7364 0.73636  1.1941 0.2807
## Residuals     42 25.9000 0.61667
##                                         Df Sum Sq Mean Sq F value Pr(>F)  
## `Uso sistema`                            1  0.736  0.7364   1.027 0.3219  
## Eficiencia                               1  0.423  0.4231   0.590 0.4506  
## `Sist. Privado`                          1  0.493  0.4927   0.687 0.4161  
## `Cuota por uso`                          1  0.066  0.0659   0.092 0.7646  
## Debilidad                                1  0.009  0.0088   0.012 0.9129  
## Inversión                                1  0.470  0.4697   0.655 0.4270  
## Remuneración                             1  0.096  0.0958   0.134 0.7182  
## `Uso sistema`:Eficiencia                 1  0.110  0.1102   0.154 0.6989  
## Eficiencia:`Cuota por uso`               1  0.006  0.0061   0.008 0.9276  
## `Uso sistema`:Debilidad                  1  1.665  1.6646   2.321 0.1419  
## Eficiencia:Debilidad                     1  0.263  0.2626   0.366 0.5513  
## `Sist. Privado`:Debilidad                1  0.008  0.0085   0.012 0.9145  
## `Cuota por uso`:Debilidad                1  0.843  0.8432   1.176 0.2899  
## Eficiencia:Remuneración                  1  1.446  1.4456   2.016 0.1697  
## `Cuota por uso`:Remuneración             1  0.108  0.1080   0.151 0.7017  
## Debilidad:Remuneración                   1  0.113  0.1127   0.157 0.6956  
## Inversión:Remuneración                   1  2.636  2.6359   3.676 0.0683 .
## Eficiencia:`Cuota por uso`:Debilidad     1  0.049  0.0491   0.068 0.7960  
## Eficiencia:`Cuota por uso`:Remuneración  1  1.311  1.3107   1.828 0.1901  
## Eficiencia:Debilidad:Remuneración        1  0.007  0.0072   0.010 0.9214  
## `Cuota por uso`:Debilidad:Remuneración   1  0.004  0.0037   0.005 0.9434  
## Residuals                               22 15.776  0.7171                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

¿Hay algún efecto entre las variables?

##                      eta.sq  eta.sq.part
## `Uso sistema`   0.040292552 0.0636964377
## Eficiencia      0.006927451 0.0115610430
## `Sist. Privado` 0.012929640 0.0213639389
## `Cuota por uso` 0.001190612 0.0020061882
## Debilidad       0.008468945 0.0140973357
## Inversión       0.000187762 0.0003169158

El análisis de la varianza nos estaría diciendo que no existe evidencia de influencia significativa entre edades y sus respuestas, así como otras variables que pudiesen incluenciar al resto. Básicamente, la percepción negativa que se tiene del sistema de salud es independiente de la edad que tenían los encuestados, así como si es que ya fueron o no al sistema de salud.

4.7 Algunos modelos lineales

4.7.1 ¿La edad influye en las perspectivas que se tienen del sistema de salud?

En este punto observamos que no hay un efecto significativo en la influencia de las respuestas de los encuestados respecto a sus varianzas, por lo que ahora se considerará de manera individual si una variable puede explicar a otra mediante un modelo de regresión lineal, es decir, suponiendo ahora que las variables no son categóricos, si no que son variables puramente cualitativas, aunque a pesar de ello no se espera encontrar una relación significativa entre las variables. Vamos a suponer que la edad genera cambios en las perspectivas de las personas respecto al sistema de salud.

## 
## Call:
## lm(formula = Edad ~ `Uso sistema`)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##  -1.55  -0.55  -0.55   0.45   1.45 
## 
## Coefficients:
##               Estimate Std. Error t value  Pr(>|t|)    
## (Intercept)     2.1000     0.4646   4.520 0.0000497 ***
## `Uso sistema`   0.4500     0.4118   1.093     0.281    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7853 on 42 degrees of freedom
## Multiple R-squared:  0.02765,    Adjusted R-squared:  0.004494 
## F-statistic: 1.194 on 1 and 42 DF,  p-value: 0.2807
## 
## Call:
## lm(formula = Edad ~ Eficiencia)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.5102 -0.6468 -0.5102  0.4898  1.6263 
## 
## Coefficients:
##             Estimate Std. Error t value   Pr(>|t|)    
## (Intercept)   2.2372     0.4135   5.410 0.00000279 ***
## Eficiencia    0.1365     0.1529   0.893      0.377    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7889 on 42 degrees of freedom
## Multiple R-squared:  0.01864,    Adjusted R-squared:  -0.004728 
## F-statistic: 0.7976 on 1 and 42 DF,  p-value: 0.3769
## 
## Call:
## lm(formula = Edad ~ `Sist. Privado`)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.6191 -0.6190 -0.3095  0.3810  1.3809 
## 
## Coefficients:
##                 Estimate Std. Error t value   Pr(>|t|)    
## (Intercept)       3.2381     0.6059   5.344 0.00000346 ***
## `Sist. Privado`  -0.6190     0.5684  -1.089      0.282    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7854 on 42 degrees of freedom
## Multiple R-squared:  0.02747,    Adjusted R-squared:  0.004311 
## F-statistic: 1.186 on 1 and 42 DF,  p-value: 0.2823
## 
## Call:
## lm(formula = Edad ~ `Cuota por uso`)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.6000 -0.6000 -0.5714  0.4071  1.4286 
## 
## Coefficients:
##                 Estimate Std. Error t value      Pr(>|t|)    
## (Intercept)      2.62857    0.36031   7.295 0.00000000551 ***
## `Cuota por uso` -0.02857    0.25772  -0.111         0.912    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7962 on 42 degrees of freedom
## Multiple R-squared:  0.0002925,  Adjusted R-squared:  -0.02351 
## F-statistic: 0.01229 on 1 and 42 DF,  p-value: 0.9123
## 
## Call:
## lm(formula = Edad ~ Debilidad)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.5967 -0.5923 -0.5835  0.4165  1.4121 
## 
## Coefficients:
##             Estimate Std. Error t value        Pr(>|t|)    
## (Intercept) 2.579025   0.297526   8.668 0.0000000000667 ***
## Debilidad   0.004431   0.101509   0.044           0.965    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7963 on 42 degrees of freedom
## Multiple R-squared:  4.537e-05,  Adjusted R-squared:  -0.02376 
## F-statistic: 0.001906 on 1 and 42 DF,  p-value: 0.9654
## 
## Call:
## lm(formula = Edad ~ Inversión)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.5714 -0.5714 -0.5714  0.4286  1.4286 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)   2.1429     0.6104   3.511  0.00108 **
## Inversión     0.4286     0.5726   0.749  0.45832   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7911 on 42 degrees of freedom
## Multiple R-squared:  0.01316,    Adjusted R-squared:  -0.01033 
## F-statistic: 0.5603 on 1 and 42 DF,  p-value: 0.4583
## 
## Call:
## lm(formula = Edad ~ Remuneración)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -1.625 -0.625 -0.500  0.375  1.500 
## 
## Coefficients:
##              Estimate Std. Error t value      Pr(>|t|)    
## (Intercept)    2.7500     0.3626   7.585 0.00000000214 ***
## Remuneración  -0.1250     0.2689  -0.465         0.644    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.7943 on 42 degrees of freedom
## Multiple R-squared:  0.005119,   Adjusted R-squared:  -0.01857 
## F-statistic: 0.2161 on 1 and 42 DF,  p-value: 0.6444

Como es evidente, hasta ahora no hemos encontrado una relación mínimamente significativa entre la edad y la opinión de las personas, ya que la varianza solo puede ser explicada en menos del 1%, teniendo además coeficientes no significativos, al tener p-value´s mayores a 0.05 en su mayoría.

4.7.2 Modelos lineales en base a la matriz de correlación

Haremos un último intento, relacionando las variables que mostraban una mayor correlación en la matriz hecha anteriormente.

## 
## Call:
## lm(formula = Remuneración ~ `Cuota por uso`)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.4286 -0.2000 -0.2000  0.5714  0.8000 
## 
## Coefficients:
##                 Estimate Std. Error t value  Pr(>|t|)    
## (Intercept)       0.9714     0.2003   4.850 0.0000173 ***
## `Cuota por uso`   0.2286     0.1433   1.595     0.118    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4426 on 42 degrees of freedom
## Multiple R-squared:  0.05714,    Adjusted R-squared:  0.03469 
## F-statistic: 2.545 on 1 and 42 DF,  p-value: 0.1181
## 
## Call:
## lm(formula = Inversión ~ `Cuota por uso`)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -0.1429 -0.1429  0.0000  0.0000  0.8571 
## 
## Coefficients:
##                 Estimate Std. Error t value         Pr(>|t|)    
## (Intercept)      0.85714    0.09142   9.376 0.00000000000741 ***
## `Cuota por uso`  0.14286    0.06539   2.185           0.0345 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.202 on 42 degrees of freedom
## Multiple R-squared:  0.102,  Adjusted R-squared:  0.08066 
## F-statistic: 4.773 on 1 and 42 DF,  p-value: 0.03455

Como se puede observar, no se encontró evidencia significativa sobre la relación que pudiesen tener la percepción sobre la cuota por uso del sistema y la remuneración hacia el personal médico, además de una mayor inversión a este sistema. No es raro encontrar estos resultados, ya que podríamos considerar que la idea global sobre el sistema de salud es que requiere mayor inversión, así como una mejor paga a médicos, pero las ideas sobre esto no dependen de la idea que se tiene de tener que pagar una pequeña cuota para poder mejorar el sistema ya que, en si, estas tres ideas son un pensamiento global y no son independientes entre si.