Chapter 13 Analyse d’un médiateur en particulier

Ici, l’objectif est d’étudier la part médiée par l’un des médiateurs M spécifiquement. Cela veut dire faire des hypothèses sur les autres facteurs intermédiaires : sont-ils des médiateurs ou des facteurs de confusion du lien \(\small M \rightarrow Y\)?

Par exemple, si l’on veut étudier la part médiée par le fait de faire du sport à 23 ans, on va intégrer les variables socio-économiques et relatives au réseau social comme des facteurs de confusion intermédiaire. La place des autres variables comportementales est plus discutable : le fait de boire ou de fumer peuvent être des marqueurs d’un certains mode de vie qui va favoriser ou non le fait de faire du sport, mais l’inverse est aussi vrai. Le lien est bidirectionnel, ce qui ne peut pas être étudier ici.

On peut étudier les 2 scénariis et comparer les résultats.

13.1 Description

13.2 Les autres comportements comme facteurs de confusion

exp1 <- cmest(
  data = base3,                    # base
  model = "gformula",             # approach, defaut is rb (regression-based)
                                  # if postc is not empty only gformula or msm
  estimation = "imputation",      # method of estimation. "imputation" is conterfactual estimation
  inference = "bootstrap",        # method for se and CI
  nboot = 100,                    # defaut is 200
  EMint = FALSE,                  # interaction exposure mediator
  
  multimp = TRUE,                 # imputation multiple des DM 
  m = 10,

  outcome = "t8_SBP",                 
  exposure = "t0_baby_sex", 
  mediator = c("t4_act_sport"), 
  basec = c("t0_mother_scol_crt",
            "t0_fathers_csp_defav"),# confusion baseline
  postc = c("t4_tabac_2cl",
                     "t4_drink_everyday",
                    "t4_litteraciepbm",
                     "t4_numeraciepbm",
                     "t4_act_read",
                     "t4_O_level",
                      "t4_hadchildren",
                     "t4_married",
                     "t4_act_friend",
                     "t4_religious"),    # confusion intermédiaire
  
  yreg = "linear",              # outcome regression model

  a = "Homme",                    # "active" value of exposure
  astar = "Femme",                # "control" value of exposure
  
  mreg = list("logistic"),          # regression model for each mediator
  mval = list("Non") ,   # ref for M
  postcreg = list("logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic")                # ref for M
  ) ;    set.seed(28062022)

Si les hommes et les femmes avaient la même activité physique à 23 ans, des différences de TAS seraient augmentées de 19.94% (95CI = [11.5 to 42.75]).

13.3 Les autres comportements comme médiateurs

exp1 <- cmest(
  data = base3,                    # base
  model = "gformula",             # approach, defaut is rb (regression-based)
                                  # if postc is not empty only gformula or msm
  estimation = "imputation",      # method of estimation. "imputation" is conterfactual estimation
  inference = "bootstrap",        # method for se and CI
  nboot = 100,                    # defaut is 200
  EMint = FALSE,                  # interaction exposure mediator
  
  multimp = TRUE,                 # imputation multiple des DM 
  m = 10,

  outcome = "t8_SBP",                 
  exposure = "t0_baby_sex", 
  mediator = c("t4_act_sport"), 
  basec = c("t0_mother_scol_crt",
            "t0_fathers_csp_defav"),# confusion baseline
  postc = c("t4_litteraciepbm",
                     "t4_numeraciepbm",
                     "t4_act_read",
                     "t4_O_level",
                      "t4_hadchildren",
                     "t4_married",
                     "t4_act_friend",
                     "t4_religious"),    # confusion intermédiaire
  
  yreg = "linear",              # outcome regression model

  a = "Homme",                    # "active" value of exposure
  astar = "Femme",                # "control" value of exposure
  
  mreg = list("logistic"),          # regression model for each mediator
  mval = list("Non"),   # ref for M
  postcreg = list("logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic",
              "logistic")                 # ref for M
  ) ;    set.seed(28062022)

Les résultats sont quasiment identiques.

13.4 Une autre analyse : part médiée par la fait de lire souvent

Je peux étudier une autre variable pour laquelle je vais envisager un autre scénario :

exp1 <- cmest(
  data = base3,                    # base
  model = "gformula",             # approach, defaut is rb (regression-based)
                                  # if postc is not empty only gformula or msm
  estimation = "imputation",      # method of estimation. "imputation" is conterfactual estimation
  inference = "bootstrap",        # method for se and CI
  nboot = 100,                    # defaut is 200
  EMint = FALSE,                  # interaction exposure mediator
  
  multimp = TRUE,                 # imputation multiple des DM 
  m = 10,

  outcome = "t8_SBP",                 
  exposure = "t0_baby_sex", 
  mediator = c("t4_act_read"), 
  basec = c("t0_mother_scol_crt",
            "t0_fathers_csp_defav"),# confusion baseline
  postc = c("t4_litteraciepbm",
                     "t4_O_level",
                      "t4_hadchildren",
                     "t4_married"),    # confusion intermédiaire
  
  yreg = "linear",              # outcome regression model

  a = "Homme",                    # "active" value of exposure
  astar = "Femme",                # "control" value of exposure
  
  mreg = list("logistic"),          # regression model for each mediator
  mval = list("Oui"),   # ref for M
  postcreg = list("logistic",
              "logistic",
              "logistic",
              "logistic")                 # ref for M
  ) ;    set.seed(28062022)

On explique 5.26% (95CI = [-1.16 to 13.71]) des différences de TAS entre les hommes et les femmes par des différences liés aux habitudes de lecture.