Chapter 2 Considérations techniques

Conduire une analyse en MLM ne se fait pas de la même manière que pour une ANOVA. L’une des différences majeures est que les MLM et les logiciels utilisés sont plus friands d’une modélisation “long data”, contrairement à nos habitudes (notamment avec l’ANOVA).

2.1 La base de données

2.1.1 À propos de la base de données

Puisque les MLM sont très bons pour représenter statistiquement la réalité des données, il faut leur fournir une base de données la plus proche possible de la réalité.

Quelques règles de base :

  1. La base de données doit être en format long et non en format large. C’est à dire que chaque colonne représente une variable et chaque ligne, une observation pour la modalité de la variable.
  2. La base de données ne doit pas être moyennée. Chaque modalité de chaque variable doit être représentée.

Pour une ANOVA, nous moyennons les valeurs de la VD par modalité de la VI. Pour un MLM, nous représentons la valeur de la VD pour CHAQUE item de CHAQUE modalité de la VI pour CHAQUE participant.

Prenons par exemple un cas générique ou des participants doivent produire une réponse (recueillie ici sous forme de temps de réaction) pour des items appartenant soit à une modalité 1, soit à une modalité 2 d’une VI. Il s’agit d’un plan à mesures répétées. Pour une ANOVA, le tableau ressemblerait à ceci :

Sbj VI1_Modalité1 VI2_Modalité2
301 1027.41 1002.06
302 1047.34 1042.53
303 882.67 938.43

Les MLM vont manquer d’informations pour être réellement pertinents. Comme ils sont capables de modéliser la variance pour chaque sujet, chaque réponse, chaque item, autant leur donner l’information détaillée. Elle sera présentée sous cette forme :

Sbj VI Stimulus
301 modalité1 cube
301 modalité1 chien
301 modalité1 clavier
301 modalité1 clé
301 modalité1 poisson
301 modalité2 télévision
301 modalité2 lettre
301 modalité2 pendule
301 modalité2 clown
302 modalité1 viande

Cette modélisation de la base de données permettra de stipuler dans le modèle, les effets aléatoires pour les sujets et pour les items, ce que ne permettait pas la base de données moyennées.

Les MLM ont fortement intéressés les psycholinguistes par leur capacité à modéliser en une seule fois, les effets au niveau des sujets et les effets au niveau des items. En effet, si on réfléchit bien, une ANOVA vise à généraliser les résultats à une population d’où est tirée l’échantillon. Une ANOVA faite sur la base des temps de réactions des sujets en fonction des conditions expérimentales sont généralisables à la population. Certes, mais qu’en est-il des items ? Qu’est-ce qui nous dit que, par exemple, les effets d’énoncés ironiques sont généralisables à l’ensemble de la “population” des énoncés ironiques ? Pour répondre à cette question, les psycholinguistes étaient fréquemment obligés de réaliser une analyse par sujet et une analyse par item (c-à-d 2 ANOVA). Fastidieux. Les MLM permettent le même travail en un seul modèle et en plus, sans devoir faire les moyennes par sujet et par item. Autrement dit, en travaillant avec une bdd plus proche d’une bdd brute que pour une ANOVA.

2.2 Le logiciel

Plusieurs logiciels proposent aujourd’hui une solution pour construire et tester des MLM. Certains disposent d’une interface graphique (ex. Jamovi et le plugin GAMLj), d’autres fonctionnement préférentiellement sous forme de lignes de commandes (ex. R et le package lme4). Le choix du logiciel dépend essentiellement de votre pratique. Si vous êtes habitués à un process souple et adaptatif, je vous recommande les logiciels à lignes de commandes. Si vous préférez une solution interactive rapide et légère, les logiciels à interfaces graphiques seront mieux adaptés.

Ci-après, de courtes description des principales solutions statistiques non payantes.

2.2.1 Jamovi et le plugin GAMLj

Jamovi est un logiciel relativement récent dont l’un des objectifs prioritaires était de proposer une interface légère et compréhensible associée aux derniers développements statistiques. Et il faut avouer qu’ils ont réussi. Si vous avez connu la grande époque STATISTICA, si vous continuez à utiliser SPSS, je vous invite à tester Jamovi et a apprécier la simplicité de son interface, la souplesse de son utilisation et sa rapidité de calcul. Associez à cela la possibilité d’intégrer des modules (plugins) afin de réaliser des analyses non prévues originellement et vous aurez un excellent outil pédagogique et de recherche.

Si vous souhaitez réaliser des MLM dans Jamovi, vous devrez installer le plugin GAMLj. Sous une interface graphique respectant les standards de Jamovi, le plugin GAMLj vous permettra de tester vos modèles, d’en avoir des resprésentations graphiques, des réaliser des tests post-hoc, etc.

GAMLj est également disponible sur R mais ce n’est pas le package préféré.

2.2.2 R et le package lme4

R fonctionne entièrement sous lignes de commandes. Voilà c’est dit, vous êtes prévenus. Certes, des modules (packages) existent et allègent son utilisation (R Commander) mais il faut se dire qu’ils vont à l’encontre de la philosophie de R (c’est un peu comme utiliser une ligne de commande dans Jamovi : c’est possible mais on n’aime pas ça).

Il est toutefois possible d’avoir un juste milieu entre une gestion entièrement en ligne de commande et un visuel graphique confortable : RStudio. Cet outil vous permettra d’avoir sous les yeux une interface graphique pour gérer vos scripts, objets, graphiques, etc. tout conservant l’invite de commande de R.

Enfin, R fonctionne comme beaucoup d’autres logiciels ouverts aujourd’hui : il ne se suffit pas à lui-même. Une multitude de packages existent pour réaliser diverses analyses statistiques (et pas que !) dont deux en particulier qui sont largement utilisés pour les MLM : lme4 et nlme. L’inconvénient de R est que pour pleinement exploiter un package, nous avons souvent besoin d’installer d’autres packages.