Chapter 5 Caractéristiques de base
5.1 Structure des données
5.1.1 Consentement
La signature du consentement est faite de façon dématérialisée.
La notice de consentement est intégralement présentée aux étudiants, qui ont bénéficié d’un délai de réflexion avant de signer.
S’ils acceptent de participer, ils cochent la case ad hoc.
5.1.2 Eligibilité
Les critères d’inclusion :
Etudiant inscrit en médecine de 2ème année de licence (DFGSM 2)
Apte à signer un consentement
Sans mesure de tutelle/curatelle/sauvegarde de justice
Agé de 18 ans ou plus (majeur)
Les critères de non-inclusion :
Etudiant ayant réalisé plus de 3 années d’étude de la médecine ou santé avant l’année actuelle, dans un autre établissement ou un autre pays, ou titulaire d’une capacité, d’un diplôme en pharmacologie
Etudiant n’ayant aucun accès à internet, y compris sur son lieu d’étude
Nota bene : les étudiants passereliens sont éligibles, du moment qu’ils répondent aux critères d’inclusion et ne répondent pas aux critères de non-inclusions. Selon leur âge, ils ne peuvent cependant pas répondre correctement à la question sur les options du baccalauréat (car seules les options en vigueur à partir de 2019 sont proposées au choix). Il leur a été indiqué de renseigner “Mathématiques” et “Physique”.
5.2 Extraction des données
Via https://enquetes.unicaen.fr/index.php/admin/authentication/sa/login
5.2.1 Extraction de la structure du questionnaire
Sur la page “Vue d’ensemble”, “exporter”, “export PDF queXML”, réglage par défaut
5.2.2 Extraction des réponses
Sur la page “Réponses”, “Exporter / Exporter les réponses”. Format csv, séparé par points virgules. Onglet “En-têtes”, “Code de la question”.
Préfixe du fichier dans data_raw : “enrollment”. Ce fichier est revu pour intégrer les corrections suites aux notes techniques, ci après. Fichier utilisé par la suite : “enrollement_cleaned”.
Comparer à la version initiale, enrollement_cleaned bénéficie des corrections suivantes :
Les numéros d’étudiants erronnés ont été corrigés
Les étudiants ayant un statut incertain de participation ont été soit définitivement exclus, soit inclus (avec correction des valeurs aux réponses Q3/Q4 de non-éligibilité)
Nom de la table de données en R : en
.
5.2.3 Notes techniques
En cas de “N/A” aux critères d’inclusion ou non-éligibilité, le questionnaire est vide. Cette entrée ne permet pas de remonter jusqu’à l’étudiant.
La question de non-éligibilité 3 est mal adaptée: Il faut y répondre “Oui”, tandis qu’il faut répondre “Non” aux 2 premières.
Certains étudiants ont ainsi coché “Non” à toutes les conditions de non-éligibilité. Cette attitude pourrait correspondre à un souhait de participation, s’il n’était pas nécessaire d’être connecté à internet pour pouvoir y répondre.
La question de non-éligibilité 4 est ambiguë: “aucune des 3 propositions ci dessus”, Alors qu’il faut répondre
“Non” aux 2 premières
“Oui” à la 3ème
pour être éligible.
Du fait des considérations ci-dessus, les étudiants ayant coché Oui/Non de façon inappropriée aux questions 3 et 4 ont été inclus.
5.2.3.1 Erreurs variées
Un étudiant n’a pas renseigné son numéro étudiant, plusieurs ont renseigné un numéro erronné (trop long/trop court) - récupérés via l’annuaire de l’université, et par confrontation avec la table d’identité obtenue par le service de scolarité avec les résultats d’examen.
Certains étudiants ont rempli tous les critères de participation, sans donner leur identité, ni numéro étudiant - irrécupérable.
Une ambiguité à la question “En quelle année d’étude étiez-vous dans cette filière ?”
Réponse attendue numérique entre 1 et 8 max, certains ont notés l’année calendaire (2022, 2023). Ces deux valeurs sont corrigées en data_management.