5 Conclusion

Dans la première partie, nous avons développé une représentation inédite de la covariance et ce, en nous basant sur un raisonnement mathématique dont nous avons démontré la preuve. Nous nous sommes interrogés sur la façon qui soit à la fois la plus pertinente de représenter cette visualisation, mais aussi la plus accessible et compréhensible pour le plus grand nombre. Cette représentation, encore perfectible à ce stade, nous permet d’aller plus loin que tout ce qui s’est fait précédemment dans le calcul de la covariance et ouvre un nouveau champ des possibles dans ce domaine.

Dans la seconde partie, nous nous sommes basés sur les hypothèses que nous avions précédemment faites sur la covariance et nous avons ainsi, en rappelant les hypothèses mathématiques nécessaires, exposé le principe de construction d’un diagramme permettant de visualiser les différents résultats d’une régression linéaire simple. L’intérêt majeur de cette représentation diagrammatique est qu’elle permet, entre autres, de visualiser la part de la variance expliquée dans de la variance totale, ou plus simplement dit, cette représentation diagrammatique nous permet de visualiser le coefficient de détermination : le \(R^2\).

Dans le but de rendre cette représentation diagrammatique accessible et interactive nous avons développé deux applications shiny. La première, illustre des bases de données très connues telles que l’étude de Galton sur la taille des enfants fonction de la taille des parents, ou encore la base de données AirPassengers ; La deuxième, permet de simuler des données en considèrant des lois normales bivariées pour \(X\) et \(Y\) permet à l’utilisateur de fixer lui-même les paramètres \(\sigma_{X}\), \(\sigma_{Y}\), \(\rho\), le nombre d’observations N, ainsi que la valeur du risque de première espèce \(\alpha\) pour le test de Fischer. Cette deuxième version permet donc à l’utlisateur d’observer le comportement du diagramme en fonctoion des données ainsi simulées.