Test T de l'étudiant : n'ignorez pas ces secrets
Le test t de Student est une analyse statistique qui compare les moyennes de deux groupes pour déterminer leurs égalités, en supposant une normalité et des variances égales.
Saviez-vous que le incorrect utilisation de tests statistiques, y compris la Test t de Student, est plus fréquent qu’on ne le pense et peut conduire à tirer des conclusions erronées ? Ceci est problématique car des conclusions incorrectes peuvent entraîner catastrophique décisions — pour éviter de tomber dans ce piège, lisez cet article jusqu’au bout.
Le problème
La grande disponibilité, la simplicité et la facilité de compréhension du test t de Student en ont fait l'un des tests les plus efficaces. communément utilisé des tests statistiques dans le monde entier.
Cependant, cette vulgarisation a amené certains vous aider à faire face aux problèmes qui vous perturbent, comme une application d'analyse incorrecte.
Cette préoccupation est si important que plusieurs articles de revue systématique récents ont été publiés — et en particulier des études, jusqu'à 80 % des articles publiés contiennent des erreurs d'analyse statistique !
Depuis que haute qualité Si les problèmes de l'humanité dépendent souvent de ces études, il est troublant de penser qu'une si grande proportion d'entre elles ont été mal analysées et ont pu conduire à des conclusions erronées.
Notre secrets La manière de réaliser correctement un test t de Student n'est pas compliquée : il suffit de comprendre quelques fonctionnalités d'analyse de base !
La solution
Notre Test t de Student détermine si les moyennes de deux populations sont égales. Par conséquent, en suivant attentivement les cinq étapes ci-dessous est essentiel pour une application correcte et incontestable d’un test t.
1. Quel type de test t dois-je utiliser ?
Test t pour échantillons indépendants est le type le plus couramment utilisé, évaluant si les moyennes des échantillons collectés auprès de deux populations indépendantes sont égales. Par exemple, on peut vérifier si la masse musculaire entre les hommes et les femmes dans une entreprise donnée est similaire.
Test t pour échantillons appariés détermine si la moyenne d’un échantillon collecté avant une intervention est égale à celle de l’échantillon collecté – à partir des mêmes éléments – après l’intervention. Par exemple, nous souhaiterions peut-être vérifier si la tension artérielle des femmes âgées d'une ville est la même avant et après la prise d'un médicament spécifique. Puisque nous mesurerons la tension artérielle de chaque femme âgée deux fois – avant et après l’intervention – chaque unité d’échantillonnage est appariée.
Un échantillon de test t, le type le moins utilisé, vérifie si la moyenne de l'échantillon collecté sur une population est égale à une moyenne déjà connue. Par exemple, nous pouvons vouloir
2. Calcul de la taille de l'échantillon du test T de Student
Après avoir défini le type de test t à utiliser, nous devons déterminer le nombre d'éléments à utiliser. recueillir.
Pertinence : tailles d'échantillon résolvent souvent de nombreux problèmes en matière de statistiques.
La meilleure façon de trouver le approprié La taille de l'échantillon pour notre test consiste à utiliser un calcul spécifique, avec un calcul différent pour chaque test statistique.
Pour le test t, nous avons besoin des données approximatives ou estimées des deux populations étudiées. signifier et votre écart-type.
Dans le logiciel statistique, nous devons saisir ces valeurs dans la taille de l'échantillon ordinateur pour le type de test t approprié. Il renvoie ensuite le nombre correct d'éléments à collecter.
Mais où obtient-on les moyennes et les écarts types des populations étudiées ? Généralement d'autres pilote des études ou similaires études!
Visualisez cet article. pour apprendre à calculer la taille d'un échantillon !
Astuce en or : G*Puissance est un excellent progiciel statistique gratuit pour calculer la taille de l'échantillon.
3. Les observations doivent être indépendantes !
L’hypothèse d’indépendance des observations est l’une des plus importantDes hypothèses statistiques pourtant souvent ignorées.
Le test t d'étudiants et TOUTES d'autres tests statistiques reposent sur cette hypothèse, qui peut biaiser l'analyse et générer des résultats trompeurs en cas de violation.
Pour éviter cette violation, les observations de votre ensemble de données doivent être indépendant. Par conséquent, chaque élément de l’échantillon ne doit pas dépendre des autres.
La notion de aléatoire est crucial ici. Un excellent moyen d'éviter de violer l'hypothèse d'indépendance des observations consiste à collecter vos données de manière aléatoire dans un univers adapté à votre étude.
Pour mieux comprendre cette idée, jetons un œil à ce qui suit (ici):
Supposons que nous souhaitions identifier le profil génétique des habitants d'une commune pour répondre à des questions spécifiques. Après avoir défini la taille de l’échantillon, il faut échantillonner aléatoirement les individus de la ville pour ne pas violer l’hypothèse d’indépendance des observations ! En reprenant le même exemple, une méthode d'échantillonnage qui violerait cette hypothèse serait de n'échantillonner que des individus de la même famille pour représenter la municipalité. Dans ce cas, les observations seraient dépendantes les unes des autres puisque le profil génétique est héréditaire et présente une similitude remarquable entre les familles.
4. Normalité
La normalité des résidus est un hypothèse applicable à toutes les analyses inférentielles dites paramétriques.
Cette hypothèse signifie que vos résidus (erreurs) doivent être conformes au fameux distribution normale — la distribution gaussienne — pour utiliser le test t.
La distribution normale présente un courbe en forme de cloche, symétrique autour de son milieu, unimodal.
Mais comment savoir si nos résidus se conformer à la distribution normale ?
La bonne nouvelle est que les analyses statistiques appelées tests de normalité identifiez ce modèle – les principaux sont Shapiro-Wilk, Anderson-Darling et Kolmogorov-Smirnov.
Soyez prudent lorsque pour l'interprétation les résultats de ces tests pour éviter une mauvaise interprétation de leurs indications.
Si les analyses indiquent que l'hypothèse de normalité a été violé, il y a trois possibilités :
(une) Utilisez le test t même si l'hypothèse de normalité n'est pas respectée, en affirmant qu'il s'agit d'un test robuste pour ces écarts et que nous disposons d'une taille d'échantillon adéquate.
(B) Essayez un transformation de données et revérifiez ensuite la normalité.
(c) Enfin, utilisez une analyse non paramétrique équivalente au test t.
Nous ne recommandons pas le premier possibilité. Après tout, si vous envisagez d’utiliser le test t quelle que soit la normalité des résidus, pourquoi effectuer ces analyses ?
Nous choisissons habituellement le seconde option, et si l’hypothèse de normalité reste violée, nous procédons à l’option troisième.
Tests paramétriques et leurs équivalents non paramétriques :
- L'équivalent du test t pour échantillons indépendants est le test U de Mann-Whitney.
- L'équivalent du test t pour échantillons appariés est le test de rang signé de Wilcoxon.
- Un échantillon équivalent du test t est le test de rang signé de Wilcoxon sur un échantillon.
5. Homoscédasticité
Il suffit de procéder à cela dernière étape si les résidus n'ont pas violé l'hypothèse de normalité. Par conséquent, nous utiliserons un test t de Student.
Malgré son nom complexe, le sens de cette hypothèse est simple à comprendre.
L'homoscédasticité ne signifie rien d'autre que écarts similaires.
Pour appliquer le test t dans son Standard format, les variances des résidus des deux populations échantillonnées doivent être similaires.
Pour vérifier si cette hypothèse est vérifiée violé, les tests inférentiels sont largement disponibles dans les logiciels statistiques !
Le test F, les tests de Bartlett et de Levene sont parmi les tests les plus couramment utilisés pour vérifier l'égalité des variances. Cependant, leur application n’a de sens que si les résidus n’ont pas violé l’hypothèse de normalité.
Cette hypothèse pose généralement peu de problèmes. S’il est violé – les populations présentent des variances inégales ou une hétéroscédasticité – un problème mineur de la plateforme prothétique dans le test t des étudiants résout le problème.
La plupart des logiciels statistiques renvoient automatiquement la valeur du test t corrigé pour l'hétéroscédasticité.
Examinez attentivement les résultats du test t de Student et des analyses d'homoscédasticité pour vérifier l'interprétation.
Remarques finales
Notre Test t de Student est l’une des analyses statistiques inférentielles les plus utilisées dans le monde.
De nombreuses études l'ont mal appliqué, jetant doute sur ses résultats et ses conclusions.
Vous pouvez effectuer une analyse incontestable en suivant les cinq simples mesures.
À résumer, nous devons:
choisissez le type de test t, calculer la taille de l'échantillon, effectuer un échantillonnage aléatoire approprié, vérifier la normalité des résidus, et vérifier l’égalité des variances entre populations.
Après avoir effectué ces étapes, il ne reste plus qu'à courir l'analyse!