test de normalité

Quel test de normalité devriez-vous utiliser ?

Vous apprendrez quel test de normalité est le meilleur et le plus approprié pour divers l'analyse des données situations.

Temps forts

  • Les tests de normalité évaluent si un ensemble de données est normalement distribué, une hypothèse fondamentale dans de nombreux tests statistiques.
  • Dans l'étude de Razali et Wah, le test de Shapiro-Wilk présentait la puissance statistique la plus élevée parmi les quatre tests.
  • Selon l’étude, la puissance des quatre tests augmentait avec la taille des échantillons.

En analyse statistique, les tests de normalité sont cruciaux pour déterminer si un ensemble de données suit une distribution normale ou gaussienne – une hypothèse fondamentale dans de nombreux tests et méthodes statistiques.

Les tests de normalité aident à valider ces hypothèses, en garantissant l'application appropriée de méthodes statistiques et des inférences et prédictions précises et fiables.

La réalisation d'un test de normalité permet aux chercheurs et aux analystes de données de déterminer si leurs données répondent à l'hypothèse de normalité et si les tests paramétriques, qui reposent sur cette hypothèse, sont adaptés.

Lorsque les données s'écartent de la distribution normale, tests non paramétriques peut être plus approprié, ce qui fait moins d’hypothèses sur la distribution des données.

Cet article de blog rend compte des résultats d'une étude comparant la puissance statistique de quatre tests de normalité. Il fournit des conseils pour sélectionner le test le plus approprié pour des ensembles de données spécifiques.

💪 Devenez un pro de l'analyse de données en un rien de temps

Découvrez les techniques qui changent la donne dans notre guide ultime !

Aperçu des tests de normalité

Cette section présentera brièvement les tests de normalité de Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors et Anderson-Darling, en discutant de leurs hypothèses et méthodologies sous-jacentes.

Test de Shapiro-Wilk : Le test de Shapiro-Wilk est largement considéré comme l’un des tests de normalité les plus puissants. Développé en 1965 par Samuel S. Shapiro et Martin B. Wilk, il est spécifiquement conçu pour des échantillons de petite à moyenne taille. Le test calcule une statistique W, qui compare les données observées aux données attendues si elles suivent une distribution normale. Une petite valeur W indique que les données s'écartent considérablement d'une distribution normale.

Test de Kolmogorov-Smirnov : Le test de Kolmogorov-Smirnov (KS) est un test non paramétrique qui compare la fonction de distribution empirique d'un ensemble de données à une distribution théorique spécifiée, généralement la distribution normale. Le test calcule la différence maximale (D) entre les deux fonctions de distribution cumulées. Une valeur D élevée indique un écart significatif par rapport à la normalité. Une limite du test KS est qu'il est moins sensible aux écarts dans les queues de la distribution.

Test de Lilliefors : Le test de Lilliefors, une extension du test de Kolmogorov-Smirnov, a été développé par Hubert Lilliefors en 1967. Il est conçu pour de petits échantillons lorsque les paramètres de population, tels que la moyenne et l'écart type, sont inconnus. Le test modifie le test KS en estimant ces paramètres à partir des données d'échantillon, ce qui permet d'obtenir une évaluation de normalité plus précise pour les petits échantillons.

Test Anderson-Darling : Le test d'Anderson-Darling, développé par Theodore Anderson et Donald Darling en 1952, est un autre test de normalité puissant. Comme le test KS, il compare la fonction de distribution empirique d'un ensemble de données à une distribution théorique spécifiée. Néanmoins, cela donne plus de poids aux queues de la distribution. Ce test calcule une statistique A^2, avec des valeurs plus grandes indiquant un plus grand écart par rapport à la normalité.

Étude - Comparaisons de puissance des tests de normalité

Dans l'article « Power Comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors, and Anderson-Darling Tests » de Nornadiah Mohd Razali et Yap Bee Wah, l'objectif principal est de comparer la puissance statistique des quatre tests de normalité : Shapiro-Wilk , Kolmogorov-Smirnov, Lilliefors et Anderson-Darling.

L'étude vise à déterminer quel test fonctionne le mieux dans diverses conditions et tailles d'échantillon, guidant finalement les chercheurs et les analystes de données dans la sélection du test de normalité le plus approprié pour leurs ensembles de données spécifiques.

Méthodologie: Razali et Wah ont mené des simulations de puissance approfondies à l'aide des techniques de Monte Carlo pour comparer les performances des tests Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors et Anderson-Darling. Les simulations ont pris en compte différentes tailles d'échantillon et différents types de distributions de données. La puissance statistique de chaque test, définie comme la probabilité de rejet correct de l’hypothèse nulle lorsqu’elle est fausse, a été analysée et comparée selon les différents scénarios.

Résultats: L'étude a révélé que le test de Shapiro-Wilk présentait généralement la puissance statistique la plus élevée parmi les quatre tests de normalité, ce qui en faisait le test le plus efficace pour détecter les écarts par rapport à la normalité dans diverses situations. Cependant, il est essentiel de garder à l’esprit que la puissance des quatre tests augmente avec la taille des échantillons.

Conclusion

Les tests de normalité jouent un rôle essentiel dans l'analyse statistique, car ils aident à déterminer l'adéquation des tests paramétriques reposant sur l'hypothèse de normalité.

Le choix du test de normalité approprié peut avoir un impact significatif sur la fiabilité et la validité de l'analyse statistique.

Basé sur l'étude de Nornadiah Mohd Razali et Yap Bee Wah, le test de Shapiro-Wilk démontre généralement la puissance statistique la plus élevée pour détecter les écarts par rapport à la normalité.

Découvrir NO SOUCIS des échantillons de notre nouveau livre numérique et libérez votre véritable potentiel.

Plongez en profondeur dans les avancées l'analyse des données techniques, maîtrisez l’art de déterminer la taille optimale des échantillons et apprenez à communiquer les résultats de manière efficace, claire et concise.

Cliquez sur le lien pour découvrir une richesse de connaissances : Statistiques appliquées : analyse des données.

Les écarts types peuvent-ils être négatifs ?

Connectez-vous avec nous sur nos réseaux sociaux !

PUBLICATIONS QUOTIDIENNES SUR INSTAGRAM !

Test de normalité

Test de normalité

Similar Posts

Laissez un commentaire

Votre adresse courriel n'apparaitra pas. Les champs obligatoires sont marqués *