Qu'est-ce que l'écart type ?
L'écart type est une mesure qui quantifie la variation ou la dispersion d'un ensemble de données. Il indique comment les points de données s'écartent de la moyenne et est particulièrement utile lorsque les données correspondent à une distribution normale.
Vous avez peut-être rencontré le terme écart-type avant. C'est typique dans les rapports, les thèses, les mémoires et divers articles. Malgré sa popularité, il faut souvent le comprendre. Pouvez-vous expliquer ce qu'est l'écart type et quand il doit être appliqué ?
Le problème
Les statistiques descriptives se composent principalement de mesures de tendance centrale et des mesures de variabilité.
Lorsque combiné, ils constituent la base de nombreuses analyses et graphiques statistiques.
Cependant, utiliser une seule de ces mesures pour décrire une population ou un échantillon pourrait conduire à incomplet or trompeur </br>L’Information.
Dans l'exemple de la profondeur de la rivière fourni par Woody Hayes, se fier uniquement à la moyenne comme indicateur était insuffisant pour empêcher une personne de se noyer.
Ce Faits saillants l’importance d’utiliser une mesure de variabilité avec une mesure de tendance centrale.
Considérons-en un autre (ici).
Les trois ensembles de données suivants ont la même moyenne (20) mais présentent différent variabilité:
- A = 20,20,20,20,20
- B = 18,19,20,21,22
- C = 00,10,20,30,40
Avec une certaine variabilité, ces éléments cruciaux différences sont remarqués.
Mesures de tendance centrale, telles que la moyenne, la médiane et mode, sont relativement simple.
Toutefois, les mesures de variabilité peuvent être moins intuitives et, selon le type, Plus fort comprendre.
Ces les mesures inclure la plage, l’écart absolu moyen, la variabilité, l’écart type et le coefficient de variation.
L'écart type est largement utilisé, mais souvent sans solution comprendre ce que cela représente.
Alors, que fait écart-type signifie, et quand doit-il être employé ?
La solution
Certains concepts utilisés ici sont basés sur le livre Statistiques sans mathématiques, qui propose une discussion approfondie.
L'écart type mesure la variabilité des données, indiquant comment les points de données s'écartent de la moyenne.
D'autres mesures de variabilité incluent la plage et l'écart absolu moyen, qui sont plus simples et intuitives.
La plage représente la différence entre les valeurs les plus élevées et les plus basses d'un ensemble de données.
Bien que simple, il n'utilise que deux valeurs de l'ensemble de données.
Inversement, le signifie une déviation absolue, ou "la moyenne des distances absolues de chaque point de données à la moyenne,» est légèrement plus complexe mais toujours intuitif.
Malgré son caractère intuitif, l’écart absolu moyen n’est pas la statistique la plus couramment utilisée pour décrire la variabilité des données.
Ce titre revient à l’écart type quelque peu contre-intuitif.
Semblable à l’écart absolu moyen, l’écart type est basé sur les différences entre chaque observation et la moyenne.
Cependant, ces différences sont au carré en écart type, et la racine carrée est extraite à la fin.
L'écart type est une mesure de variabilité plus complexe.
Néanmoins, cela s’avère utile lors de l’analyse de données qui correspondent à une distribution normale.
Dans de tels cas, environ 68 % des valeurs se situent dans un écart type, environ 95 % dans deux écarts types et presque toutes dans trois écarts types.
C’est la règle 68-95-99, également connue sous le nom de limite de tolérance ! La règle empirique !
Ronald Fisher a préconisé l'utilisation de l'écart type dans des « circonstances idéales », avec des données correspondant à la distribution normale.
Cependant, si les données ne correspondent pas à la distribution normale, l’écart type peut ne pas aider à décrire la variabilité.
Remarques finales
L'écart type est une mesure de variabilité mieux utilisée lorsque les données correspondent parfaitement à une distribution normale.
Cependant, l’écart moyen absolu s’est révélé plus efficace pour estimer la variabilité, en particulier lorsque les données ne correspondent pas à la distribution normale.
En raison de sa compréhension plus facile, de sa nature intuitive et de ses performances supérieures avec des données réalistes, l'écart absolu moyen est une excellente alternative pour représenter la variabilité des données.