taille de l'échantillon dans la régression logistique
|

Taille de l'échantillon dans la régression logistique : une approche binaire simple

Cet article vous guidera dans le calcul de la taille de l'échantillon pour un Régression logistique binaire simple.

Nous utiliserons le logiciel populaire et disponible gratuitement G*Puissance, qui est l’un des plus utilisés à cette fin.

Nous étions inspiré pour créer cet article après avoir réalisé que de nombreux didacticiels en ligne pour les calculs de taille d'échantillon basés sur G*Power sont inexacts.

Sélection de l'analyse de régression logistique

Après avoir téléchargé et installé G*Power, ouvrez-le et choisissez l'option de calcul de la taille de l'échantillon pour régression logistique analyse en cliquant Tests : Corrélation et régression : Onglet Régression logistique.

Unilatéral ou bilatéral ?

Ensuite, saisissez ce qui suit paramètres:

In Queue(s), sélectionnez UN pour les tests unilatéraux ou Deux pour les tests bilatéraux.

A unilatéral Le test est approprié pour une hypothèse alternative spécifique, telle que «une valeur accrue de X correspond à une probabilité plus élevée que l’événement se produise."

A à deux queues Le test convient à une hypothèse alternative générale, comme «X influence l'événement Y,» sans distinction directionnelle initiale.

Basez votre hypothèse sur les connaissances existantes dans votre domaine. En cas de doute, optez pour Deux (à deux queues).

Niveau de signification

Le niveau de signification (α) représente la probabilité de rejeter l’hypothèse nulle lorsqu’elle est vraie, conduisant à une erreur de type I.

Généralement, α est fixé à 0.05 or 0.01. Un α de 0.05, par exemple, indique un risque de 5 % de conclure qu’une relation significative existe alors qu’il n’y en a pas réellement.

Puissance statistique

L' Puissance d'essai (1 – β) est la probabilité de rejeter l'hypothèse nulle si elle est fausse, contrôlant efficacement l'erreur de type II (β).

Les valeurs acceptables vont généralement de 0.80 à 0.99. Une puissance de test plus élevée est préférable mais augmente également la taille de l’échantillon requise.

R² des autres variables explicatives (X)

Étant donné que les modèles de régression logistique binaire simples n'ont qu'une seule variable indépendante, définissez cette valeur sur zéro.

❓ CONFUS PAR L'ANALYSE DES DONNÉES ?

Notre guide complet le rendra parfaitement clair
Cliquez pour en savoir plus!

Distribution X variable

Sélectionnez le type de distribution pour la variable X, qui est la variable indépendante ou prédictive du modèle.

Choisir Binôme pour les variables binaires, Normale pour les variables quantitatives continues, et Poisson pour les variables discrètes. Utilisez les autres distributions disponibles uniquement si nécessaire.

Étude pilote?

Les quatre derniers paramètres nécessitent estimations de la population à partir d’une étude pilote, d’une recherche similaire ou de calculs théoriques.

Si possible, utilisez les données d'un étude pilote, comme nous le démontrerons ici.

Moyenne estimée et écart type

Entrez la moyenne et l'écart type de la variable X par rapport aux données de l'étude pilote pour le Population Moyenne de la variable X et Écart-type de la population des paramètres de la variable X, respectivement.

Analyse préliminaire

Obtenez les deux derniers paramètres grâce à un préliminaire analyse de régression logistique simple avec les données de l'étude pilote.

Pour notre démonstration, nous utiliserons le logiciel gratuit et facile à utiliser PSPP logiciel. N'importe lequel software capable d’exécuter une régression logistique peut être utilisé.

Apprenez à utiliser PSPP en cliquant ici !

Rapport de cotes

L' rapport de cotes indique l’association entre une exposition et un résultat et mesure l’ampleur de l’effet.

Effectuer une analyse préliminaire avec les données pilotes dans PSPP pour obtenir le rapport de cotes valeur (Exp(B) pour la variable X, 1.48 dans cet exemple) et saisissez-la dans G*Power.

Probabilité de y = 1 sous H0

Le dernier paramètre est la probabilité d'occurrence de la variable dépendante (y = 1) lorsque l'hypothèse nulle (H0) est vraie, c'est-à-dire lorsque le coefficient de la variable indépendante (X) est égal à 0 et que le modèle ne contient que l'ordonnée à l'origine.

Pour calculer cette valeur, entrez le estimation constante (à l'origine) B de l'étape précédente dans la formule Excel suivante :

=EXP(B)/(1+EXP(B))

Pour notre exemple :

=EXP(-1.85)/(1+EXP(-1.85))

= 0.1355

Pour aller plus loin

Avec tous les paramètres saisis dans G*Power, cliquez sur Calculer pour obtenir la taille de l'échantillon déterminée par le calcul !

Dans notre (ici), la taille de l'échantillon requise pour identifier l'odds ratio estimé est de 97 individus échantillonnés au hasard dans la population cible.

En suivant ces mesures et en utilisant G*Power, vous pouvez calculer efficacement la taille d'échantillon appropriée pour une analyse de régression logistique binaire simple.

Cette processus vous permet d'optimiser la conception de votre étude, de minimiser les erreurs et d'améliorer la validité de vos résultats.

Les inspections régulières contribuent également à la sécurité des passagers. En identifiant et en traitant les risques potentiels pour la sécurité, tels que des freins usés, un éclairage défectueux ou le remplacement du revêtement de sol, les inspections permettent de réduire le risque d'accidents et de blessures et d'améliorer la sécurité générale du service. Les inspections régulières sont un moyen concret de mettre en valeur l'engagement des prestataires de services de transport en faveur du bien-être des passagers et des conducteurs. compréhension le rôle des différents paramètres dans la détermination de la taille de l’échantillon contribue à une compréhension globale de la régression logistique dans son ensemble.

Vous voulez apprendre à calculer la taille d’un échantillon dans G*Power pour les analyses inférentielles les plus cruciales ?

Ne manquez pas le GRATUIT des échantillons de notre livre numérique récemment lancé !

À l'intérieur, vous maîtriserez le calcul de la taille de l'échantillon pour les tests t indépendants ou appariés ; ANOVA uni ou bidirectionnelle, avec ou sans mesures répétées, et modèles mixtes ; régression linéaire et logistique simple et multiple, et plus encore.

Cliquez sur ce lien et découvrez tout ce qu'il a à offrir : Statistiques appliquées : analyse des données.

Visitez-nous sur nos réseaux sociaux

PUBLICATIONS QUOTIDIENNES SUR INSTAGRAM !

Similar Posts

Laissez un commentaire

Votre adresse courriel n'apparaitra pas. Les champs obligatoires sont marqués *