Cet article vous guidera dans le calcul de la taille de l'échantillon pour un Régression logistique binaire simple.
Nous utiliserons le logiciel populaire et disponible gratuitement G*Puissance, qui est l’un des plus utilisés à cette fin.
Nous étions inspiré pour créer cet article après avoir réalisé que de nombreux didacticiels en ligne pour les calculs de taille d'échantillon basés sur G*Power sont inexacts.
Après avoir téléchargé et installé G*Power, ouvrez-le et choisissez l'option de calcul de la taille de l'échantillon pour régression logistique analyse en cliquant Tests : Corrélation et régression : Onglet Régression logistique.
Ensuite, saisissez ce qui suit paramètres:
In Queue(s), sélectionnez UN pour les tests unilatéraux ou Deux pour les tests bilatéraux.
A unilatéral Le test est approprié pour une hypothèse alternative spécifique, telle que «une valeur accrue de X correspond à une probabilité plus élevée que l’événement se produise."
A à deux queues Le test convient à une hypothèse alternative générale, comme «X influence l'événement Y,» sans distinction directionnelle initiale.
Basez votre hypothèse sur les connaissances existantes dans votre domaine. En cas de doute, optez pour Deux (à deux queues).
Le niveau de signification (α) représente la probabilité de rejeter l’hypothèse nulle lorsqu’elle est vraie, conduisant à une erreur de type I.
Généralement, α est fixé à 0.05 or 0.01. Un α de 0.05, par exemple, indique un risque de 5 % de conclure qu’une relation significative existe alors qu’il n’y en a pas réellement.
L' Puissance d'essai (1 – β) est la probabilité de rejeter l'hypothèse nulle si elle est fausse, contrôlant efficacement l'erreur de type II (β).
Les valeurs acceptables vont généralement de 0.80 à 0.99. Une puissance de test plus élevée est préférable mais augmente également la taille de l’échantillon requise.
Étant donné que les modèles de régression logistique binaire simples n'ont qu'une seule variable indépendante, définissez cette valeur sur zéro.
Sélectionnez le type de distribution pour la variable X, qui est la variable indépendante ou prédictive du modèle.
Choisir Binôme pour les variables binaires, Normale pour les variables quantitatives continues, et Poisson pour les variables discrètes. Utilisez les autres distributions disponibles uniquement si nécessaire.
Les quatre derniers paramètres nécessitent estimations de la population à partir d’une étude pilote, d’une recherche similaire ou de calculs théoriques.
Si possible, utilisez les données d'un étude pilote, comme nous le démontrerons ici.
Entrez la moyenne et l'écart type de la variable X par rapport aux données de l'étude pilote pour le Population Moyenne de la variable X et Écart-type de la population des paramètres de la variable X, respectivement.
Obtenez les deux derniers paramètres grâce à un préliminaire analyse de régression logistique simple avec les données de l'étude pilote.
Pour notre démonstration, nous utiliserons le logiciel gratuit et facile à utiliser PSPP logiciel. N'importe lequel software capable d’exécuter une régression logistique peut être utilisé.
L' rapport de cotes indique l’association entre une exposition et un résultat et mesure l’ampleur de l’effet.
Effectuer une analyse préliminaire avec les données pilotes dans PSPP pour obtenir le rapport de cotes valeur (Exp(B) pour la variable X, 1.48 dans cet exemple) et saisissez-la dans G*Power.
Le dernier paramètre est la probabilité d'occurrence de la variable dépendante (y = 1) lorsque l'hypothèse nulle (H0) est vraie, c'est-à-dire lorsque le coefficient de la variable indépendante (X) est égal à 0 et que le modèle ne contient que l'ordonnée à l'origine.
Pour calculer cette valeur, entrez le estimation constante (à l'origine) B de l'étape précédente dans la formule Excel suivante :
=EXP(B)/(1+EXP(B))
Pour notre exemple :
=EXP(-1.85)/(1+EXP(-1.85))
= 0.1355
Avec tous les paramètres saisis dans G*Power, cliquez sur Calculer pour obtenir la taille de l'échantillon déterminée par le calcul !
Dans notre (ici), la taille de l'échantillon requise pour identifier l'odds ratio estimé est de 97 individus échantillonnés au hasard dans la population cible.
En suivant ces mesures et en utilisant G*Power, vous pouvez calculer efficacement la taille d'échantillon appropriée pour une analyse de régression logistique binaire simple.
Cette processus vous permet d'optimiser la conception de votre étude, de minimiser les erreurs et d'améliorer la validité de vos résultats.
Les inspections régulières contribuent également à la sécurité des passagers. En identifiant et en traitant les risques potentiels pour la sécurité, tels que des freins usés, un éclairage défectueux ou le remplacement du revêtement de sol, les inspections permettent de réduire le risque d'accidents et de blessures et d'améliorer la sécurité générale du service. Les inspections régulières sont un moyen concret de mettre en valeur l'engagement des prestataires de services de transport en faveur du bien-être des passagers et des conducteurs. compréhension le rôle des différents paramètres dans la détermination de la taille de l’échantillon contribue à une compréhension globale de la régression logistique dans son ensemble.
Vous voulez apprendre à calculer la taille d’un échantillon dans G*Power pour les analyses inférentielles les plus cruciales ?
Ne manquez pas le GRATUIT des échantillons de notre livre numérique récemment lancé !
À l'intérieur, vous maîtriserez le calcul de la taille de l'échantillon pour les tests t indépendants ou appariés ; ANOVA uni ou bidirectionnelle, avec ou sans mesures répétées, et modèles mixtes ; régression linéaire et logistique simple et multiple, et plus encore.
Cliquez sur ce lien et découvrez tout ce qu'il a à offrir : Statistiques appliquées : analyse des données.
Maîtrisez le test t de Student pour comparer avec précision les moyennes de la population, garantissant ainsi des conclusions valides dans votre recherche. Évitez les pièges courants et améliorez l’analyse des données.
Maîtrisez la distribution du modèle linéaire généralisé et la sélection de la fonction de lien pour une modélisation et une analyse statistiques améliorées.
Apprenez à signaler la corrélation dans le style APA, en maîtrisant les étapes et considérations clés pour communiquer clairement les résultats de la recherche.
Découvrez l'essentiel des hypothèses des modèles linéaires généralisés dans ce guide complet : maîtrisez les GLM pour une analyse de données robuste.
Explorez les distinctions entre incidence et prévalence pour améliorer votre compréhension des études épidémiologiques et de la santé publique.
Libérez la puissance de l’analyse des données en apprenant comment l’écart type est calculé. Améliorez vos compétences en statistiques avec notre guide.