Comment évaluer la signification statistique

Auteur: Randy Alexander
Date De Création: 2 Avril 2021
Date De Mise À Jour: 26 Juin 2024
Anonim
Fil rouge : La significativité statistique
Vidéo: Fil rouge : La significativité statistique

Contenu

Le test d'hypothèse est guidé par une analyse statistique. La confiance statistiquement significative est calculée à l'aide de la valeur p - qui indique la probabilité d'un résultat observé lorsqu'une certaine (hypothèse nulle) est vraie. Si la valeur p est inférieure au niveau de signification (généralement 0,05), l'expérimentateur peut conclure qu'il y a suffisamment de preuves pour réfuter l'hypothèse nulle et admettre l'hypothèse inverse. À l'aide d'un simple test t, vous pouvez calculer la valeur p et déterminer la signification entre deux groupes de données différents.

Pas

Partie 1 sur 3: Configurez vos expériences

  1. Déterminez votre hypothèse. La première étape de l'évaluation de la signification statistique consiste à identifier les questions auxquelles répondre et à déclarer votre hypothèse. L'hypothèse est un énoncé des données empiriques et des écarts possibles dans la population. Chaque expérience a une hypothèse nulle et une hypothèse inverse. En général, vous comparerez deux groupes pour voir s'ils sont identiques ou différents.
    • En général, l'hypothèse n'est pas (H0) confirment qu'il n'y a pas de différence entre les deux groupes de données. Exemple: les élèves qui lisent le matériel avant le cours n'obtiennent pas de meilleures notes finales.
    • L'hypothèse inverse (Hune) est contraire à l'hypothèse nulle et est une affirmation que vous essayez d'étayer avec vos données empiriques. Par exemple: les élèves qui lisent le matériel avant le cours obtiennent en fait de meilleures notes finales.

  2. Sélectionnez le niveau de signification pour déterminer le degré de différence qui peut être considéré comme significatif dans les données. Le niveau de signification (également appelé alpha) est le seuil que vous choisissez pour déterminer la signification. Si la valeur p est inférieure ou égale à un niveau de signification donné, les données sont considérées comme statistiquement significatives.
    • En règle générale, le niveau de signification (ou alpha) est généralement choisi au niveau de 0,05 - ce qui signifie que la chance d'observer la différence observée sur les données n'est aléatoire que de 5%.
    • Plus le niveau de confiance est élevé (et par conséquent, plus la valeur p est basse), plus les résultats sont significatifs.
    • Si plus de confiance est requise, abaissez la valeur de p à 0,01. Une faible valeur p est souvent utilisée dans la fabrication pour détecter les défauts du produit. Un degré élevé de fiabilité est essentiel pour accepter que chaque pièce fonctionnera comme il se doit.
    • Pour la plupart des expériences basées sur des hypothèses, un niveau de signification de 0,05 est acceptable.

  3. Décidez s'il faut utiliser un test unilatéral ou bilatéral. L'une des hypothèses du test t est que vos données sont dans une distribution normale. La distribution normale formera une courbe en cloche avec la majorité des observations centrées. Le test t est un test mathématique qui vérifie si vos données se situent à l'extérieur de la distribution normale, au-dessus ou en dessous, dans la partie «supérieure» de la courbe.
    • Si vous n'êtes pas sûr que les données soient au-dessus ou en dessous du groupe témoin, utilisez un test bilatéral. Il vous permet de vérifier la signification dans les deux sens.
    • Si vous connaissez la direction attendue de vos données, utilisez un test unilatéral. Dans l'exemple ci-dessus, vous vous attendez à ce que les scores de l'élève s'améliorent. Par conséquent, vous utilisez le test unilatéral.

  4. Déterminez la taille de l'échantillon avec l'analyse de la force. La force d'un test est la capacité d'observer le résultat attendu avec une taille d'échantillon donnée. Le seuil commun de force (ou β) est de 80%. L'analyse des forces peut être assez compliquée sans quelques données préliminaires car vous avez besoin d'informations sur la moyenne attendue entre les groupes et leurs écarts types. Utilisez l'analyse de force en ligne pour déterminer la taille d'échantillon optimale pour vos données.
    • Les chercheurs effectuent souvent une petite étude sur les prémisses pour éclairer l'analyse de la force et décider de la taille de l'échantillon nécessaire pour une étude vaste et complète.
    • S'il n'y a aucun moyen de faire des recherches complexes sur les prémisses, estimez la moyenne possible en vous basant sur la lecture d'articles et de recherches que d'autres personnes ont pu faire. Cela peut vous donner un bon départ pour déterminer la taille des échantillons.
    publicité

Partie 2 sur 3: Calculer l'écart type

  1. Déterminez la formule de l'écart type. L'écart type mesure la dispersion des données. Il vous donne des informations sur l'identité de chaque point de données de l'échantillon. Au début, les équations peuvent sembler assez compliquées. Cependant, les étapes ci-dessous vous aideront à comprendre facilement le processus de calcul. La formule est s = √∑ ((xje - µ) / (N - 1)).
    • s est l'écart type.
    • ∑ indique que vous devrez additionner toutes les observations recueillies.
    • Xje chacun représente la valeur de vos données.
    • µ est la moyenne des données pour chaque groupe.
    • N est le nombre total d'observations.
  2. Faites la moyenne du nombre d'observations dans chaque groupe. Pour calculer l'écart type, vous devez d'abord calculer la moyenne des observations pour chaque groupe individuel. Cette valeur est symbolisée par la lettre grecque mu ou µ. Pour ce faire, ajoutez simplement les observations et divisez par le nombre total d'observations.
    • Par exemple, pour trouver le score moyen du groupe lisant le document avant le cours, examinons quelques données. Pour simplifier, nous utiliserons un ensemble de données de 5 points: 90, 91, 85, 83 et 94 (sur une échelle de 100 points).
    • Additionnez toutes les observations: 90 + 91 + 85 + 83 + 94 = 443.
    • Divisez la somme ci-dessus par le nombre d'observations N (N = 5): 443/5 = 88,6.
    • La note moyenne pour ce groupe est de 88,6.
  3. Soustrayez la moyenne de chaque valeur observée. L'étape suivante implique la partie (xje - µ) de l'équation. Soustrayez la valeur moyenne de chaque valeur observée. Avec l'exemple ci-dessus, nous avons cinq soustractions.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) et (94 - 88,6).
    • La valeur calculée est 1,4; 2,4; -3,6; -5,6 et 5,4.
  4. Mettez au carré les différences ci-dessus et additionnez-les. Chaque nouvelle valeur juste calculée sera maintenant au carré. Ici, le signe négatif sera également supprimé. Si un signe négatif apparaît après cette étape ou à la fin du calcul, vous avez peut-être oublié de faire l'étape ci-dessus.
    • Dans notre exemple, nous allons maintenant travailler avec 1.96; 5,76; 12,96; 31.36 et 29.16.
    • Additionnez ces carrés ensemble: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Divisez par le nombre total d'observations moins 1. La division par N - 1 permet de compenser un calcul qui n'est pas effectué sur la population dans son ensemble, mais qui est basé sur un échantillon de tous les élèves.
    • Soustraire: N - 1 = 5 - 1 = 4
    • Diviser: 81,2 / 4 = 20,3
  6. Obtenez la racine carrée. Une fois divisé par le nombre d'observations moins 1, prenez la racine carrée de la valeur obtenue. Il s'agit de la dernière étape du calcul de l'écart type. Certains programmes statistiques vous aideront à effectuer ce calcul après l'importation des données d'origine.
    • Avec l'exemple ci-dessus, l'écart type de la note de fin de semestre des élèves lisant le document avant le cours est: s = √20,3 = 4,51.
    publicité

Partie 3 sur 3: Détermination de la signification statistique

  1. Calculez la variance entre vos deux groupes d'observations. Jusqu'à présent, l'exemple n'a traité que d'un seul groupe d'observations. Pour comparer deux groupes, vous avez évidemment besoin des données des deux. Calculez l'écart type du deuxième groupe d'observations et utilisez-le pour calculer la variance entre les deux groupes expérimentaux. La formule de calcul de la variance est: s = √ ((s1/ N1) + (s2/ N2)).
    • S est la variance entre les groupes.
    • S1 est l'écart type des groupes 1 et N1 est la taille du groupe 1.
    • S2 est l'écart type des groupes 2 et N2 est la taille du groupe 2.
    • Dans notre exemple, disons que les données du groupe 2 (élèves qui n'ont pas lu le texte avant le cours) ont une taille de 5 et un écart type de 5,81. La variance est:
      • S = √ ((s1) / N1) + ((s2) / N2))
      • S = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Calculez le t-score des données. Les statistiques T vous permettent de convertir des données sous une forme comparable à d'autres données. La valeur t vous permet également d'effectuer un test t, un test qui vous permet de calculer la probabilité d'une différence statistiquement significative entre les deux groupes. La formule pour calculer la statistique t est: t = (µ1 – µ2) / S.
    • µ1 est la moyenne du premier groupe.
    • µ2 est la moyenne du deuxième groupe.
    • S est la variance entre les observations.
    • Utilisez la moyenne la plus grande comme µ1 afin de ne pas obtenir une statistique t négative.
    • Pour notre exemple, supposons que la moyenne observée pour le groupe 2 (qui n'a pas lu l'article précédent) soit de 80. Le t-score est: t = (µ1 – µ2) / S = (88,6 – 80)/3,29 = 2,61.
  3. Déterminez le degré de liberté de l'échantillon. Lors de l'utilisation de la statistique t, les degrés de liberté sont déterminés en fonction de la taille de l'échantillon. Additionnez le nombre d'observations pour chaque groupe, puis soustrayez deux. Dans l'exemple ci-dessus, le degré de liberté (d.f.) est de 8 car il y a 5 observations dans le premier groupe et 5 échantillons dans le second groupe ((5 + 5) - 2 = 8).
  4. Utilisez le tableau t pour évaluer la signification. Les tableaux des valeurs t et des degrés de liberté peuvent être trouvés dans un livre de statistiques standard ou en ligne. Trouvez la ligne qui contient les degrés de liberté des données et la valeur p qui correspond à la statistique t dont vous disposez.
    • Avec des degrés de liberté 8 et t = 2,61, la valeur p pour un test unilatéral se situe entre 0,01 et 0,025. Le niveau de signification choisi étant inférieur ou égal à 0,05, nos données sont statistiquement significatives. Avec ces données, nous rejetons l'hypothèse nulle et acceptons l'hypothèse inverse: les élèves qui lisent le matériel avant le cours ont des scores finaux plus élevés.
  5. Envisagez de mener d'autres recherches. De nombreux chercheurs effectuent des études sur les lieux avec plusieurs paramètres pour comprendre comment concevoir une étude plus large. Faire d'autres recherches avec plus de métriques augmentera votre confiance dans vos conclusions. publicité

Conseil

  • La statistique est un domaine vaste et complexe. Suivez un cours de test d'hypothèses statistiques à l'école secondaire ou à l'université (ou plus) pour comprendre la signification statistique.

avertissement

  • Cette analyse se concentre sur le test t pour vérifier la différence entre les deux populations de distribution normale. Selon la complexité des données, vous devrez peut-être un autre test statistique.