Comment calculer le coefficient de corrélation linéaire

Auteur: Eric Farmer
Date De Création: 7 Mars 2021
Date De Mise À Jour: 1 Juillet 2024
Anonim
Comment calculer le coefficient de corrélation linéaire - Société
Comment calculer le coefficient de corrélation linéaire - Société

Contenu

Le coefficient de corrélation (ou coefficient de corrélation linéaire) est désigné par "r" (dans de rares cas par "ρ") et caractérise la corrélation linéaire (c'est-à-dire la relation donnée par une valeur et une direction) de deux ou plusieurs variables. La valeur du coefficient est comprise entre -1 et +1, c'est-à-dire que la corrélation peut être à la fois positive et négative. Si le coefficient de corrélation est de -1, il existe une corrélation négative parfaite ; si le coefficient de corrélation est +1, il y a une corrélation positive parfaite. Sinon, il existe une corrélation positive entre les deux variables, une corrélation négative ou aucune corrélation. Le coefficient de corrélation peut être calculé manuellement, avec des calculatrices en ligne gratuites ou avec une bonne calculatrice graphique.

Pas

Méthode 1 sur 4: Calculer le coefficient de corrélation manuellement

  1. 1 Collecter des données. Avant de commencer à calculer le coefficient de corrélation, étudiez ces paires de nombres. Mieux vaut les noter dans un tableau qui peut être disposé verticalement ou horizontalement. Étiquetez chaque ligne ou colonne avec « x » et « y ».
    • Par exemple, étant donné quatre paires de valeurs (nombres) des variables "x" et "y". Vous pouvez créer le tableau suivant :
      • x || oui
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Calculer la moyenne arithmétique "x". Pour ce faire, additionnez toutes les valeurs x, puis divisez le résultat par le nombre de valeurs.
    • Dans notre exemple, il y a quatre valeurs pour la variable "x". Pour calculer la moyenne arithmétique « x », ajoutez ces valeurs, puis divisez la somme par 4. Les calculs s'écrivent comme suit :
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μX=12/4{ displaystyle mu _ {x} = 12/4}
    • μX=3{ displaystyle mu _ {x} = 3}
  3. 3 Trouvez la moyenne arithmétique "y". Pour ce faire, suivez les mêmes étapes, c'est-à-dire additionnez toutes les valeurs y, puis divisez la somme par le nombre de valeurs.
    • Dans notre exemple, quatre valeurs de la variable "y" sont données. Additionnez ces valeurs, puis divisez la somme par 4. Les calculs s'écriront comme suit :
    • μoui=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μoui=16/4{ displaystyle mu _ {y} = 16/4}
    • μoui=4{ displaystyle mu _ {y} = 4}
  4. 4 Calculer l'écart type "x". Après avoir calculé les moyennes de "x" et "y", trouvez les écarts types de ces variables. L'écart type est calculé à l'aide de la formule suivante :
    • σX=1m1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • Dans notre exemple, les calculs s'écriront comme ceci :
    • σX=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σX=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σX=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σX=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σX=1,83{ style d'affichage sigma _ {x} = 1,83}
  5. 5 Calculez l'écart type "y". Suivez les étapes décrites à l'étape précédente. Utilisez la même formule, mais branchez les valeurs y.
    • Dans notre exemple, les calculs s'écriront comme ceci :
    • σoui=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σoui=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σoui=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σoui=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σoui=2,58{ displaystyle sigma _ {y} = 2.58}
  6. 6 Notez la formule de base pour calculer le coefficient de corrélation. Cette formule comprend les moyennes, les écarts types et le nombre (n) de paires de nombres des deux variables. Le coefficient de corrélation est noté « r » (dans de rares cas « ρ »). Cet article utilise une formule pour calculer le coefficient de corrélation de Pearson.
    • ρ=(1m1)Σ(XμXσX)(ouiμouiσoui){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } droite) * gauche ({ frac {y- mu _ {y}} { sigma _ {y}}} droite)}
    • Ici et dans d'autres sources, les quantités peuvent être désignées de différentes manières. Par exemple, certaines formules contiennent « ρ » et « σ », tandis que d'autres contiennent « r » et « s ». Certains manuels donnent des formules différentes, mais ce sont des contreparties mathématiques à la formule ci-dessus.
  7. 7 Calculer le coefficient de corrélation. Vous avez calculé les moyennes et les écarts types des deux variables, vous pouvez donc utiliser la formule pour calculer le coefficient de corrélation. Rappelons que "n" est le nombre de paires de valeurs pour les deux variables. D'autres valeurs ont été calculées plus tôt.
    • Dans notre exemple, les calculs s'écriront comme ceci :
    • ρ=(1m1)Σ(XμXσX)(ouiμouiσoui){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } droite) * gauche ({ frac {y- mu _ {y}} { sigma _ {y}}} droite)}
    • ρ=(13){ displaystyle rho = left ({ frac {1} {3}} right) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left ({ frac {1-3} {1.83}} right) * left ({ frac {1-4} {2.58}} right) + left ({ frac {2 -3} {1.83}} droite) * gauche ({ frac {3-4} {2.58}} droite)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + left ({ frac {4-3} {1.83}} right) * left ({ frac {5-4} {2.58}} right) + left ( { frac { 5-3} {1.83}} droite) * gauche ({ frac {7-4} {2.58}} droite)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = gauche ({ frac {1} {3}} droite) * gauche ({ frac {6 + 1 + 1 + 6} {4.721}} droite)}
    • ρ=(13)2,965{ displaystyle rho = left ({ frac {1} {3}} right) * 2.965}
    • ρ=(2,9653){ displaystyle rho = left ({ frac {2,965} {3}} right)}
    • ρ=0,988{ style d'affichage rho = 0.988}
  8. 8 Analysez le résultat. Dans notre exemple, le coefficient de corrélation est de 0,988. Cette valeur caractérise en quelque sorte un ensemble donné de paires de nombres. Faites attention au signe et à la grandeur de la valeur.
    • La valeur du coefficient de corrélation étant positive, il existe une corrélation positive entre les variables "x" et "y". C'est-à-dire que lorsque la valeur de "x" augmente, la valeur de "y" augmente également.
    • La valeur du coefficient de corrélation étant très proche de +1, les valeurs des variables "x" et "y" sont fortement corrélées. Si vous placez des points sur le plan de coordonnées, ils seront situés près d'une ligne droite.

Méthode 2 sur 4: Utilisation de calculatrices en ligne pour calculer le coefficient de corrélation

  1. 1 Trouvez une calculatrice sur Internet pour calculer le coefficient de corrélation. Ce coefficient est souvent calculé en statistique. S'il y a beaucoup de paires de nombres, il est presque impossible de calculer le coefficient de corrélation manuellement. Par conséquent, il existe des calculateurs en ligne pour calculer le coefficient de corrélation. Dans un moteur de recherche, saisissez "calculateur de coefficient de corrélation" (sans les guillemets).
  2. 2 Entrer des données. Consultez les instructions sur le site Web pour saisir les données correctes (paires de nombres). Il est impératif de saisir les paires de chiffres appropriées ; sinon, vous obtiendrez le mauvais résultat. N'oubliez pas que différents sites Web ont des formats d'entrée différents.
    • Par exemple, sur http://ncalculators.com/statistics/correlation-coefficient-calculator.htm, les valeurs des variables x et y sont saisies sur deux lignes horizontales. Les valeurs sont séparées par des virgules. C'est-à-dire que dans notre exemple, les valeurs "x" sont saisies comme ceci : 1,2,4,5, et les valeurs "y" comme ceci : 1,3,5,7.
    • Sur un autre site, http://www.alcula.com/calculators/statistics/correlation-coefficient/, les données sont saisies verticalement ; dans ce cas, ne confondez pas les paires de nombres correspondantes.
  3. 3 Calculer le coefficient de corrélation. Après avoir entré les données, cliquez simplement sur le bouton "Calculer", "Calculer" ou un bouton similaire pour obtenir le résultat.

Méthode 3 sur 4: Utilisation d'une calculatrice graphique

  1. 1 Entrer des données. Prenez une calculatrice graphique, passez en mode de calcul statistique et sélectionnez la commande "Modifier".
    • Différentes calculatrices nécessitent d'appuyer sur différentes touches. Cet article traite de la calculatrice Texas Instruments TI-86.
    • Appuyez sur [2nd] - Stat (au-dessus de la touche +) pour entrer dans le mode de calcul statistique. Appuyez ensuite sur F2 - Modifier.
  2. 2 Supprimez les données enregistrées précédemment. La plupart des calculatrices conservent les statistiques que vous saisissez jusqu'à ce que vous les effaciez. Pour éviter de confondre les anciennes données avec les nouvelles, supprimez d'abord toutes les informations stockées.
    • Utilisez les touches fléchées pour déplacer le curseur et mettre en surbrillance l'en-tête 'xStat'. Appuyez ensuite sur Clear et Enter pour effacer toutes les valeurs saisies dans la colonne xStat.
    • Utilisez les touches fléchées pour mettre en surbrillance l'en-tête 'yStat'. Appuyez ensuite sur Clear et Enter pour effacer toutes les valeurs saisies dans la colonne yStat.
  3. 3 Saisissez les données initiales. Utilisez les touches fléchées pour déplacer le curseur sur la première cellule sous le titre "xStat". Saisissez la première valeur et appuyez sur Entrée. En bas de l'écran, « xStat (1) = __ » s'affiche, la valeur saisie remplaçant un espace. Après avoir appuyé sur Entrée, la valeur saisie apparaîtra dans le tableau et le curseur passera à la ligne suivante ; cela affichera "xStat (2) = __" en bas de l'écran.
    • Saisissez toutes les valeurs de la variable "x".
    • Après avoir entré toutes les valeurs pour x, utilisez les touches fléchées pour accéder à la colonne yStat et entrez les valeurs pour y.
    • Après avoir entré toutes les paires de nombres, appuyez sur Quitter pour effacer l'écran et quitter le mode d'agrégation.
  4. 4 Calculer le coefficient de corrélation. Il caractérise à quel point les données sont proches d'une certaine ligne droite. La calculatrice graphique peut déterminer rapidement la ligne droite appropriée et calculer le coefficient de corrélation.
    • Cliquez sur Stat - Calc. Sur la TI-86, appuyez sur [2nd] - [Stat] - [F1].
    • Sélectionnez la fonction Régression linéaire. Sur la TI-86, appuyez sur [F3] qui est étiqueté "LinR". L'écran affichera la ligne "LinR _" avec un curseur clignotant.
    • Entrez maintenant les noms de deux variables : xStat et yStat.
      • Sur TI-86, ouvrez la liste des noms ; pour ce faire, appuyez sur [2nd] - [List] - [F3].
      • Les variables disponibles sont affichées sur la ligne inférieure de l'écran. Sélectionnez [xStat] (vous devrez probablement appuyer sur F1 ou F2 pour ce faire), entrez une virgule, puis sélectionnez [yStat].
      • Appuyez sur Entrée pour traiter les données saisies.
  5. 5 Analysez vos résultats. En appuyant sur Entrée, l'écran affichera les informations suivantes :
    • oui=une+bX{ displaystyle y = a + bx}: c'est la fonction qui décrit la ligne. Veuillez noter que la fonction n'est pas écrite sous forme standard (y = kx + b).
    • une={ displaystyle a =}... Il s'agit de la coordonnée y de l'intersection de la droite avec l'axe y.
    • b={ style d'affichage b =}... C'est la pente de la ligne.
    • corr={ displaystyle { text {corr}} =}... C'est le coefficient de corrélation.
    • m={ style d'affichage n =}... C'est le nombre de paires de nombres qui ont été utilisées dans les calculs.

Méthode 4 sur 4: Expliquer les concepts de base

  1. 1 Comprendre le concept de corrélation. La corrélation est la relation statistique entre deux quantités. Le coefficient de corrélation est une valeur numérique qui peut être calculée pour deux ensembles de données. La valeur du coefficient de corrélation est toujours comprise entre -1 et +1 et caractérise le degré de relation entre deux variables.
    • Par exemple, compte tenu de la taille et de l'âge des enfants (environ 12 ans). Très probablement, il y aura une forte corrélation positive, car les enfants grandissent avec l'âge.
    • Un exemple de corrélation négative : les secondes de pénalité et le temps passé à l'entraînement de biathlon, c'est-à-dire que plus un athlète s'entraîne, moins il y aura de secondes de pénalité.
    • Enfin, il y a parfois très peu de corrélation (positive ou négative), comme par exemple entre la pointure et les notes en mathématiques.
  2. 2 Rappelez-vous comment calculer la moyenne arithmétique. Pour calculer la moyenne arithmétique (ou moyenne), vous devez trouver la somme de toutes ces valeurs, puis la diviser par le nombre de valeurs. N'oubliez pas que la moyenne arithmétique est nécessaire pour calculer le coefficient de corrélation.
    • La valeur moyenne d'une variable est indiquée par une lettre surmontée d'une barre horizontale. Par exemple, dans le cas des variables "x" et "y", leurs valeurs moyennes sont notées comme suit : x̅ et y̅. La moyenne est parfois désignée par la lettre grecque "μ" (mu). Pour écrire la moyenne arithmétique des valeurs de la variable "x", utilisez la notation μX ou (x).
    • Par exemple, étant donné les valeurs suivantes pour la variable "x": 1,2,5,6,9,10. La moyenne arithmétique de ces valeurs est calculée comme suit :
      • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μX=33/6{ displaystyle mu _ {x} = 33/6}
      • μX=5,5{ displaystyle mu _ {x} = 5.5}
  3. 3 Notez l'importance de l'écart type. En statistique, l'écart type caractérise le degré de dispersion des nombres par rapport à leur moyenne. Si l'écart type est faible, les nombres sont proches de la moyenne ; si l'écart type est grand, les nombres sont loin de la moyenne.
    • L'écart type est indiqué par la lettre "s" ou la lettre grecque "σ" (sigma). Ainsi, l'écart type des valeurs de la variable "x" est noté comme suit : sX ouX.
  4. 4 Souvenez-vous du symbole de l'opération de sommation. Le symbole de sommation est l'un des symboles les plus courants en mathématiques et indique la somme des valeurs. Ce symbole est la lettre grecque "Σ" (sigma majuscule).
    • Par exemple, si on donne les valeurs suivantes de la variable "x": 1,2,5,6,9,10, alors Σx signifie :
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Conseils

  • Le coefficient de corrélation est parfois appelé « coefficient de corrélation de Pearson » d'après son développeur Carl Pearson.
  • Dans la plupart des cas, lorsque le coefficient de corrélation est supérieur à 0,8 (positif ou négatif), il existe une forte corrélation ; si le coefficient de corrélation est inférieur à 0,5 (positif ou négatif), une faible corrélation est observée.

Avertissements

  • La corrélation caractérise la relation entre les valeurs de deux variables. Mais rappelez-vous que la corrélation n'a rien à voir avec la causalité. Par exemple, si vous comparez la taille et la pointure des personnes, vous trouverez probablement une forte corrélation positive. En général, plus la personne est grande, plus la pointure est grande. Mais cela ne signifie pas qu'une augmentation de la taille entraîne une augmentation automatique de la pointure de la chaussure, ou que des pieds plus grands conduiront à une croissance plus rapide. Ces quantités sont simplement interdépendantes.