Calculer la somme des carrés (SSE)

Auteur: Charles Brown
Date De Création: 9 Février 2021
Date De Mise À Jour: 1 Juillet 2024
Anonim
La Prévision des Ventes : La méthode des moindres carrés
Vidéo: La Prévision des Ventes : La méthode des moindres carrés

Contenu

La somme des carrés, ou SSE, est un calcul statistique préliminaire qui conduit à des valeurs de données différentes. Lorsque vous disposez d'un ensemble de valeurs de données, il est utile de pouvoir déterminer le degré de corrélation entre ces valeurs. Vous devez organiser vos données dans un tableau puis effectuer des calculs assez simples. Une fois que vous avez trouvé le SSE pour un ensemble de données, vous pouvez ensuite trouver la variance et l'écart type.

Avancer d'un pas

Méthode 1 sur 3: Calculez l'ESS à la main

  1. Créez un tableau à trois colonnes. Le moyen le plus simple de calculer le SSE est de commencer par un tableau à trois colonnes. Nommez les trois colonnes Valeur{ displaystyle { text {Value}}}Remplissez les détails. La première colonne contient les valeurs de vos mesures. Remplissez la colonne Valeur{ displaystyle { text {Value}}}Calculez la moyenne. Avant de pouvoir calculer l'erreur pour chaque mesure, vous devez calculer la moyenne de l'ensemble de données.
    • La moyenne d'un ensemble de données est la somme des valeurs divisée par le nombre de valeurs de l'ensemble. Cela peut être représenté symboliquement, avec la variable μ{ displaystyle mu}Calculez les valeurs d'erreur individuelles. Dans la deuxième colonne de votre tableau, vous devez entrer les valeurs d'erreur pour chaque valeur de données. L'erreur est la différence entre la mesure et la moyenne.
      • Pour l'ensemble de données donné, soustrayez la moyenne, 98,87, de chaque valeur mesurée et remplissez la deuxième colonne avec les résultats. Ces dix calculs vont comme suit:
        • 99,098,87=0,13{ displaystyle 99.0-98.87 = 0.13}Calculez l'ESS. Dans la troisième colonne du tableau, recherchez le carré de chacune des valeurs résultantes dans la colonne du milieu. Ceux-ci représentent les carrés de l'écart par rapport à la moyenne pour chaque valeur de données mesurée.
          • Pour chaque valeur de la colonne du milieu, utilisez une calculatrice pour calculer le carré. Enregistrez les résultats dans la troisième colonne, comme suit:
            • 0,132=0,0169{ displaystyle 0,13 ^ {2} = 0,0169}Additionnez les carrés des erreurs. La dernière étape consiste à trouver la somme des valeurs dans la troisième colonne. Le résultat souhaité est le SSE, ou la somme des carrés des erreurs.
              • Pour cet ensemble de données, l'ESS est calculé en ajoutant les dix valeurs dans la troisième colonne:
              • S.S.E=6,921{ displaystyle SSE = 6,921}Nommez les colonnes de la feuille de calcul. Vous créez un tableau avec trois colonnes dans Excel, avec les trois mêmes en-têtes que ci-dessus.
                • Dans la cellule A1, tapez "Valeur" comme titre.
                • Dans la case B1, tapez «Écart» comme titre.
                • Dans la case C1, tapez «Écart au carré» comme titre.
              • Entrez vos coordonnées. Dans la première colonne, vous devez entrer les valeurs de vos mesures. Si l'ensemble est petit, vous pouvez facilement le saisir à la main. Si vous disposez d'un ensemble de données volumineux, vous devrez peut-être copier et coller les données dans la colonne.
              • Déterminez la moyenne des points de données. Excel a une fonction qui calcule la moyenne pour vous. Dans une cellule vide sous votre tableau de données (peu importe la cellule que vous choisissez), entrez ce qui suit:
                • = Moyenne (A2: ___)
                • N'entrez pas d'espace vide. Remplissez cet espace avec le nom de cellule de votre dernier point de données. Par exemple, si vous avez 100 points de données, vous utiliserez la fonction:
                  • = Moyenne (A2: A101)
                  • Cette fonction contient les données des cellules A2 à A101, car la ligne du haut contient les en-têtes de colonne.
                • Lorsque vous appuyez sur Entrée ou lorsque vous cliquez sur une autre cellule du tableau, la cellule nouvellement programmée est automatiquement remplie avec la moyenne de vos valeurs de données.
              • Entrez la fonction pour les mesures d'erreur. Dans la première cellule vide de la colonne «Écart», entrez une fonction pour calculer la différence entre chaque point de données et la moyenne. Pour ce faire, utilisez le nom de la cellule où se trouve la moyenne. Supposons que vous ayez utilisé la cellule A104 pour le moment.
                • La fonction de calcul d'erreur que vous entrez dans la cellule B2 est:
                  • = A2- $ A $ 104. Les signes dollar sont nécessaires pour vous assurer que vous verrouillez la case A104 pour tout calcul.
              • Entrez la fonction pour les erreurs au carré. Dans la troisième colonne, vous pouvez demander à Excel de calculer le carré souhaité.
                • Dans la cellule C2, entrez la fonction suivante:
                  • = B2 ^ 2
              • Copiez les fonctions pour remplir tout le tableau. Après avoir entré les fonctions dans la cellule supérieure de chaque colonne, respectivement B2 et C2, vous devez remplir le tableau entier. Vous pouvez retaper la fonction dans n'importe quelle ligne du tableau, mais cela prendrait beaucoup trop de temps. À l'aide de votre souris, mettez en surbrillance les cellules B2 et C2 ensemble, et sans relâcher le bouton de la souris, faites glisser vers la cellule inférieure de chaque colonne.
                • En supposant que votre tableau contient 100 points de données, faites glisser votre souris vers les cellules B101 et C101.
                • Lorsque vous relâchez le bouton de la souris, les formules sont copiées dans toutes les cellules du tableau. Le tableau doit être automatiquement rempli avec les valeurs calculées.
              • Trouvez le SSE. La colonne C de votre tableau contient toutes les valeurs d'erreur au carré. La dernière étape consiste à laisser Excel calculer la somme de ces valeurs.
                • Dans une cellule sous le tableau, probablement C102 dans cet exemple, entrez la fonction suivante:
                  • = Somme (C2: C101)
                • Si vous cliquez sur Entrée ou cliquez ailleurs dans une autre cellule du tableau, vous obtiendrez la valeur SSE de vos données.

Méthode 3 sur 3: Relier l'ESS à d'autres statistiques

  1. Calculez l'écart par rapport à l'ESS. La recherche du SSE pour un ensemble de données est généralement un élément de base pour trouver d'autres valeurs plus utiles. Le premier d'entre eux est la variance. La variance est une mesure de l'écart entre les données mesurées et la moyenne. C'est en fait la moyenne des différences au carré par rapport à la moyenne.
    • Puisque l'ESS est la somme des erreurs au carré, vous pouvez trouver la moyenne (c'est la variance) simplement en divisant par le nombre de valeurs. Cependant, si vous calculez la variance d'une série d'échantillons, plutôt que d'une population entière, vous divisez la variance par (n-1) au lieu de par n. Donc:
      • Variance = SSE / n, si vous calculez la variance d'une population entière.
      • Variance = SSE / (n-1), lors du calcul de la variance d'un échantillon de données.
    • Pour le problème d'échantillonnage de la température des patients, on peut supposer que 10 patients ne sont qu'un échantillon. Par conséquent, la variance est calculée comme suit:
      • Variance=SSE(n1){ displaystyle { text {Variance}} = { frac { text {SSE}} {(n-1)}}}Calculez l'écart type de l'ESS. L'écart type est une valeur couramment utilisée qui indique dans quelle mesure les valeurs d'un ensemble de données s'écartent de la moyenne. L'écart type est la racine carrée de la variance. N'oubliez pas que la variance est la moyenne des mesures d'erreur au carré.
        • Par conséquent, après avoir calculé l'ESS, vous pouvez trouver l'écart type comme ceci:
          • Écart-type=SSEn1{ displaystyle { text {Écart type}} = { sqrt { frac { text {SSE}} {n-1}}}}Utilisez SSE pour déterminer la covariance. Cet article s'est concentré sur les ensembles de données qui ne mesurent qu'une seule valeur à la fois. Cependant, dans de nombreuses études, vous pouvez comparer deux valeurs distinctes. Par exemple, vous voulez savoir comment ces deux valeurs sont liées l'une à l'autre, pas seulement à la moyenne de l'ensemble de données. Cette valeur est la covariance.
            • Les calculs de covariance sont trop détaillés pour être décrits ici, sauf pour noter que vous allez utiliser l'ESS pour chaque type de données et ensuite le comparer. Pour une description plus détaillée de la covariance et des calculs impliqués, vous pouvez trouver des articles sur ce sujet sur wikiHow.
            • À titre d'exemple d'utilisation de la covariance, vous pouvez comparer l'âge des patients dans une étude médicale avec l'efficacité d'un médicament pour abaisser la température de la fièvre. Ensuite, vous avez un ensemble de données sur les âges et un deuxième ensemble de données sur les températures. Vous trouverez ensuite l'ESS pour chaque ensemble de données, et à partir de là, la variance, les écarts-types et la covariance.