Comment calculer le coefficient de corrélation dans Excel (2 manières simples)

Excel est un outil puissant qui possède des fonctions et fonctionnalités étonnantes lorsque vous travaillez avec des statistiques.

Trouver une corrélation entre deux séries de données est l'un des calculs statistiques les plus courants lorsque l'on travaille avec de grands ensembles de données,

Je travaillais en tant qu'analyste financier il y a quelques années, et même si nous n'étions pas très impliqués dans les données statistiques, trouver des corrélations était quelque chose que nous devions encore faire assez souvent.

Dans ce tutoriel, je vais vous montrer deux façons très simples de calculer le coefficient de corrélation dans Excel. Il existe déjà une fonction intégrée pour ce faire, et vous pouvez également utiliser le Data Analysis Toolpak.

Alors, commençons!

Qu'est-ce que le coefficient de corrélation ?

Puisqu'il ne s'agit pas d'une classe de statistiques, permettez-moi d'expliquer brièvement quel est le coefficient de corrélation, puis nous passerons à la section où nous calculons le coefficient de corrélation dans Excel.

Un coefficient de corrélation est une valeur qui vous indique à quel point deux séries de données sont liées.

Un exemple couramment utilisé est le poids et la taille de 10 personnes dans un groupe. Si nous calculons le coefficient de corrélation pour les données de taille et de poids de ces personnes, nous obtiendrons une valeur comprise entre -1 et 1.

Une valeur inférieure à zéro indique une corrélation négative, ce qui signifie que si la taille augmente alors le poids diminue, ou si le poids augmente à alors la taille diminue.

Et une valeur supérieure à zéro indique une corrélation positive, ce qui signifie que si la taille augmente alors le poids augmente, et si la taille diminue alors le poids diminue.

Plus la valeur est proche de 1, plus la corrélation positive est forte. Ainsi, une valeur de 0,8 indiquerait que les données de taille et de poids sont fortement corrélées.

Remarque : Il existe différents types de coefficients de corrélation et de statistiques, mais dans ce didacticiel, nous examinerons le plus courant, à savoir le coefficient de corrélation de Pearson.

Voyons maintenant comment calculer ce coefficient de corrélation dans Excel.

Calcul du coefficient de corrélation dans Excel

Comme je l'ai mentionné, il existe plusieurs façons de calculer le coefficient de corrélation dans Excel.

Utilisation de la formule CORREL

CORREL est une fonction statistique qui a été introduite dans Excel 2007.

Supposons que vous ayez un ensemble de données comme indiqué ci-dessous où vous souhaitez calculer le coefficient de corrélation entre la taille et le poids de 10 personnes.

Voici la formule qui ferait cela :

= CORREL(B2:B12,C2:C12)

La fonction CORREL ci-dessus prend deux arguments - la série avec les points de données de hauteur et la série avec les points de données de poids.

Et c'est tout!

Dès que vous appuyez sur Entrée, Excel effectue tous les calculs dans le back-end, il vous donne un seul numéro de coefficient de corrélation Pearson.

Dans notre exemple, cette valeur est légèrement supérieure à 0,5, ce qui indique qu'il existe une corrélation positive assez forte.

Cette méthode est mieux utilisée si vous avez deux séries et que tout ce que vous voulez, c'est le coefficient de corrélation.

Mais si vous avez plusieurs séries et que vous souhaitez connaître le coefficient de corrélation de toutes ces séries, vous pouvez également envisager d'utiliser le pack d'outils d'analyse de données dans Excel (voir ensuite)

Utilisation de l'outil d'analyse de données

Excel dispose d'un outil d'analyse de données qui peut être utilisé pour calculer rapidement diverses valeurs statistiques (y compris l'obtention du coefficient de corrélation).

Mais le Data Analysis Toolpak est désactivé par défaut dans Excel. La première étape serait donc de réactiver l'outil d'analyse de données, puis de l'utiliser pour calculer le coefficient de corrélation de Pearson dans Excel.

Activation de l'utilitaire d'analyse des données

Vous trouverez ci-dessous les étapes pour activer Data Analysis Toolpak dans Excel :

  1. Cliquez sur l'onglet Fichier
  2. Cliquez sur Options
  3. Dans la boîte de dialogue Options Excel qui s'ouvre, cliquez sur l'option Compléments dans le volet de la barre latérale
  4. Dans la liste déroulante Gérer, sélectionnez Compléments Excel
  5. Cliquez sur Aller. Cela ouvrira la boîte de dialogue des compléments
  6. Cochez l'option Analysis Toolpak
  7. Cliquez sur D'accord

Les étapes ci-dessus ajouteraient un nouveau groupe dans l'onglet Données du ruban Excel appelé Analyse. Au sein de ce groupe, vous auriez l'option Analyse des données

Calcul du coefficient de corrélation à l'aide de Data Analysis Toolpak

Maintenant que l'outil d'analyse est de nouveau disponible dans le ruban, voyons comment calculer le coefficient de corrélation en l'utilisant.

Supposons que vous ayez un ensemble de données comme indiqué ci-dessous et que vous souhaitiez connaître la corrélation entre les trois séries (taille et poids, taille et revenu, et poids et revenu).

Vous trouverez ci-dessous les étapes à suivre :

  1. Cliquez sur l'onglet Données
  2. Dans le groupe Analyse, cliquez sur l'option Analyse des données
  3. Dans la boîte de dialogue Analyse des données qui s'ouvre, cliquez sur « Corrélation »
  4. Cliquez sur OK. Cela ouvrira la boîte de dialogue Corrélation
  5. Pour la plage d'entrée, sélectionnez les trois séries - y compris les en-têtes
  6. Pour « Groupé par », assurez-vous que « Colonnes » est sélectionné
  7. Sélectionnez l'option - « Étiqueter dans la première rangée ». Cela garantira que les données résultantes auront les mêmes en-têtes et qu'il sera beaucoup plus facile de comprendre les résultats
  8. Dans les options de sortie, choisissez où vous voulez la table résultante. Je vais utiliser la cellule G1 sur la même feuille de calcul. Vous pouvez également choisir d'obtenir vos résultats dans une nouvelle feuille de calcul ou un nouveau classeur
  9. Cliquez sur OK

Dès que vous faites cela, Excel calcule le coefficient de corrélation pour toutes les séries et vous donne un tableau comme indiqué ci-dessous :

Notez que la table résultante est statique et ne serait pas mise à jour si l'un des points de données de votre table change. En cas de changement, vous devrez répéter les étapes ci-dessus pour générer un nouveau tableau de coefficients de corrélation.

Ce sont donc deux méthodes rapides et faciles pour calculer le coefficient de corrélation dans Excel.

J'espère que vous avez trouvé ce tutoriel utile!

Vous contribuerez au développement du site, partager la page avec vos amis

wave wave wave wave wave