2. LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
1. Les principaux paramètres de description
1.1. V A R I A B L E Q U A L I T A T I V E S .
L’ effectif total : C’est le nombre de valeurs dans la série statistique.
L’ effectif d’une valeur donnée: C’est le nombre de fois ou la valeur apparaît pour cette série.
La fréquence d’une valeur donnée:
L’ effectif d’une valeur donnée
L’ effectif total
• Prenons la série: Brest , Brest, Nantes, Rennes, Saint-Malo, Nantes , Brest, Quimper, Quimper
•L’effectif total pour cette série est de 9 puisqu’il y a 9 valeurs (Ici, des villes).
•L’effectif de la valeur Brest est de 3 puisque Brest apparaît 3 fois dans la liste, sa fréquence est de 33,34%.
•Pour la valeur Nantes c’est 2 , puisque Nantes apparaît à 2 reprises, sa fréquence est de 22,23%.
Exemple
3. LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
1. Les principaux paramètres de description
1.2. V A R I A B L E Q U A N T I T A T I V E S .
La moyenne La somme des valeurs d’une variables devisée par la taille de l’échantillon.
ҧ𝑥 =
σ𝑖
𝑛
𝑥𝑖
𝑛
La variance
se définit littéralement comme la moyenne des carrés des
écarts à la moyenne. Elle mesure à quel point un ensemble de
nombres (aléatoires) est étalé de leur valeur moyenne.
𝑖
𝑛
𝑥𝑖 − ҧ𝑥 ²
𝑛
V(x) =
4. 1. Les principaux paramètres de description
1.2. V A R I A B L E Q U A N T I T A T I V E S .
LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
Exemple : Calcule de la moyenne et de la variance.
Durant la première semaine de septembre, le taux de change a varié de la manière suivante:
13,2% 9,56% 12,93% 8,49% 9,32% 14,3% 8,98%
Dans les 3 premiers semestres, l’entreprise LTM Bretagne a réalisé les chiffres d’affaires
suivants ( tableau), sachant qu’elle vise un chiffre d’affaire moyen de 250 000 €, quel est le
chiffre d’affaire quel doit réaliser durant le dernier semestre:
180 000 € 270 000 € 150 000 € ?
6. ҧ𝑥 = 250 000 €On a
ҧ𝑥 =
180 000+270 000+150 000+𝑥
4
Sachant que :
Donc:
250 000 =
180 000+270 000+150 000+𝑥
4
Après résolution de l’équation:
𝒙=400 000 €
LTM Bretagne doit réaliser un chiffre d’affaire de 400 000 € sur le dernier semestre pour avoir un chiffre
d’affaire moyen de 250 000 €
LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
7. L’écart type se déduit du calcul de la variance, en prenant sa racine
carrée. Il permet de calculer la dispersion d'un ensemble de
valeurs par rapport à la moyenne de ces valeurs.
L’écart-type
σ𝑖
𝑛
𝑥𝑖 − ҧ𝑥 2
𝑛
SD =
LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
1. Les principaux paramètres de description
1.2. V A R I A B L E Q U A N T I T A T I V E S .
On a demandé à des individus de donner une note de 0 à 100 pour évaluer une vidéo sur YouTube.
• Si SD = 0
Cela signifie que tous les individus ont donné la même évaluation à la vidéo.
Il n’y a aucune différence entre la note de chaque participant et la moyenne du groupe.
• Si SD = 50*
Cela signifie que la moitié des participants a donné la note de 0 et que l’autre moitié a donné la note de 100
Le SD peut donc être interprété comme une différence de 50 entre la note de chaque participant et la note
moyenne du groupe.
Illustration
* : 50 est la valeur maximale de l’écart-type dans cet exemple.
8. Les données sont peu dispersées autour de la moyenne
Les données sont très dispersées par rapport à la moyenne
LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
1. Les principaux paramètres de description
1.2. V A R I A B L E Q U A N T I T A T I V E S .
Plus l’écart-type est important, plus les données sont dispersées, ce qui signifie que la
moyenne est peu représentative.
Exemple :
Interprétation
de l’écart-type
Exercice 1 | 15 minutes
9. LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
1. Les principaux paramètres de description
Correction de l’exercice 1
A B C D E
30 € 30 € 34 € 767 € 80 €
700 € 52 € 0 € 37 € 82 €
150 € 67 € 762 € 392 € 91 €
50 € 24 € 9 889 € 188 € 95 €
420 € 76 € 989 € 38 € 104 €
1 800 € 20 € 999 331 € 29 € 103 €
x ̅ 525,00 € 44,83 € 168 500,83 € 241,83 € 92,50 €
SD 675,06 € 23,60 € 407 039,71 € 293,27 € 10,17 €
Interprétation
Les données sont
trop dispersée
autour de la
moyenne
Les données sont
faiblement
dispersées autour
de la moyenne
La moyenne est peu représentative de
l’échantillon
La moyenne est peu
représentative de
l’échantillon
11. LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
2. Contingence et corrélation
2. 1 . L e c o e f f i c i e n t d e c o n t i n g e n c e .
Il s’agit d’un coefficient d'association (C) indiquant si deux variables qualitatives sont
indépendantes ou dépendantes l’une de l'autre.
• Il existe une relation parfaite entre les deux variablesC = 1
• Relation très forteC > 0,8
• Relation forte0,5 < C < 0,8
• Relation d’intensité moyenne0,2 < C < 0,5
• Relation faible0 < C < 0,2
• Il n’y a aucune relationC = 0
Ce coefficient est inclus entre 0 et 1, et il permet d’obtenir une estimation approximative du degré d’association.
Interprétation
12. Il existe une relation faible entre le sexe des
employés et leur statut professionnel.
• Niveau d’étude
• Salaire
C=0,56
• Le sexe des employés
• La catégorie professionnelleC=0,12
• Participation en classe
• La note générale
C=0,86
Il existe une forte relation entre le niveau d’étude
et le salaire.
Il existe une relation très forte entre la participation
en classe des étudiants et leurs notes.
LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
2. Contingence et corrélation
2. 1 . L e c o e f f i c i e n t d e c o n t i n g e n c e .
Exemple d’application :
13. LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
2. Contingence et corrélation
2. 1 . L e c o e f f i c i e n t d e c o r r é l a t i o n
• Ce coefficient sert à trouver la relation entre deux variables quantitatives sans pouvoir déduire les relations
causales;
• La corrélation est une technique statistique utilisée pour déterminer le degré auquel deux variables sont
liées.
σ 𝑥−𝑥 𝑦 − ത𝑦
σ 𝑥 − ҧ𝑥 2 ⋅ σ 𝑦 − ത𝑦 2
r =
14. LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
2. Contingence et corrélation
2. 1 . L e c o e f f i c i e n t d e c o r r é l a t i o n
• Le signe (+ ou -) de "r" montre la direction de la relation entre les deux variables.
• La valeur (entre 1 et -1) de "r" indique la force de la relation entre les deux variables.
-1 10-0.25-0.75 0.750.25
Forte Fortemodérée modéréeFaible Faible
Corrélation
parfaite
Aucune
relation
Corrélation
parfaite
L’ i n t e r p ré t a t i o n
15. LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
• Il existe une relation parfaite entre les deux variables|r| = 1
• Forte corrélation|r| > 0,75
• Corrélation d’intensité moyenne0,25 <|r| < 0,75
• Faible corrélation0 < |r| < 0,25
• Il n’y a aucune relation|r| = 0
LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
2. Contingence et corrélation
2. 1 . L e c o e f f i c i e n t d e c o r r é l a t i o n
L’ i n t e r p ré t a t i o n
16. Exemple d’application :
La tableau ci-dessous présente les deux variables suivantes: coût de production (x) & la quantité produite (y)
pour 11 entreprises.
Quantités 180 110 200 120 100 130 150 160 140 170 190
Coût de production (€) 7,5 6,8 7,6 6,9 6,7 7 7,2 7,3 7,1 7,4 7,7
LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
2. Contingence et corrélation
2. 1 . L e c o e f f i c i e n t d e c o r r é l a t i o n
• Commencez par le calcul de la moyenne des deux variables.
• Dans un seul tableau: réaliser les calculs suivants:
• 𝑥 − ҧ𝑥
• 𝑦 − ത𝑦
• 𝑥 * 𝑦
• (𝑥 − ҧ𝑥 )*(𝑦 − ത𝑦)
• (𝑥 − ҧ𝑥 )²
• (𝑦 − ത𝑦)²
• Enfin, calculez le coefficient de corrélation et interpréter le résultat.
Exercice 2 | 15 minutes
17. x y 𝑥 * 𝑦 𝑥 − ҧ𝑥 𝑦 − ത𝑦 ( 𝑥 − ҧ𝑥 )*( 𝑦 − ത𝑦) (𝑥 − ҧ𝑥 )² (𝑦 − ത𝑦)²
A 100 6,7 670 -50 -0,50 25 2500 0,25
B 110 6,8 748 -40 -0,40 16 1600 0,16
C 120 6,9 828 -30 -0,30 9 900 0,09
D 130 7 910 -20 -0,20 4 400 0,04
E 140 7,1 994 -10 -0,10 1 100 0,01
F 150 7,2 1080 0 0,00 0 0 0
G 160 7,3 1168 10 0,10 1 100 0,01
H 170 7,4 1258 20 0,20 4 400 0,04
I 180 7,5 1350 30 0,30 9 900 0,09
J 200 7,6 1520 50 0,40 20 2500 0,16
K 190 7,7 1463 40 0,50 20 1600 0,25
Somme 1650 79,2 11989 0 0,00 109 11000 1,1
Correction :
• r = 0,99
• Le sens de la relation est positif: les deux variables ont tendance à augmenter ou à diminuer ensemble.
• Il existe une relation très forte (quasi-parfaite) entre les deux variables étudiées.
18. D i a g r a m m e d e d i s p e r s i o n :
LES TRAITEMENTS STATISTIQUES DESCRIPTIFS.
2. Contingence et corrélation
2. 1 . L e c o e f f i c i e n t d e c o r r é l a t i o n
• C’est la représentation graphique par des points de la relation entre la variable indépendante (x) et la variable
dépendante (y);
• Il permet de détecter le type de la relation entre les deux variables étudiées.
La structure des données indique le type de relation entre les deux variables:
R E L A T I O N P O S I T I V E R E L A T I O N N É G A T I V E P A S D E R E L A T I O N