Moyenne, médiane, classe modale et dispersion d'une série statistique
Une étude statistique comprend en général les étapes suivantes :
1. on précise les questions auxquelles on veut répondre ;
2. on procède à une enquête, on collecte les données ;
3. on présente ces données dans un tableau ;
4. on représente cette série statistique à l'aide d'un diagramme ;
5. intervient enfin le mathématicien qui procède au calcul de paramètres permettant de caractériser toute la série statistique à l'aide de quelques nombres.
1. on précise les questions auxquelles on veut répondre ;
2. on procède à une enquête, on collecte les données ;
3. on présente ces données dans un tableau ;
4. on représente cette série statistique à l'aide d'un diagramme ;
5. intervient enfin le mathématicien qui procède au calcul de paramètres permettant de caractériser toute la série statistique à l'aide de quelques nombres.
1. Comment établir le tableau d'une série statistique ?
• En statistique, on appelle population l'ensemble sur lequel on travaille.
Dans cette population, on étudie un caractère que l'on appelle variable statistique. On étudie principalement des variables quantitatives, c'est-à-dire des variables qui prennent des valeurs numériques.
Dans cette population, on étudie un caractère que l'on appelle variable statistique. On étudie principalement des variables quantitatives, c'est-à-dire des variables qui prennent des valeurs numériques.
• La variable quantitative peut être :
– soit discrète, quand elle prend un nombre fini de valeurs ;
– soit continue, quand elle prend toute valeur comprise entre deux nombres donnés.
– soit discrète, quand elle prend un nombre fini de valeurs ;
– soit continue, quand elle prend toute valeur comprise entre deux nombres donnés.
Quand la variable statistique X est discrète, on compte, pour chaque valeur de X, le nombre d'individus prenant cette valeur ; c'est l'effectif de la valeur. On aboutit à un tableau du type :
Valeur de X | ... | |||
Effectif | ... |
Quand la variable statistique X est continue, on regroupe les valeurs en classes.
Les classes sont des intervalles semi-ouverts
. Leur amplitude est le nombre :
et leurcentre, le nombre :
.
Pour chaque classe, on compte le nombre d'individus qui prennent une valeur supérieure ou égale à
et inférieure à
: c'est l'effectif de la classe. On aboutit à un tableau du type :
Les classes sont des intervalles semi-ouverts
Pour chaque classe, on compte le nombre d'individus qui prennent une valeur supérieure ou égale à
Valeur de X | ... | |||
Effectif | ... |
Remarques
• Quand le nombre de valeurs prises par la variable statistique est trop grand, on traite la variable discrète comme une variable continue.
• Quand on regroupe les valeurs par classes, on essaye d'avoir des classes de même amplitude et pas trop nombreuses. Mais, souvent, les valeurs extrêmes posent problème, c'est pourquoi les premières ou dernières classes sont soit ouvertes, soit d'amplitude différente des autres classes.
Exercice n°1
Exercice n°1
2. Comment représenter une série statistique ?
• Pour représenter une variable statistique discrète, on utilise un diagramme en bâtons (chaque bâton a une hauteur proportionnelle à l'effectif et/ou à la fréquence) ou un diagramme circulaire (chaque secteur est proportionnel à l'effectif et/ou à la fréquence).
Par exemple, la répartition sociologique de 60 étudiants est la suivante : 8 ouvriers ; 23 cadres ; 15 professions libérales ; 11 enseignants et 3 autres.
Pour représenter cette série par un diagramme circulaire, on calcule pour chaque secteur l'angle au centre. Pour le secteur « ouvriers », l'angle au centre est de
, soit 48°.
On procède de même pour les autres secteurs et on obtient le diagramme suivant :
Par exemple, la répartition sociologique de 60 étudiants est la suivante : 8 ouvriers ; 23 cadres ; 15 professions libérales ; 11 enseignants et 3 autres.
Pour représenter cette série par un diagramme circulaire, on calcule pour chaque secteur l'angle au centre. Pour le secteur « ouvriers », l'angle au centre est de
On procède de même pour les autres secteurs et on obtient le diagramme suivant :
• Pour représenter une variable statistique continue, on trace un histogramme. L'histogramme est constitué de rectangles juxtaposés dont la surface est proportionnelle à l'effectif de la classe correspondante.
Si les classes ont des amplitudes égales, la hauteur des rectangles est proportionnelle à l'effectif. Si les classes ont des amplitudes inégales, on représente la classe ayant la plus petite amplitude ; puis on compense une amplitude k fois plus grande par une hauteur k fois plus petite.
Exercice n°2Exercice n°3
Si les classes ont des amplitudes égales, la hauteur des rectangles est proportionnelle à l'effectif. Si les classes ont des amplitudes inégales, on représente la classe ayant la plus petite amplitude ; puis on compense une amplitude k fois plus grande par une hauteur k fois plus petite.
Exercice n°2Exercice n°3
3. Comment calculer une moyenne ?
• Quand la série statistique est discrète, de taille n, on peut la représenter sous forme d'un tableau du type :
Valeur de X | ... | ||||
Effectif | ... |
où
On appelle moyenne de X le nombre :
• Quand la série statistique est continue, de taille n, on a un tableau du type :
Valeur de X | ... | ||||
Effectif | ... |
Pour calculer la moyenne d'une telle série, on utilise la formule précédente en remplaçant
La moyenne de X est alors le nombre :
Exercice n°4Exercice n°5
4. Comment utiliser les propriétés de la moyenne ?
Lorsque l'on modifie les valeurs d'une série statistique par des opérations simples, il n'est pas toujours nécessaire de recommencer le calcul de la moyenne.On utilise les propriétés suivantes :
– si
– si k est un réel quelconque et
– si λest un réel quelconque et
Exercice n°6
5. Comment calculer une médiane ?
• La médiane est le nombre qui sépare la série ordonnée en valeurs croissantes en deux groupes de même effectif.
Pour la trouver, on écrit la liste de toutes les valeurs de la série par ordre croissant, chacune d'elles étant répétée autant de fois que son effectif.
On distingue ensuite deux cas :
– si l'effectif total n est un nombre impair, la médiane est le terme de rang
– si l'effectif total n est un nombre pair, la médiane est le centre de l'intervalle formé par les termes de rang
et 
Pour la trouver, on écrit la liste de toutes les valeurs de la série par ordre croissant, chacune d'elles étant répétée autant de fois que son effectif.
On distingue ensuite deux cas :
– si l'effectif total n est un nombre impair, la médiane est le terme de rang
– si l'effectif total n est un nombre pair, la médiane est le centre de l'intervalle formé par les termes de rang
• Quand la série est regroupée par classes, on détermine la médiane graphiquement à partir du polygone des effectifs ou des fréquences cumulés.
On calcule pour chaque classe
l'effectif cumulé croissant
, c'est-à-dire le nombre d'individus qui prennent une valeur inférieure à
. On place ensuite dans un repère les points
, on obtient ainsi le polygone des effectifs cumulés croissants.
La médiane est l'abscisse du point dont l'ordonnée est
.
Exercice n°7
On calcule pour chaque classe
La médiane est l'abscisse du point dont l'ordonnée est
Exercice n°7
6. Quels autres paramètres peut-on calculer ?
Les mathématiciens disent parfois qu'il existe autant de paramètres statistiques que de statisticiens. Sans aller jusque-là, on peut donner ou calculer, outre la moyenne et la médiane, les paramètres suivants :– les valeurs extrêmes, c'est-à-dire la plus grande valeur
– l'étendue, c'est-à-dire la différence entre la plus grande et la plus petite valeur prises par la variable, soit
– le mode (ou la classe modale), c'est-à-dire la valeur (ou la classe) ayant le plus grand effectif ;
– le premier quartile Q1, qui est la valeur de la variable au-dessous de laquelle on trouve le quart de l'effectif. Si la série est discrète, c'est la valeur de la variable dont le rang est égal ou immédiatement supérieur au quart de l'effectif. Si la série est continue, on lit la valeur correspondant à 25 % de l'effectif sur le polygone des fréquences ou des effectifs cumulés. On peut calculer une valeur plus précise par interpolation linéaire.
– le troisième quartile Q3, qui est la valeur de la variable au-dessous de laquelle on trouve les trois-quarts de l'effectif. Si la variable est discrète, c'est la valeur de la variable dont le rang est égal ou immédiatement supérieur aux trois-quarts de l'effectif. Si la série est continue, on lit la valeur correspondant à 75 % de l'effectif sur le polygone des fréquences ou des effectifs cumulés. On peut aussi calculer une valeur plus précise par interpolation linéaire.
– l'intervalle interquartile, qui est égal à la différence Q3 − Q1.
Exemple :
Le tableau indique la répartition des logements d'une ville en fonction du nombre de pièces.
Nombre de pièces xi | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
Pourcentages ni | 10 | 15 | 20 | 30 | 12 | 8 | 5 |
Pourcentages cumulés croissants | 10 | 10 + 15 = 25 | 25 + 20 = 45 | 45 + 30 = 75 | 87 | 95 | 100 |
Pourcentages cumulés décroissants | 100 | 100 − 10 = 90 | 90 − 15 = 75 | 75 − 20 = 55 | 25 | 13 | 5 |
Mode = 4.
Médiane = 3,5.
Q1 = 2 car 25 % des logements ont deux pièces ou moins.
Q3 = 4 car 75 % des logements ont quatre pièces ou moins, c'est à dire que 25 % ont cinq pièces ou plus.
Remarque
Un paramètre quel qu'il soit n'a guère de sens en lui-même. Les enseignements que l'on peut tirer d'une série statistique proviennent plus souvent de la comparaison des paramètres entre eux.Exercice n°8Exercice n°9Exercice n°10
À retenir
• La moyenne de X est le nombre :
.
• La médiane est le nombre qui sépare la série en deux groupes de même effectif.
• Au-dessous du premier quartile on trouve le quart de l'effectif, au-dessous du troisième quartile on trouve les trois-quarts de l'effectif.
source : http://www.assistancescolaire.com/eleve/2nde/maths/reviser-le-cours/moyenne-mediane-classe-modale-et-dispersion-d-une-serie-statistique-2_m101
Commentaires