Echantillonnage
Population, echantillon, frequence : les bases pour etudier un groupe a partir d'un sous-ensemble
En statistiques, il est souvent impossible ou trop couteux d'etudier l'ensemble d'une population. On etudie alors un echantillon representatif pour tirer des conclusions sur la population entiere.
Exemples concrets : Sondages d'opinion, contrôle qualité en usine, etudes medicales, enquetes de satisfaction, previsions electorales...
Vocabulaire de l'echantillonnage
Population
L'ensemble complet des individus ou objets que l'on souhaite etudier. On note souvent N la taille de la population.
Exemple : Tous les élèves de Seconde en France, toutes les pieces fabriquees en une journee.
Echantillon
Un sous-ensemble de la population sur lequel on effectue l'etude. On note n la taille de l'echantillon (n < N).
Exemple : 1000 élèves interroges, 100 pieces controlees.
Caractere etudie
La propriete ou l'attribut que l'on observe sur chaque individu de l'echantillon.
Exemple : Intention de vote, conformite d'une piece, note a un examen.
Exemple 1 : Identifier population et echantillon
Un institut de sondage interroge 1200 Français sur leur intention de vote.
Population : Tous les electeurs français (environ 48 millions)
Echantillon : Les 1200 personnes interrogees
Caractere etudie : L'intention de vote
Taille : n = 1200
Frequence observee
Definition
La frequence observee (ou frequence de l'echantillon) d'un caractere est la proportion d'individus de l'echantillon possedant ce caractere.
f = k / n
ou k est le nombre d'individus ayant le caractere et n la taille de l'echantillon
Exemple 2 : Calcul de frequence
Sur 500 pieces controlees, 15 sont defectueuses. Calculer la frequence de pieces defectueuses.
k = 15 (pieces defectueuses)
n = 500 (pieces controlees)
f = 15/500 = 0,03 = 3%
3% des pieces de l'echantillon sont defectueuses.
Exemple 3 : Sondage electoral
Un sondage aupres de 1000 personnes donne 380 intentions de vote pour le candidat A.
k = 380
n = 1000
f = 380/1000 = 0,38 = 38%
38% des personnes interrogees ont l'intention de voter pour A.
Echantillon representatif
Definition
Un echantillon est representatif s'il reproduit fidelement les caracteristiques de la population. Les conclusions tirees de l'echantillon peuvent alors être generalisees a la population entiere.
Aleatoire
Chaque individu de la population a la même chance d'être selectionne.
Suffisant
La taille n doit être assez grande (generalement n ≥ 30).
Non biaise
La méthode de selection ne favorise aucun groupe particulier.
Exemples d'echantillons biaises
- • Sonder uniquement par telephone fixe (exclut les jeunes)
- • Interroger les gens dans la rue a 10h (exclut les travailleurs)
- • Etudier les avis clients uniquement sur Internet
- • Selectionner les volontaires (auto-selection)
Exemple 4 : Echantillon representatif
Pour etudier les habitudes alimentaires des lyceens, comment constituer un echantillon representatif ?
Bonne méthode :
Tirer au sort 200 lyceens parmi tous les lycees de France (public, prive, general, pro...)
Mauvaise méthode :
Interroger 200 élèves d'un seul lycee parisien (pas representatif de toute la France)
Frequence et probabilité
Loi des grands nombres (intuition)
Plus la taille n de l'echantillon est grande, plus la frequence observee f se rapproche de la probabilité theorique p.
Quand n → +∞, f → p
Exemple 5 : Lancer de piece
On lance une piece equilibree (p = 0,5 pour "Pile").
• 10 lancers : on obtient 7 Piles → f = 0,70 (loin de 0,5)
• 100 lancers : on obtient 53 Piles → f = 0,53 (plus proche)
• 1000 lancers : on obtient 498 Piles → f = 0,498 (tres proche)
• 10000 lancers : on obtient 5012 Piles → f = 0,5012 (≈ 0,5)
Plus n augmente, plus f se stabilise autour de p = 0,5.
Points cles a retenir
- Population : ensemble complet a etudier (taille N)
- Echantillon : sous-ensemble etudie (taille n)
- Frequence : f = k/n (proportion observee)
- Representatif : aleatoire, suffisamment grand, non biaise
- Quand n augmente, f se rapproche de la probabilité p
