Echantillonnage et estimation
Niveau Terminale - Estimer et decider a partir d'un echantillon
Introduction
L'echantillonnage et l'estimation sont au coeur de la statistique inferentielle. Comment tirer des conclusions sur une population entiere a partir d'un simple echantillon ? Les intervalles de fluctuation et de confiance repondent a cette question fondamentale, utilisee quotidiennement dans les sondages, la recherche medicale, le controle qualite et l'intelligence artificielle.
Attention : ne pas confondre !
Intervalle de fluctuation
On connait p, on observe f.
Question : "f est-il compatible avec p ?"
Centre sur p (connu)
Intervalle de confiance
On observe f, on cherche p.
Question : "ou se trouve p ?"
Centre sur f (observe)
Echantillon aleatoire
- 1Echantillon de taille n : selection au hasard de n individus dans une population
- 2Frequence observee f dans l'echantillon : f = nombre de succes / n
- 3f est une estimation de la proportion p dans la population
- 4Plus n est grand, plus f est une estimation fiable de p (loi des grands nombres)
Intervalle de fluctuation
- 1Intervalle dans lequel la frequence observee f a 95% de chances de se trouver
- 2Au niveau Seconde : I = [p − 1/√n ; p + 1/√n] (formule simplifiee)
- 3Au niveau Terminale : I = [p − 1.96√(p(1−p)/n) ; p + 1.96√(p(1−p)/n)]
- 4Utilite : tester si un echantillon est conforme a une hypothese sur p
Intervalle de confiance
- 1On observe f dans un echantillon et on veut estimer p (inconnu)
- 2Intervalle de confiance a 95% : IC = [f − 1/√n ; f + 1/√n]
- 3Formule precise : IC = [f − 1.96√(f(1−f)/n) ; f + 1.96√(f(1−f)/n)]
- 4On dit : "p appartient a IC avec un niveau de confiance de 95%"
Estimation ponctuelle
- 1Estimation de la moyenne μ par la moyenne de l'echantillon x̄
- 2Estimation de la proportion p par la frequence observee f
- 3Estimation de la variance σ² par la variance corrigee s² = (n/(n−1)) × V
- 4Plus l'echantillon est grand, plus l'estimation est precise
Prise de decision
- 1Test d'hypothese : on suppose H₀ "p = p₀" et on observe f
- 2Si f ∉ intervalle de fluctuation, on rejette H₀ au seuil de 5%
- 3Si f ∈ intervalle de fluctuation, on ne rejette pas H₀ (on ne peut pas conclure)
- 4Risque de premiere espece : rejeter H₀ a tort (probabilite α = 5%)
Formules cles a retenir
Fluctuation (Seconde)
[p − 1/√n ; p + 1/√n]
Fluctuation (Term.)
p ± 1.96√(pq/n)
Confiance
f ± 1/√n
Taille echantillon
n ≥ (1.96/m)² × p(1−p)
Astuces pour le Bac
- Retiens la formule simplifiee 1/\u221An pour l'amplitude : avec n = 100, la marge est de 0.1 (10%).
- Pour quadrupler la precision, il faut multiplier la taille de l'echantillon par 16 (car \u221A16 = 4).
- Attention au vocabulaire : "on ne rejette pas H\u2080" ne signifie PAS "on accepte H\u2080" !
- En sondage, la marge d'erreur annoncee correspond a l'intervalle de confiance a 95%.
Exercices d'entrainement
Exercice 1
Une usine affirme que 95% de sa production est conforme. Sur un echantillon de 200 pieces, on observe 184 conformes (f = 0.92). Peut-on remettre en question l'affirmation de l'usine au seuil de 5% ?
Conseil : Calcule l'intervalle de fluctuation avec p₀ = 0.95 et n = 200. Verifie si f = 0.92 appartient a cet intervalle. Conclusion : si f est hors de l'intervalle, on rejette l'affirmation.
Exercice 2
Un sondage aupres de 1000 personnes donne 54% d'intentions de vote pour un candidat. Construire un intervalle de confiance a 95%. Peut-on affirmer que le candidat sera elu ?
Conseil : IC = [0.54 − 1/√1000 ; 0.54 + 1/√1000] ≈ [0.508 ; 0.572]. Comme tout l'intervalle est au-dessus de 0.50, on peut conclure avec 95% de confiance.
