Echantillonnage et estimation

Niveau Terminale - Estimer et decider a partir d'un echantillon

Introduction

L'echantillonnage et l'estimation sont au coeur de la statistique inferentielle. Comment tirer des conclusions sur une population entiere a partir d'un simple echantillon ? Les intervalles de fluctuation et de confiance repondent a cette question fondamentale, utilisee quotidiennement dans les sondages, la recherche medicale, le controle qualite et l'intelligence artificielle.

Attention : ne pas confondre !

Intervalle de fluctuation

On connait p, on observe f.

Question : "f est-il compatible avec p ?"

Centre sur p (connu)

Intervalle de confiance

On observe f, on cherche p.

Question : "ou se trouve p ?"

Centre sur f (observe)

Echantillon aleatoire

1Echantillon de taille n : selection au hasard de n individus dans une population
2Frequence observee f dans l'echantillon : f = nombre de succes / n
3f est une estimation de la proportion p dans la population
4Plus n est grand, plus f est une estimation fiable de p (loi des grands nombres)

Intervalle de fluctuation

1Intervalle dans lequel la frequence observee f a 95% de chances de se trouver
2Au niveau Seconde : I = [p − 1/√n ; p + 1/√n] (formule simplifiee)
3Au niveau Terminale : I = [p − 1.96√(p(1−p)/n) ; p + 1.96√(p(1−p)/n)]
4Utilite : tester si un echantillon est conforme a une hypothese sur p

Intervalle de confiance

1On observe f dans un echantillon et on veut estimer p (inconnu)
2Intervalle de confiance a 95% : IC = [f − 1/√n ; f + 1/√n]
3Formule precise : IC = [f − 1.96√(f(1−f)/n) ; f + 1.96√(f(1−f)/n)]
4On dit : "p appartient a IC avec un niveau de confiance de 95%"

Estimation ponctuelle

1Estimation de la moyenne μ par la moyenne de l'echantillon x̄
2Estimation de la proportion p par la frequence observee f
3Estimation de la variance σ² par la variance corrigee s² = (n/(n−1)) × V
4Plus l'echantillon est grand, plus l'estimation est precise

Prise de decision

1Test d'hypothese : on suppose H₀ "p = p₀" et on observe f
2Si f ∉ intervalle de fluctuation, on rejette H₀ au seuil de 5%
3Si f ∈ intervalle de fluctuation, on ne rejette pas H₀ (on ne peut pas conclure)
4Risque de premiere espece : rejeter H₀ a tort (probabilite α = 5%)

Formules cles a retenir

Fluctuation (Seconde)

[p − 1/√n ; p + 1/√n]

Fluctuation (Term.)

p ± 1.96√(pq/n)

Confiance

f ± 1/√n

Taille echantillon

n ≥ (1.96/m)² × p(1−p)

Astuces pour le Bac

Retiens la formule simplifiee 1/\u221An pour l'amplitude : avec n = 100, la marge est de 0.1 (10%).
Pour quadrupler la precision, il faut multiplier la taille de l'echantillon par 16 (car \u221A16 = 4).
Attention au vocabulaire : "on ne rejette pas H\u2080" ne signifie PAS "on accepte H\u2080" !
En sondage, la marge d'erreur annoncee correspond a l'intervalle de confiance a 95%.

Exercices d'entrainement

Exercice 1

Une usine affirme que 95% de sa production est conforme. Sur un echantillon de 200 pieces, on observe 184 conformes (f = 0.92). Peut-on remettre en question l'affirmation de l'usine au seuil de 5% ?

Conseil : Calcule l'intervalle de fluctuation avec p₀ = 0.95 et n = 200. Verifie si f = 0.92 appartient a cet intervalle. Conclusion : si f est hors de l'intervalle, on rejette l'affirmation.

Exercice 2

Un sondage aupres de 1000 personnes donne 54% d'intentions de vote pour un candidat. Construire un intervalle de confiance a 95%. Peut-on affirmer que le candidat sera elu ?

Conseil : IC = [0.54 − 1/√1000 ; 0.54 + 1/√1000] ≈ [0.508 ; 0.572]. Comme tout l'intervalle est au-dessus de 0.50, on peut conclure avec 95% de confiance.

Lois continues Tous les chapitres