Leçon 6/6

Fluctuation d'echantillonnage

Intervalle de fluctuation et prise de decision : utiliser les statistiques pour tester des hypotheses

La frequence observee dans un echantillon varie d'un echantillon a l'autre : c'est la fluctuation d'echantillonnage. Cette leçon explique comment utiliser cette propriete pour prendre des decisions statistiques.

Qu'est-ce que la fluctuation ?

Definition

La fluctuation d'echantillonnage est le phenomene par lequel la frequence observee f varie d'un echantillon a l'autre, même si la probabilité theorique p reste constante.

Exemple 1 : Illustration de la fluctuation

On lance 100 fois une piece equilibree (p = 0,5). On repete l'experience 5 fois :

Experience	1	2	3	4	5
Nb de Piles	47	52	55	48	51
Frequence f	0,47	0,52	0,55	0,48	0,51

La frequence fluctue entre 0,47 et 0,55, autour de p = 0,5. C'est normal : c'est la fluctuation d'echantillonnage !

Intervalle de fluctuation

Formule (niveau Seconde)

Pour un echantillon de taille n ≥ 25 et une probabilité p avec 0,2 ≤ p ≤ 0,8 :

I = [p - 1/√n ; p + 1/√n]

Dans environ 95% des cas, la frequence observee f appartient a cet intervalle.

Conditions d'application

n ≥ 25 : echantillon suffisamment grand
0,2 ≤ p ≤ 0,8 : probabilité ni trop proche de 0 ni de 1
L'echantillon doit être aleatoire

Exemple 2 : Calculer un intervalle de fluctuation

Une piece est equilibree (p = 0,5). On la lance n = 100 fois. Determiner l'intervalle de fluctuation.

p = 0,5 et n = 100

√n = √100 = 10, donc 1/√n = 0,1

I = [0,5 - 0,1 ; 0,5 + 0,1] = [0,4 ; 0,6]

Dans 95% des cas, la frequence de "Pile" sera entre 40% et 60%.

Exemple 3 : Intervalle avec n = 400

Un candidat est credite de 35% d'intentions de vote (p = 0,35). Un sondage est realise aupres de n = 400 personnes.

p = 0,35 et n = 400

√n = √400 = 20, donc 1/√n = 0,05

I = [0,35 - 0,05 ; 0,35 + 0,05] = [0,30 ; 0,40]

Dans 95% des cas, le sondage donnera entre 30% et 40% pour ce candidat.

Prise de decision

Principe

L'intervalle de fluctuation permet de tester une hypothese. On compare la frequence observee f a l'intervalle I calcule sous l'hypothese.

f ∈ I

La frequence est compatible avec l'hypothese. Pas de raison de la rejeter.

f ∉ I

La frequence est anormalement eloignee. L'hypothese peut être remise en question.

Exemple 4 : Le de est-il truque ?

On lance un de 100 fois et on obtient 22 fois le chiffre 6. Le de est-il truque ?

Resolution :

Hypothese : Le de est equilibre → p = 1/6 ≈ 0,167

Intervalle de fluctuation :

n = 100, 1/√n = 0,1

I = [0,167 - 0,1 ; 0,167 + 0,1] = [0,067 ; 0,267]

Frequence observee :

f = 22/100 = 0,22

Conclusion : f = 0,22 ∈ [0,067 ; 0,267]

La frequence est dans l'intervalle. Pas de raison de penser que le de est truque.

Exemple 5 : Contrôle qualité

Une machine produit habituellement 5% de pieces defectueuses (p = 0,05). Sur 400 pieces controlees, on en trouve 32 defectueuses. La machine est-elle dereglée ?

Hypothese : Machine bien reglee → p = 0,05

Note : p = 0,05 < 0,2, on est a la limite des conditions. Resultat approximatif.

Intervalle :

n = 400, 1/√n = 1/20 = 0,05

I = [0,05 - 0,05 ; 0,05 + 0,05] = [0 ; 0,10]

Frequence observee :

f = 32/400 = 0,08 = 8%

Conclusion : f = 0,08 ∈ [0 ; 0,10]

8% reste dans l'intervalle acceptable. Pas de dereglage evident.

Exemple 6 : Efficacite d'un medicament

Un medicament est sense guerir 70% des patients (p = 0,70). Sur 100 patients traites, seulement 58 sont gueris. Le medicament est-il moins efficace qu'annonce ?

Hypothese : Efficacite = 70% → p = 0,70

Intervalle :

n = 100, 1/√n = 0,1

I = [0,70 - 0,1 ; 0,70 + 0,1] = [0,60 ; 0,80]

Frequence observee :

f = 58/100 = 0,58

Conclusion : f = 0,58 ∉ [0,60 ; 0,80]

La frequence est en dehors de l'intervalle. L'efficacite annoncee de 70% peut être remise en question.

Attention

• Si f ∉ I, on ne peut pas affirmer que l'hypothese est fausse, seulement qu'elle est peu probable (risque de 5%)
• Si f ∈ I, cela ne prouve pas que l'hypothese est vraie, mais qu'elle est compatible avec les observations

Points cles a retenir

Fluctuation : la frequence varie d'un echantillon a l'autre
Intervalle : I = [p - 1/√n ; p + 1/√n] (si n ≥ 25 et 0,2 ≤ p ≤ 0,8)
f ∈ I : hypothese compatible (pas de raison de rejeter)
f ∉ I : hypothese remise en question
Dans 95% des cas, la frequence est dans l'intervalle

Leçon precedente Fin du chapitre - Sommaire