Fiches de révision statistiques L1 : statistiques descriptives, probabilités, lois usuelles, échantillonnage, intervalles de confiance, tests d'hypothèses.
L'UE de stats est commune à plusieurs cursus en L1 : éco, psycho, socio, biologie, AES, STAPS. Beaucoup la redoutent à cause des formules — à tort, c'est un programme bien borné en deux blocs. Statistique descriptive : résumer un jeu de données (moyenne, médiane, écart-type, corrélation). Statistique inférentielle : généraliser à une population à partir d'un échantillon (TCL, intervalles de confiance, tests d'hypothèses). Voilà les outils et formules à maîtriser.
Les variables sont qualitatives (nominales : sexe, couleur ; ordinales : niveau d'études) ou quantitatives (discrètes : nombre d'enfants ; continues : taille, poids).
La médiane est plus robuste aux valeurs extrêmes (outliers) que la moyenne. Pour des revenus, on utilise plutôt la médiane.
Quand on étudie deux variables conjointement :
Le coefficient de détermination R² = ρ² indique la part de la variance de Y expliquée par X.
Univers Ω, événements A ⊂ Ω, probabilité P avec 0 ≤ P(A) ≤ 1, P(Ω) = 1, et σ-additivité.
Formules clés :
Formule de Bayes : P(A | B) = P(B | A) · P(A) / P(B). Indispensable pour les problèmes de tests médicaux et de classification.
Une variable aléatoire X est une fonction de Ω vers ℝ. On distingue :
Espérance : E(X) = Σ k · P(X = k) ou ∫ x · f(x)dx Variance : V(X) = E(X²) − E(X)² Linéarité : E(aX + b) = a·E(X) + b ; V(aX + b) = a²·V(X)
| Loi | Domaine | E(X) | V(X) |
|---|---|---|---|
| Bernoulli ℬ(p) | {0, 1} | p | p(1-p) |
| Binomiale 𝒷(n, p) | {0, ..., n} | np | np(1-p) |
| Poisson 𝒫(λ) | ℕ | λ | λ |
| Géométrique 𝒢(p) | ℕ* | 1/p | (1-p)/p² |
| Uniforme 𝒰[a, b] | [a, b] | (a+b)/2 | (b-a)²/12 |
| Exponentielle ℰ(λ) | ℝ⁺ | 1/λ | 1/λ² |
| Normale 𝒩(μ, σ²) | ℝ | μ | σ² |
La loi normale est la reine des statistiques : elle apparait via le théorème central limite (voir 3.2).
À partir d'un échantillon de taille n, on estime des paramètres de la population. Estimateur de la moyenne : X̄ = (1/n)·Σ Xᵢ. Si X est de loi 𝒩(μ, σ²), alors X̄ suit 𝒩(μ, σ²/n).
Pour n grand (en pratique n ≥ 30), si X₁, ..., Xₙ sont i.i.d. d'espérance μ et de variance σ², alors :
(X̄ − μ) / (σ/√n) → 𝒩(0, 1) en loi
Le TCL justifie l'utilisation de la loi normale pour des grands échantillons même si la loi initiale n'est pas normale.
Pour la moyenne, intervalle de confiance à 95 % :
IC₉₅ = [x̄ − 1,96 · σ/√n , x̄ + 1,96 · σ/√n]
Si σ inconnu, on remplace par l'écart-type empirique s et on utilise la loi de Student à (n − 1) degrés de liberté.
Démarche :
Tests classiques :
Erreurs :
Les fautes les plus fréquentes en partiel :
EduFiche transforme tes cours de statistiques (économie, psycho, socio, bio) en fiches synthétiques avec exercices types. L'IA s'adapte au niveau de ton enseignant et à ton programme exact.