Probabilité

Concepts basiques de probabilité
Author

Ludovic Deneuville

1 Formules de base

\[\mathbb{P}(X \leq x) = \mathbb{E}(\mathbb{1}_{X \leq x})\] \[\mathbb{V}(X) = \mathbb{E}((X-\mathbb{E}(X))^2)\]

2 Convergences

  • Convergence presque surement
    • \(X_n \underset{n \to +\infty}{\overset{p.s} \longrightarrow} X \Longleftrightarrow \forall \omega \in \Omega, \lim\limits_{n \rightarrow +\infty} X_n(\omega) = X(\omega)\)
  • Convergence en probabilité
    • \(X_n \underset{n \to +\infty}{\overset{\mathbb{P}} \longrightarrow} X \Longleftrightarrow \forall \epsilon, \lim\limits_{n \rightarrow +\infty} \mathbb{P}(||X_n-X||>\epsilon) = 0\)
  • Convergence dans \(\mathbb{L}^p\)
    • \(X_n \underset{n \to +\infty}{\overset{\mathbb{L}^p} \longrightarrow} X \Longleftrightarrow \lim\limits_{n \rightarrow +\infty} ||X_n-X||_p = 0\)
  • Convergence en Loi
    • \(X_n \underset{n \to +\infty}{\overset{\mathcal{L}} \longrightarrow} X \Longleftrightarrow \lim\limits_{n \rightarrow +\infty} \mathbb{E}(h(X_n)) = \mathbb{E}(h(X)), \forall h\) continue bornée

Implications de convergences :

  • \(p.s \Rightarrow \mathbb{P}\)
  • \(\mathbb{L}^p \Rightarrow \mathbb{P}\)
  • \(\mathbb{P} \Rightarrow \mathcal{L}\)

3 Loi forte des Grands Nombres

3.1 Énoncé

Soit \((X_n)_{n\geq1}\) une suite de variables aléatoires indépendantes et identiquement distribuées (iid) et intégrables à valeurs dans \(\mathbb{R}^d\). Alors :

\[\frac{1}{n} \sum_{i=1}^{n} X_i \underset{n \to +\infty}{\overset{\text{p.s.}}{\longrightarrow}} \mathbb{E}(X_1)\]

Formulation simple : la moyenne empirique tend vers l’espérance.

3.2 Exemple

  • Lançons un dé non truqué 500 fois et calculons la moyenne obtenue aprés chaque lancer
  • Plus le nombre de lancers augmente, plus la moyenne converge vers \(3.5\)
Code
library(ggplot2)

# Simuler les lancers de dés
set.seed(200)
n <- 500
ech <- sample(x = 1:6, size = n, replace = TRUE)
data <- data.frame(x = 1:n, 
                   p = sapply(1:n, 
                              function(i) mean(ech[1:i])))

# Tracer le graphique avec ggplot2
ggplot(data, aes(x = x, y = p)) +
  geom_hline(yintercept = 3.5, 
             color = "orange", 
             linetype = "dashed",
             linewidth = 1.1) +
  geom_line(color = "darkcyan", linewidth = 1.2) +
  labs(title = "Moyenne des lancers de dé",
       x = "Nombre de lancers",
       y = "Moyenne") +
  xlim(0, n) +
  ylim(0, 6)

4 Théorème Central Limite

4.1 Énoncé

Soit \((X_n)_{n\geq1}\) une suite de variables aléatoires iid avec une moyenne \(\mu\) et un écart-type \(\sigma\). Alors :

\[\lim_{n \to +\infty} \sqrt{n} \left( \frac{1}{n}\sum_{i=1}^{n} \frac{ X_i - \mu}{\sigma} \right) \xrightarrow{\mathcal {L}} N(0, 1)\]

Formulation simple : La différence entre moyenne empirique et espérance (\(\overline{X}_n - \mathbb{E}(X)\)) converge en loi vers une loi Normale

4.2 Exemple

  • Tirons un échantillon de 50 valeurs suivant la loi uniforme sur [0,1] et calculons la moyenne
  • Répétons cette opération 5000 fois et affichons la distribution des moyennes empiriques obtenues
Code
library(ggplot2)

# Paramètres
set.seed(200)
nb_sim <- 5000
taille_ech <- 50
u_min <- 0
u_max <- 1
E <- (u_max - u_min) / 2
V <- (u_max - u_min)^2 / 12

# Simulations
res <- numeric(nb_sim)
for (i in 1:nb_sim) {
  ech <- runif(taille_ech, min = u_min, max = u_max)
  res[i] <- sqrt(taille_ech) / sqrt(V) * (mean(ech) - E)
}

# Tracé de l'histogramme et de la densité
ggplot(data.frame(res), aes(x = res)) +
  geom_histogram(binwidth = 0.2, 
                 fill = "darkcyan", 
                 color = "black", 
                 aes(y = after_stat(density))) +
  stat_function(aes(linetype = "N(0,1)"), 
                fun = dnorm, 
                args = list(mean = 0, sd = 1), 
                color = "orange", 
                linewidth = 1.5) +
  labs(title = "Distribution des moyennes empiriques",
       x = "Moyenne des échantillons",
       y = "Densité") +
  scale_linetype_manual(name = "", 
                        values = "dashed",
                        labels = c("N(0,1)")) +
  theme_minimal()

4.3 Vidéo

StatQuest by Joshua Starmer