Retour
DOCUMENTATION

Méthodologie

Comment fonctionne notre modèle de simulation électorale.

L'idée générale

Le programme simule une élection présidentielle en deux temps :

  • Premier tour : on simule jour après jour l’évolution des intentions de vote des candidats, avec une part de hasard (comme des « petits événements » quotidiens).
  • Second tour : à la fin, on regarde qui sont les deux premiers, puis on simule comment les électeurs des autres candidats se reportent, en tenant compte de la proximité idéologique, de l’abstention, et d’un possible vote barrage (refus d’un candidat jugé extrême).

L’ensemble repose sur une méthode Monte Carlo : on répète la simulation des centaines de fois pour obtenir non seulement une courbe moyenne, mais aussi des bandes d’incertitude.

A) La dynamique de base (premier tour)

Chaque candidat a une courbe d’intentions de vote qui bouge chaque jour. On part d’une situation initiale (les parts v0).

Chaque jour, il y a :

  • Un choc « idéologique » commun (3 dimensions dans ν) qui impacte les candidats selon leur position dans l’espace politique (matrice W).
  • Un bruit propre à chaque candidat (événements, bourdes, actualités).

En plus, le modèle introduit une petite tendance négative (drift) sur certains candidats : ils perdent légèrement chaque jour, et ces voix sont redistribuées en partie vers les autres candidats proches d’eux.

Vi(t+1) = Vi(t) + drifti + W⋅ν(t) + εi(t)

drifti = (tendancei − 0.5) × 0.0003

ν(t) ~ N(0, Σ) — choc commun en 3 dimensions

εi(t) ~ N(0, σ2) — bruit propre au candidat

Résultat : même sans vote utile, on obtient des trajectoires plausibles et incertaines des intentions de vote.

B) Le vote utile (premier tour)

Le vote utile n’est pas actif tout le temps : il est activé seulement à la fin de la campagne (derniers jours), via une fonction progressive activation(t).

Quand il s’active, une partie des électeurs des « petits » candidats se déplace vers des candidats :

  • Idéologiquement proches (proximité via cosinus sur la matrice W).
  • Jugés plus viables (ceux qui sont déjà hauts dans les intentions).
  • Éventuellement favorisés/défavorisés structurellement par le paramètre ψ.

L’effet est « doux » : ce n’est pas un transfert brutal. Chaque candidat garde une fraction de ses voix, et l’autre fraction est redistribuée selon une règle probabiliste.

Le vote utile sert à reproduire une dynamique réaliste de « cristallisation » en fin de campagne.

C) Le vote barrage (second tour)

Au second tour, on prend les deux premiers du premier tour : A et B.

Pour chaque électorat (les électeurs du candidat 1, du 2, etc.), le modèle calcule la probabilité de :

Voter pour A
Voter pour B
S'abstenir
Voter blanc/nul

Les électeurs ont tendance à choisir le finaliste le plus proche d’eux dans l’espace idéologique (via cosinus sur W).

Mais le modèle ajoute une chose très importante : une pénalité de rejet si un candidat finaliste est perçu comme « extrême ».

Deux paramètres globaux de barrage

  • γ_ED (barrage extrême droite) : pénalise les candidats selon leur composante droite (Wdroite).
  • γ_EG (barrage extrême gauche) : pénalise les candidats selon leur composante gauche (Wgauche).
  • La pénalité de chaque candidat est calculée automatiquement : ρk = γ_ED × Wk,droite + γ_EG × Wk,gauche.
  • C’est une façon simple et calibrable de représenter le « front républicain » ou au contraire son affaiblissement.

Les paramètres ajustables

Point de départ (v₀)

sondages

Intention de vote initiale, issue des sondages agrégés, débiaisés ou personnalisés. C’est la valeur de départ de la trajectoire.

Tendance (drift)

dynamique

Paramètre entre 0 et 1 représentant la dynamique de long terme. Au-dessus de 0.5, le candidat progresse ; en-dessous, il recule.

Attractivité

volatilité

Mesure la stabilité de l’électorat. Une forte attractivité réduit la dispersion de l’intervalle de confiance : l’électorat est plus fidèle.

Barrage ED / EG (γ)

2nd tour

Deux coefficients globaux qui pénalisent les candidats extrêmes au second tour. γ_ED s’applique proportionnellement à la composante droite, γ_EG à la composante gauche du vecteur idéologique.

Positionnement idéologique (W)

reports

Répartition gauche/centre/droite en 3 dimensions, utilisée pour modéliser les chocs communs, le vote utile et les reports au second tour.

Vote utile (ψ)

1er tour

Facteur structurel favorisant ou défavorisant certains candidats lors de la cristallisation en fin de campagne. Agit en complément de la proximité idéologique.

FORMALISATION

Modèle mathématique

Notations

On considère K candidats. À chaque date t ∈ {1, …, T}, on note vt le vecteur des intentions de vote (parts) vivant sur le simplexe :

vt ∈ ΔK−1    (vt,k ≥ 0,   ∑k vt,k = 1)

On dispose d’un embedding idéologique W ∈ ℜK×B B = 3 (gauche, centre, droite).

On travaille en logits relatifs à une baseline (candidat K) :

ηt ∈ ℜK−1,   η̃t = (ηt, 0)

La transformation softmax convertit les logits en parts : softmax(x)k = exp(xk) / ∑j exp(xj)

La similarité cosinus entre deux vecteurs : cos(a, b) = 〈a, b〉 / (||a|| · ||b||)

Premier tour : dynamique latente

Chocs factoriels et idiosyncratiques

Chaque jour, un facteur idéologique commun affecte tous les candidats selon leur position dans l’espace W :

νt ~ N(0, Qf)   avec Qf = diag(σf,12, …, σf,B2)

εt ~ N(0, D)   avec D = diag(σε,12, …, σε,K2)

ut = W·νt + εt

Drift ciblé et compensation

Un drift δ < 0 est appliqué sur un candidat c* (perte progressive). Les voix perdues sont redistribuées aux candidats proches :

sk = cos(Wc*, Wk),    wk = sk / ∑j≠c* sj

ut,k ← ut,k − δ · wk

Évolution des logits et parts

ηt = (1 − κ) · ηt−1 + ut, 1:(K−1)

κ ≥ 0 : paramètre de mean-reversion (proche de 0 en pratique)

vtbase = softmax(η̃t)

Vote utile : formalisation

Activation temporelle

at = 1 / (1 + exp((T − t − τ0) / sτ))  ∈ (0, 1)

τ0 contrôle le moment d’activation, sτ sa pente.

Rétention et masse mobile

Une fonction logistique détermine la fraction de voix que chaque candidat conserve :

r(v) = 1 / (1 + exp(−(v − τvote) / sv))

mk = (1 − rk) · vt,kbase   (masse mobile)

vkkeep = rk · vt,kbase   (fraction conservée)

Matrice de redistribution

Le score de transfert d’un candidat source j vers une destination k combine proximité idéologique, viabilité et biais structurel :

scorej→k = cos(Wj, Wk)λcos · exp(ψk + βviab · log(vt,kbase + ε))

Aj→k = scorej→k / ∑&ell; scorej→&ell;

Transformation finale

vtVU = vkeep + mT · A   (puis renormalisé)

vtobs = (1 − at) · vtbase + at · vtVU

Second tour : reports, abstention et barrage

Sélection des finalistes

A = argmaxk vT,kobs,    B = argmaxk≠A vT,kobs

Pénalité de rejet (vote barrage)

ρk = γED · Wk,3 + γEG · Wk,1

γED, γEG ≥ 0 contrôlent l’intensité du rejet pour les extrêmes droite/gauche.

Logits à 4 issues par électorat source s

&ell;A(s) = β · cos(Ws, WA)λ − ρA

&ell;B(s) = β · cos(Ws, WB)λ − ρB

&ell;abst(s) = αabst + κabst · ds

&ell;bn(s) = αbn + κbn · ds

où ds = 1 − max(simAs, simBs)

Matrice de transition et agrégation

Ms,· = softmax(&ell;A(s), &ell;B(s), &ell;abst(s), &ell;bn(s))

V(2)ins = (vTobs)T · M  ∈ ℜ4

V(2)expr(A) = V(2)ins(A) / (V(2)ins(A) + V(2)ins(B))

Monte Carlo et probabilités

On répète S simulations indépendantes. À chaque simulation s, on obtient une trajectoire complète puis le duel final.

On estime alors :

  • P(qualification) : P(k ∈ {A, B}) &approx; (1/S) · ∑ 1{k ∈ {A(s), B(s)}}
  • Probabilités de duels : fréquences empiriques des paires (A(s), B(s)).
  • P(victoire) : fréquence empirique du gagnant au second tour.
  • Intervalles de crédibilité : quantiles des distributions simulées (ex. 10%–90% ou 12.5%–87.5%).

Sources des données

Sondage agrégé : Moyenne pondérée des sondages publiés par les principaux instituts (IFOP, Ipsos, Elabe, Harris Interactive, OpinionWay).

Sondage débiaisé : Sondages corrigés des biais historiques de chaque institut (house effects), calibrés sur les résultats réels des élections précédentes.

Personnalisable : Permet à l’utilisateur de définir librement les points de départ.

Limites du modèle

  • Le modèle ne prend pas en compte les événements imprévisibles (scandales, crises, changements d’alliances).
  • Les reports de voix au second tour sont simplifiés via la matrice W et le coefficient ρ, sans modéliser les dynamiques de campagne de l’entre-deux-tours.
  • Les paramètres initiaux sont calibrés sur les sondages actuels, qui peuvent évoluer significativement.
  • Ce simulateur est un outil pédagogique : il n’a pas vocation à prédire le résultat de l’élection.