Méthodologie publique

Comment on calcule, comment on vérifie.

DemoTracker n'invente rien : on agrège des sources publiques. Cette page liste chaque traitement, chaque formule, chaque prompt utilisé.

Sept principes non négociables

Tout est sourcé. Chaque chiffre renvoie à sa source officielle (Assemblée, Sénat, HATVP, Légifrance, RNE, INSEE, JORF).
Méthodologie publique. Chaque calcul, chaque agrégation, chaque prompt LLM est documenté.
Pas de score d'élu. Aucun score global synthétique de personnalité politique.
Pas d'évaluation d'efficacité des lois en propre. On agrège les évaluations existantes (Cour des comptes, France Stratégie).
Code et données ouverts. Licence AGPL-3.0 pour le code, ODbL pour les données dérivées.
Données brutes accessibles. API publique + exports complets téléchargeables.
Sobriété. Pré-calcul en batch, site statique quand possible, pas d'inférence LLM à la volée.

Indicateurs calculés et leur formule

Présence

Formule. (scrutins où l'élu vote pour/contre/abstention) ÷ (total des scrutins de la législature pour la chambre)

Source : votes_individuels × scrutins, filtrés par chambre + législature

Loyauté de groupe

Formule. (scrutins où l'élu vote comme la position majoritaire de son groupe) ÷ (scrutins où l'élu vote pour/contre/abst)

Source : votes_individuels × elu_group_memberships ; position dominante = max(pour/contre/abst) par scrutin × groupe

Radar thématique (8 axes)

Formule. comptage des mots-clés par axe sur les titres des scrutins votés ; normalisation [0..1] par max(axes)

Source : dictionnaire de mots-clés versionné dans pipeline/src/dt_pipeline/enrichers/stats.py — 8 axes : économie, social, écologie, international, justice, éducation, institutions, territoires

Cohésion de groupe (à venir)

Formule. écart-type des positions des membres d'un groupe sur un scrutin

Source : votes_individuels regroupés par groupe et scrutin

LLM — résumés de lois ✦

Tous les résumés signalés ✦ sont produits par un modèle de langage en batch nocturne (jamais à la volée), avec un prompt versionné, et accompagnés de leur source officielle.

Modèle : gpt-oss-120b (Apache 2.0) via OVH AI Endpoints — souveraineté française, AGPL.
Prompts : prompts/loi-resume-court.v1.md (≈ 60-80 mots, 2 phrases) et prompts/loi-resume-moyen.v1.md (≈ 300-450 mots, 4 paragraphes structurés).
Signature : chaque résumé affiche le modèle, la version du prompt, la date de génération.
Mécanisme de signalement : bouton « signaler une erreur » sur chaque carte, contact via /contact.

Sources de données

data.assemblee-nationale.frDéputés, votes individuels, dossiers législatifs, frise navette (JSON officiel mis à jour quotidiennement).AMO10_…, Scrutins, Dossiers_Legislatifs data.senat.fr + www.senat.frSénateurs en activité (JSON open data) et scrutins publics (scraping HTML officiel, l'open data Sénat ne publie pas les scrutins).ODSEN_GENERAL.json + scrutin-public/scrYYYY.html HATVPDéclarations d'intérêts, d'activités et de patrimoine — élus, membres du Gouvernement, conseillers ministériels.hatvp.fr/livraison/opendata/liste.csv RNE (data.gouv.fr)Répertoire National des Élus : eurodéputés, maires, conseillers départementaux, régionaux, communautaires.data.gouv.fr/datasets/repertoire-national-des-elus-1 Datactivist — nuances politiquesEnrichissement du RNE avec la nuance politique déclarée (Intérieur), couvre 95 % des maires.rne-enrichi-couleur-politique.csv Candidats IntérieurListes officielles de candidats par scrutin, transmises par le ministère de l'Intérieur.data.gouv.fr/datasets/?q=candidats

Ce qu'on ne fait jamais

Score global « bonus / malus » d'une personnalité politique.
Étiquette « efficace / inefficace » sur une loi ou une politique publique.
Editorial, opinion, prise de position rédigée.
Comparaison « bon député / mauvais député ».
Algorithme de recommandation politique.
Pronostic électoral, vote utile suggéré, sondage propre.
Collecte de données personnelles non nécessaires.
Publicité, tracking, cookies tiers.
LLM à la volée sans cache (toute inférence est en batch, signalée, versionnée).