← Open Hémicycle

Méthodologie

Une méthodologie opaque transforme un observatoire en tract. Voici comment nous calculons chaque indicateur, ses limites et son périmètre. Tout est reproductible à partir des données publiques et du code source.

Statut : v0 (amorçage) — formules de travail, susceptibles d'évoluer.

1. Principes de calcul

  • Tout indicateur est reproductible à partir des données sources publiques et du code du dépôt.
  • Aucun indicateur n'est un jugement. On mesure des écarts, des fréquences, des participations — jamais une « qualité » ou une « moralité ».
  • Tout indicateur affiche son périmètre (quels scrutins, quelle période, quelles exclusions) et son incertitude.
  • Le contexte (fonction, délégation de vote, entrée tardive en mandat…) est une donnée de premier rang, pas une note de bas de page.

2. Activité parlementaire détectée (heatmap)

Une agrégation par jour et par député·e des actes parlementaires détectables dans l'open data. Ce n'est pas une présence physique.

Score journalier (poids v0) : 1·votes + 2·amendements + 1·questions + 3·interventions + 2·présences en commission. La couleur de chaque case (niveau 0–4, façon GitHub) provient de seuils par quantiles recalculés sur l'ensemble des député·es — pas de seuils arbitraires figés —, ce qui rend les fiches comparables entre elles.

En v1, seuls les votes sont comptés ; amendements, questions et interventions enrichiront le score à mesure de leur ingestion.

Limites affichées : les votes à main levée (majorité des votes) ne sont pas dans l'open data → sous-comptage. Ministres, président·es de commission et membres du Bureau ont des profils atypiques. L'absence de case ≠ absence de travail (circonscription, réunions de groupe non documentées).

3. Participation aux votes

Trois taux distincts, destinés à être affichés ensemble (jamais un seul isolé) : scrutins solennels, scrutins liés à la commission du·de la député·e, et tous les scrutins publics en séance.

Pour chaque taux : votes exprimés / scrutins du périmètre, avec distinction explicite pour / contre / abstention / non-votant.

Un non-vote n'est jamais assimilé à une opposition. Un·e député·e peut être présent·e sans prendre part à un scrutin donné, et aucun relevé officiel de présence physique n'existe.

4. Classification thématique

Les scrutins sont regroupés par thème pour permettre de suivre un sujet de bout en bout. Le rattachement se fait au niveau du dossier législatif (un scrutin hérite du thème de son dossier), à partir du lien officiel scrutin → dossier publié par l'Assemblée nationale.

La classification est manuelle et suit une règle conservatrice : un dossier n'entre dans un thème que si son titre officiel (verbatim AN) concerne sans ambiguïté le cœur du thème. En cas de doute, on n'inclut pas. Un dossier peut n'appartenir à aucun thème.

Le mapping complet (thème → dossiers, avec leur titre officiel) est versionné et auditable dans le dépôt (packages/etl/src/data/themes.ts) ; toute modification passe par une revue. Phase pilote : deux thèmes seulement (« Budget & finances publiques », « Sécurité & immigration »), la liste s'étoffera progressivement.

Un thème est un simple regroupement neutre, pas un jugement. Le périmètre est volontairement restreint et symétrique : aucun sujet n'est mis en avant ni minoré, et le détail des dossiers retenus reste public.

5. Indice de cohérence (à venir)

L'indice de cohérence mesure l'écart entre des positions affichées et des votes effectifs sur un thème donné. Il ne mesure pas l'honnêteté ; il mesure une distance entre un dire et un faire, tous deux sourcés et datés.

Cette composante ne sera publiée qu'après validation manuelle d'un échantillon et mise en place du droit de réponse. Règles de publication : jamais d'agrégat en un seul « score d'honnêteté » ; toujours au niveau d'un thème, avec les scrutins cliquables, le contexte, un lien pour signaler une erreur, et une grille symétrique entre tous les groupes (aucun tri « top des incohérents » par défaut).

6. Incertitude et corrections

Chaque indicateur affiche sa taille d'échantillon et sa période. Les données AN peuvent contenir des erreurs ; toute correction signalée et vérifiée est tracée publiquement. Pour signaler une erreur, voir la page Signaler une erreur.

7. Ce que nous ne calculerons pas

  • Un « classement des pires députés ».
  • Un score de moralité, d'intelligence ou de mérite.
  • Toute métrique qui assimile absence = opposition, ou activité = qualité.

Méthodologie complète et versionnée : docs/METHODOLOGY.md ↗