Doublons d'amendements à l'Assemblée nationale — détection automatique
Beaucoup d'amendements déposés à l'Assemblée nationale sont des copies quasi-identiques d'autres amendements (à quelques mots près). C'est la trace, mesurable et chiffrée, du lobbying parlementaire (un même brief diffusé à plusieurs élus), des amendements identiques groupés en discussion commune, ou de l'obstruction parlementaire (un parti dépose 50 fois le même texte pour ralentir le débat). Sur la 17ᵉ législature, le site a détecté 9 430 clusters d'amendements quasi-identiques, regroupant 28 055 amendements (soit 24.0 % du total). Chaque cluster est automatiquement classé en quatre catégories selon sa composition : dépôt en masse, convergence inter-groupes, amplification intra-groupe, réutilisation simple. (Méthode technique : MinHash + similarité de Jaccard ≥ 0,80, détaillée plus bas.)
Filtre actif : Réutilisation simple —
Doublon ou triplet — souvent la réécriture d'un même modèle, sans signal politique particulier.
Méthode : deux amendements sont jugés « quasi identiques » si leur
indice de similarité de Jaccard est ≥ 0,80 sur des fenêtres de 5 mots, après
normalisation du HTML et des accents ; le regroupement utilise MinHash (64 hash)
+ LSH (16 bandes). Recalculable via la CLI anqp cluster-amendements.
Aucun cluster de type « Réutilisation simple » détecté avec ce filtre. → Voir tous les clusters.