Mieux vaut un coupable en liberté ? L’éthique derrière le paramètre Beta
Imaginez ce scénario : vous participez à une course de 10 km.
- Vous parcourez les 5 premiers kilomètres à une allure de 12 km/h.
- Épuisé, vous traînez sur les 5 derniers kilomètres à seulement 8 km/h.
Quelle a été votre vitesse moyenne sur l’ensemble de la course ? L’instinct nous souffle immédiatement 10 km/h ((12+8)/2). Et pourtant… c’est faux.
Le piège de la moyenne classique
Si l’on calcule le temps réellement passé sur le bitume :
- Les 5 premiers km prennent 25 minutes.
- Les 5 derniers km prennent 37,5 minutes.
- Temps total = 62,5 minutes.
Votre vitesse réelle est de 9,6 km/h. Pourquoi ? Parce que vous avez passé beaucoup plus de temps à subir vos 8 km/h qu’à profiter de vos 12 km/h. La moyenne arithmétique classique ignore cette réalité temporelle. Pour obtenir le vrai résultat, il faut utiliser la moyenne harmonique.
L’héritage de van Rijsbergen : Quand le F1 entre en scène
En science des données, nous utilisons cette même logique pour évaluer nos modèles via le Score F1. Cette métrique a été popularisée par Cornelis Joost « Keith » van Rijsbergen, un pionnier de la recherche d’information, dans les années 70.
La précision répond à la question : « Parmi tous ceux que le modèle a déclarés positifs, combien le sont réellement ? » et le rappel à la question « Parmi tous ceux qui sont réellement positifs, combien le modèle a-t-il réussi à en capturer ? ». Les deux mesures sont des ratios, des pourcentages.
Keith cherchait une « fonction d’efficacité » capable de combiner la Précision (P) et le Rappel (R). C’est ainsi qu’est née la famille des mesures F, où le chiffre « 1 » signifie que l’on accorde une importance strictement égale aux deux piliers.
Tout comme pour votre course à pied, le Score F1 est « pessimiste » : il est tiré vers le bas par la valeur la plus faible. Si votre modèle a une excellente précision mais un rappel catastrophique, le F1 s’effondrera pour vous avertir que quelque chose ne va pas.
Au-delà du F1 : La puissance du paramètre Beta (β)
Le score F1 est un excellent compromis, mais dans la vraie vie, toutes les erreurs n’ont pas le même poids. C’est là que la formule de van Rijsbergen révèle tout son génie grâce au paramètre β :
Le β est un curseur qui permet de pondérer l’importance du Rappel par rapport à la Précision.
Le dilemme de la Cour d’Assises : L’exemple du F0.5
Prenons un jugement en Cour d’Assises. Deux erreurs sont possibles :
- Le Faux Négatif : On acquitte un coupable. Résultat : 1 coupable est en liberté.
- Le Faux Positif : On condamne un innocent. Résultat : 1 innocent est en prison ET le vrai coupable est toujours en liberté.
Dans notre système judiciaire, on considère qu’il vaut mieux libérer plusieurs coupables que de condamner un seul innocent. L’erreur « Faux Positif » est jugée bien plus grave.
Pour traduire cette éthique, on utilise un β=0,5. En injectant 0,5 dans la formule, on obtient le F0,5. Le poids de la Précision devient alors prédominant : on veut être absolument certain que celui qu’on condamne est coupable, quitte à ce que le Rappel (la capacité à attraper tous les coupables) diminue.
À l’inverse, en diagnostic médical, on utilisera souvent un F2 (β=2) : on préfère déclencher une fausse alerte (privilégier le Rappel) plutôt que de passer à côté d’une maladie grave.
Conclusion : Choisir son curseur, c’est choisir ses valeurs
Le score F1 n’est pas qu’une simple formule mathématique ; c’est le reflet de nos priorités. En abandonnant la moyenne arithmétique pour la moyenne harmonique, nous acceptons une vérité fondamentale : la performance globale d’un système est limitée par son maillon le plus faible.
Mais n’oubliez jamais : le « 1 » du F1 est un choix, pas une obligation. Que vous soyez coureur, médecin ou juge, c’est à vous de régler le paramètre Beta pour aligner votre technologie sur vos valeurs et sur les risques réels de votre mission.











