Présentation
La commande publique est un terme utilisé pour désigner les activités d’achat des gouvernements en biens, services et travaux publics. La commande publique représente une part importante des budgets gouvernementaux. Selon l’OECP (Observatoire économique de la commande publique), les contrats de commande publique représenteraient environ 200 milliards d’euros par an en France, soit 10% du PIB. Cependant, en tant que l’un des domaines les plus importants où l’État et le secteur privé interagissent de manière extensive, les processus de commande publique sont susceptibles d’être utilisés pour d’autres intérêts que l’intérêt public. Ainsi, les processus de commande publique peuvent impliquer des transferts corrompus entre les responsables de l’État et les entreprises du secteur privé, pour des raisons allant des intérêts personnels au financement de partis politiques. Comme l’a souligné un rapport du Fonds monétaire international (FMI) en 2005, « la corruption dans la commande publique est le type de corruption le plus grave ». La Banque mondiale estime que près de 1,5 billion de dollars de contrats publics sont influencés par la corruption, et le volume des pots-de-vin échangés dans le cadre de la commande publique du secteur public est d’environ 200 milliards de dollars par an.
Dans son « Recueil de bonnes pratiques : sur l’utilisation des données ouvertes pour la lutte contre la corruption » (2017), l’Organisation de coopération et de développement économiques (OCDE) affirme que « Les données ouvertes peuvent contribuer à accroître les performances du gouvernement en permettant aux décideurs de concevoir de meilleures politiques de lutte contre la corruption et de suivre leur mise en œuvre efficace. Non seulement les données ouvertes permettent de fournir des incitations pour éviter les actes illégaux en augmentant les chances de révéler les fautes gouvernementales, mais elles peuvent aussi aider à découvrir et à démanteler des activités corrompues en facilitant la fourniture d’informations essentielles, d’outils et de mécanismes pour l’application judiciaire, ainsi que pour les médias et la société afin de détecter l’abus du pouvoir confié à des fins privées ».
Cette approche s’inscrit en parallèle du développement réglementaire. Ainsi, les nouvelles règles de commande publique adoptées conformément à la directive européenne (transcrite en droit français) – Directive 2014/24/UE et directive 2014/25 (secteur des services), directive 2014/23 (contrats de concessions) – énoncent explicitement que : « la traçabilité et la transparence de la prise de décision dans les procédures de commande publique sont essentielles pour garantir des procédures saines, y compris en luttant efficacement contre la corruption et la fraude. […]. Les éléments essentiels et les décisions individuelles des procédures de commande doivent être consignés dans un rapport de commande. […] Les systèmes électroniques de publication de ces avis, gérés par la Commission, devraient également être améliorés afin de faciliter la saisie des données tout en facilitant l’extraction de rapports globaux et l’échange de données entre les systèmes ».
C’est dans cet esprit que la France a annoncé sa volonté de soutenir la mise en œuvre de la norme de données de contrat ouvertes (Open Contracting Data Standard) lors du Sommet Anti-Corruption du G20 de Londres en mai 2016. La mise en œuvre de la norme de données ouvertes pour la commande publique (développée par l’Open Contracting Partnership, avec le soutien de DeCoMaP, cf. Annexe) vise à promouvoir la transparence du secteur public et à lutter contre la corruption et le népotisme dans les processus de commande publique en adoptant une approche ouverte par défaut pendant tout le processus de passation des marchés publics.
DeCoMaP se situe à l’intersection de ces trois considérations : les développements réglementaires, les données ouvertes et les outils automatiques de détection de fraude et d’analyse économique. Étant donné que les données de la commande publique sont essentiellement de nature relationnelle, nous utiliserons de manière significative l’apprentissage automatique (machine learning) et des approches basées sur les graphes pour modéliser et automatiser la détection de fraudes. Tant par son domaine d’étude (la France) que par sa méthodologie et son approche pluridisciplinaire, DeCoMaP est totalement innovant.
La conception d’outils automatiques de détection de fraudes dans la commande publique n’est pas nouvelle et est en cours depuis plusieurs années (voir Section b1). Cependant, aucun outil automatique de détection de fraudes n’a été adapté au cadre juridique français de la commande publique et à ses données. De plus, les méthodes de détection appliquées présentent trois limitations majeures. Premièrement, aucune véritable vérité terrain n’a été définie jusqu’à présent. Pourtant, cela est nécessaire pour évaluer objectivement les performances des outils automatiques de détection de fraudes. Deuxièmement, ces méthodes reposent principalement sur des outils de régression standard et ne tirent pas parti des développements récents dans le domaine de l’apprentissage automatique. Troisièmement, elles se concentrent sur des données individuelles caractérisant indépendamment les clients et les fournisseurs, et ignorent donc les informations relationnelles dérivées de leurs interrelations. Par conséquent, les outils existants doivent être améliorés pour prendre en compte les interactions entre les acteurs concernés. Ce projet vise à résoudre ces problèmes et est divisé en trois phases.