Le recours à l’Intelligence artificielle pour lutter contre la fraude fiscale
En France, les chiffres relatifs à la fraude fiscale ont de quoi impressionner. Après avoir estimé en janvier 2013, l’évitement illégal de l’impôt entre 60 et 80 milliards d’euros par an, le syndicat national Solidaires finances publiques a estimé en 2017[1], qu’il se situait dans la fourchette haute et qu’il était possible qu’il atteigne jusqu’à 100 milliards d’euros. Cette estimation du premier syndicat représentatif des agents du ministère chargé des impôts joue un grand rôle, car elle est très souvent reprise dans le débat politique et médiatique. Celle-ci, pour la Cour des comptes, se situerait aux alentours de 20 milliards d’euros par an (elle est probablement sous-estimée). En cumulant sur 10 années et prenant la fourchette basse de la Cour des Comptes, le coût de la fraude fiscale serait de 400 milliards d’euros (avec l’hypothèse haute du syndicat Solidaires finances publiques, deux fois plus). Combattre l’évitement illégal de l’impôt nécessite une stratégie globale. Cela passe en premier lieu par la législation fiscale et pénale. Le grand nombre de dispositifs dérogatoires par exemple nourrit le risque de fraude puisque les multiples conditions qui les assortissent ne sont pas toujours respectées. De ce point de vue, une revue de ces dispositifs ayant pour objectif d’en réduire le nombre et le coût s’impose. Cela passe également par la mobilisation de moyens humains (les personnels des services spécialisés en la matière), juridiques (les procédures de contrôle proprement dites par exemple) et techniques. C’est sur ce dernier point que nous revenons ici, tant il est vrai qu’ils ont constitué la priorité des pouvoirs publics, qui ont, hélas, surtout vu dans l’intelligence artificielle le moyen de poursuivre les suppressions d’emplois au sein de l’administration fiscale (voir sur ce sujet notamment la note de l’Institut Rousseau d’avril 2022[2]). I) Big Data et IA à la Direction générale des finances publiques (DGFiP) Plusieurs initiatives ont déjà été mises en place dans les pays européens : lutte contre l’escroquerie à la TVA en Belgique via la modélisation automatique des réseaux, dispositif Connect en Angleterre pour détecter les incohérences dans les déclarations fiscales, système nommé Redditometro en Italie pour comparer montants d’imposition et trains de vie constatés. La France s’inscrit dans ce sillage, et les premières applications de l’IA dans l’administration de la fraude fiscale apparaissent sporadiquement. L’une des difficultés au déploiement de l’IA est liée à la complexité des missions de ces administrations, étant précisé par ailleurs que l’administration fiscale, déjà très « numérisée » , utilise de longue date des applications prévoyant des possibilités de requêtage très utilisées par les personnels dans le cadre de leurs missions. Depuis 2014, Bercy dispose d’une cellule de data mining spécialisée, qui utilise un outil dédié au ciblage de la fraude et valorisation des requêtes (CFVR). Par l’analyse des comportements frauduleux constatés et la modélisation de ces derniers le but est d’identifier des critères caractérisant une personne ayant des comportements à risque de fraude. Le CFVR exploite les informations de 11 bases de données[3]. Précisons-le, initialement, ce traitement automatisé de données a porté sur la détection de la fraude en matière de TVA. En 2017, l’outil a été étendu aux personnes physiques, de façon expérimentale, par voie d’arrêté. Selon un rapport du Sénat déposé en 2020 par les sénateurs Thierry Carcenac et Claude Nougein[4], les techniques d’analyse de données utilisées « sont sans cesse étendues. En plus du data mining et du recours à l’IA, se développe le textmining, soit le traitement de données non structurées [textes ou images]. En parallèle, une expérimentation est menée dans plusieurs départements afin de croiser les déclarations des contribuables, les vues aériennes et les plans cadastraux pour traquer les erreurs, intentionnelles ou non, de déclaration des contribuables. Pour ce faire, la DGFiP s’appuie sur un logiciel développé par la société Accenture. » Les algorithmes permettent de faire du data mining, de l’exploration des données grâce à l’IA. Les algorithmes sont capables de détecter des incohérences dans les fichiers entre revenus, opérations financières ou trains de vie par rapport aux déclarations fiscales des ménages. Le décret publié le 13 février 2020 au Journal officiel, précisant les modalités de l’article 154 de la loi de finance 2020, a donné le coup d’envoi d’une expérimentation sur trois ans ne couvrant que trois types de fraudes : le trafic de marchandises prohibées, l’activité professionnelle non déclarée et la domiciliation fiscale frauduleuse. Le champ des données prospectées par cette IA dans le cyberespace est particulièrement étendu puisqu’il concerne les réseaux sociaux comme Facebook, les messageries comme Instagram ou encore les sites de commerce en ligne tels que LeBonCoin ou eBay. Ce programme doit permettre aux data scientists d’affiner leur méthode de profilage pour les personnes physiques. Il s’agit de renforcer les outils de détection des fraudes fiscales ou douanières particulièrement graves, pour lesquels les moyens d’investigation traditionnels des administrations sont insuffisants : fausse domiciliation fiscale à l’étranger, activité commerciale occulte, activités illicites telles que la contrebande de tabac ou le commerce de stupéfiants. L’affaire de la domiciliation fiscale de Johnny Hallyday illustre la démarche d’exploitation des réseaux sociaux à des fins de lutte contre la fraude pour déterminer la résidence fiscale effective (France ou États-Unis) au regard de la fiscalité applicable à la succession. L’analyse des contenus publiés par le défunt et sa famille (géolocalisation des photos) avait vocation à retracer ses déplacements et quantifier le nombre de jours passés dans chacun des pays, afin d’évaluer si les critères de résidence fiscale étaient démontrés ou non. Consultée en amont sur le projet de loi, compte tenu de l’impact du dispositif sur la vie privée et ses possibles effets sur la liberté d’expression en ligne, la Commission nationale de l’informatique et des libertés (CNIL) a mentionné expressément des réserves afin de préserver un équilibre entre l’objectif de lutte contre la fraude fiscale et le respect des droits et de la liberté des personnes[5] et a indiqué qu’un pareil test « doit s’accompagner de garanties fortes afin de préserver les droits et libertés des personnes concernées ». Une grande prudence dans l’utilisation des données personnelles est exigée aux administrations publiques. Seules
Par Briot-Hadar J., Drezet V.
11 octobre 2024