Le laboratoire d’idées de la reconstruction écologique et républicaine

Le recours à l’Intelligence artificielle pour lutter contre la fraude fiscale

[summary-3]

Le recours à l’Intelligence artificielle pour lutter contre la fraude fiscale

Accueil > Le recours à l’Intelligence artificielle pour lutter contre la fraude fiscale

Sommaire

    Le recours à l’Intelligence artificielle pour lutter contre la fraude fiscale

    En France, les chiffres relatifs à la fraude fiscale ont de quoi impressionner. Après avoir estimé en janvier 2013, l’évitement illégal de l’impôt entre 60 et 80 milliards d’euros par an, le syndicat national Solidaires finances publiques a estimé en 2017[1], qu’il se situait dans la fourchette haute et qu’il était possible qu’il atteigne jusqu’à 100 milliards d’euros.

    Cette estimation du premier syndicat représentatif des agents du ministère chargé des impôts joue un grand rôle, car elle est très souvent reprise dans le débat politique et médiatique.

    Celle-ci, pour la Cour des comptes, se situerait aux alentours de 20 milliards d’euros par an (elle est probablement sous-estimée).

    En cumulant sur 10 années et prenant la fourchette basse de la Cour des Comptes, le coût de la fraude fiscale serait de 400 milliards d’euros (avec l’hypothèse haute du syndicat Solidaires finances publiques, deux fois plus).

    Combattre l’évitement illégal de l’impôt nécessite une stratégie globale. Cela passe en premier lieu par la législation fiscale et pénale. Le grand nombre de dispositifs dérogatoires par exemple nourrit le risque de fraude puisque les multiples conditions qui les assortissent ne sont pas toujours respectées. De ce point de vue, une revue de ces dispositifs ayant pour objectif d’en réduire le nombre et le coût s’impose. Cela passe également par la mobilisation de moyens humains (les personnels des services spécialisés en la matière), juridiques (les procédures de contrôle proprement dites par exemple) et techniques. C’est sur ce dernier point que nous revenons ici, tant il est vrai qu’ils ont constitué la priorité des pouvoirs publics, qui ont, hélas, surtout vu dans l’intelligence artificielle le moyen de poursuivre les suppressions d’emplois au sein de l’administration fiscale (voir sur ce sujet notamment la note de l’Institut Rousseau d’avril 2022[2]).

    I) Big Data et IA à la Direction générale des finances publiques (DGFiP)

    Plusieurs initiatives ont déjà été mises en place dans les pays européens : lutte contre l’escroquerie à la TVA en Belgique via la modélisation automatique des réseaux, dispositif Connect en Angleterre pour détecter les incohérences dans les déclarations fiscales, système nommé Redditometro en Italie pour comparer montants d’imposition et trains de vie constatés.

    La France s’inscrit dans ce sillage, et les premières applications de l’IA dans l’administration de la fraude fiscale apparaissent sporadiquement. L’une des difficultés au déploiement de l’IA est liée à la complexité des missions de ces administrations, étant précisé par ailleurs que l’administration fiscale, déjà très « numérisée » , utilise de longue date des applications prévoyant des possibilités de requêtage très utilisées par les personnels dans le cadre de leurs missions.

    Depuis 2014, Bercy dispose d’une cellule de data mining spécialisée, qui utilise un outil dédié au ciblage de la fraude et valorisation des requêtes (CFVR). Par l’analyse des comportements frauduleux constatés et la modélisation de ces derniers le but est d’identifier des critères caractérisant une personne ayant des comportements à risque de fraude. Le CFVR exploite les informations de 11 bases de données[3]. Précisons-le, initialement, ce traitement automatisé de données a porté sur la détection de la fraude en matière de TVA.

    En 2017, l’outil a été étendu aux personnes physiques, de façon expérimentale, par voie d’arrêté. Selon un rapport du Sénat déposé en 2020 par les sénateurs Thierry Carcenac et Claude Nougein[4], les techniques d’analyse de données utilisées « sont sans cesse étendues. En plus du data mining et du recours à l’IA, se développe le textmining, soit le traitement de données non structurées [textes ou images]. En parallèle, une expérimentation est menée dans plusieurs départements afin de croiser les déclarations des contribuables, les vues aériennes et les plans cadastraux pour traquer les erreurs, intentionnelles ou non, de déclaration des contribuables. Pour ce faire, la DGFiP s’appuie sur un logiciel développé par la société Accenture. » Les algorithmes permettent de faire du data mining, de l’exploration des données grâce à l’IA. Les algorithmes sont capables de détecter des incohérences dans les fichiers entre revenus, opérations financières ou trains de vie par rapport aux déclarations fiscales des ménages.

    Le décret publié le 13 février 2020 au Journal officiel, précisant les modalités de l’article 154 de la loi de finance 2020, a donné le coup d’envoi d’une expérimentation sur trois ans ne couvrant que trois types de fraudes : le trafic de marchandises prohibées, l’activité professionnelle non déclarée et la domiciliation fiscale frauduleuse. Le champ des données prospectées par cette IA dans le cyberespace est particulièrement étendu puisqu’il concerne les réseaux sociaux comme Facebook, les messageries comme Instagram ou encore les sites de commerce en ligne tels que LeBonCoin ou eBay. Ce programme doit permettre aux data scientists d’affiner leur méthode de profilage pour les personnes physiques. Il s’agit de renforcer les outils de détection des fraudes fiscales ou douanières particulièrement graves, pour lesquels les moyens d’investigation traditionnels des administrations sont insuffisants : fausse domiciliation fiscale à l’étranger, activité commerciale occulte, activités illicites telles que la contrebande de tabac ou le commerce de stupéfiants. L’affaire de la domiciliation fiscale de Johnny Hallyday illustre la démarche d’exploitation des réseaux sociaux à des fins de lutte contre la fraude pour déterminer la résidence fiscale effective (France ou États-Unis) au regard de la fiscalité applicable à la succession. L’analyse des contenus publiés par le défunt et sa famille (géolocalisation des photos) avait vocation à retracer ses déplacements et quantifier le nombre de jours passés dans chacun des pays, afin d’évaluer si les critères de résidence fiscale étaient démontrés ou non.

    Consultée en amont sur le projet de loi, compte tenu de l’impact du dispositif sur la vie privée et ses possibles effets sur la liberté d’expression en ligne, la Commission nationale de l’informatique et des libertés (CNIL) a mentionné expressément des réserves afin de préserver un équilibre entre l’objectif de lutte contre la fraude fiscale et le respect des droits et de la liberté des personnes[5] et a indiqué qu’un pareil test « doit s’accompagner de garanties fortes afin de préserver les droits et libertés des personnes concernées ». Une grande prudence dans l’utilisation des données personnelles est exigée aux administrations publiques. Seules les données nécessaires à la détection de fraude fiscale doivent être utilisées par les agents de la DGFiP ou des douaniers (en aucun cas, des sous-traitants) et le contribuable doit pouvoir accéder au contenu et aux traitements et de la nature des données. Les agents de la DGFiP, précisons-le, n’ont accès qu’aux contenus manifestement rendus publics sur le web et, en aucun cas, à la reconnaissance faciale ou aux conversations privées des contribuables. Les données ne doivent pas être stockées et, s’il n’y a aucun soupçon de fraude fiscale, doivent être détruites sous cinq jours.

    L’arrêté du 11 mars 2022 a permis à la DGFiP  la mise en place de l’outil « GALAXIE ». Cet outil est accessible seulement aux agents de la DGFiP[6]. Une des principales fonctions de cartographier les liens existants entre différents contribuables (entre les personnes morales, entre les personnes morales et personnes physiques, etc.) en intégrant des données issues de leurs situations patrimoniales et fiscales.

    Pour finir, la loi de finances pour 2024 autorise les agents de l’administration fiscale à créer de faux comptes et à échanger sur les réseaux sociaux en utilisant des pseudonymes. Elle renforce considérablement les pouvoirs d’investigation de l’administration fiscale sur internet.

    II) Les utilisations de l’IA dans l’administration fiscale française

    Le premier exemple concerne l’outil développé en interne par la DGFiP, en octobre 2021, avec l’appui de Capgemini et Google, baptisé « Foncier innovant », permettant de croiser les déclarations des contribuables et les vues aériennes de l’Institut national de l’information géographique (IGN) afin de repérer les constructions non déclarées (piscines, vérandas, etc.). À partir de ces images, un agent est chargé de vérifier les informations fournies. Lorsqu’une anomalie est détectée, l’administration fiscale demande alors au propriétaire de fournir des explications ou des preuves pour établir que l’erreur provient du fisc.

    Par la suite, la construction non déclarée est venue s’intégrer dans la valeur cadastrale du logement avant d’être intégrée dans le calcul de la taxe foncière et de la taxe d’habitation sur les résidences secondaires. Grâce à cette technologie, l’administration fiscale a déjà identifié 140 000 piscines non déclarées, ce qui a généré 40 millions d’euros de recettes fiscales supplémentaires. Si cet outil a produit des résultats sur les piscines non déclarées, il présente en revanche un bilan décevant en matière d’identification d’extension de bâtiments et de rapport au plan cadastral avec une représentation topographique trop souvent imprécise.

    Le second exemple concerne l’utilisation des réseaux sociaux (Facebook, Instagram, Twitter) par les agents de l’administration fiscale. Il s’agit ici encore de détecter des situations objectives non déclarées mais en utilisant des informations qui, tout en étant disponibles, ne sont pas répertoriées au niveau de l’administration fiscale. La DGFiP ne peut avoir accès aux profils protégés par un mot de passe ou par une inscription spécifique sur ces plateformes. Les collectes d’informations ne peuvent pas non plus porter sur les commentaires lors de conversations sur les réseaux sociaux. Comme nous l’avons indiqué, le champ d’application de cette collecte ne peut porter que pour rechercher des manquements et infractions à l’aide d’activités occultes et de fausse domiciliation à l’étranger.

    Bien entendu, la première cible est celle des personnes exerçant une activité professionnelle non déclarée sous couvert, par exemple de ventes « répétées » sur des plateformes de biens d’occasion ou de location d’appartements à des touristes. Depuis 2020, l’expérimentation a été systématisée sur tous les réseaux sociaux afin de renforcer les outils de détection de fraudes dans des domaines plus vastes en matière fiscale mais aussi douanière.

    L’arrêt de la Cour d’appel de Paris du 5 décembre 2018[7] a affirmé la légalité de la prise en compte des profils LinkedIn pour soupçonner une fraude fiscale. En 2018, les agents de la DGFiP ont, par exemple, constaté sur LinkedIn que deux commerciaux, dépendant d’une société française, travaillaient en fait pour la maison mère située au Royaume-Uni.

    Si l’on peut comprendre l’intérêt de systématiser la détection, on doit aussi noter que les notions sophistiquées de fiscalité internationale font souvent appel à des considérations qualitatives bien qu’objectives, en particulier par exemple pour la notion de résidence fiscale. Les informations contenues sur les réseaux sociaux, y compris des réseaux à vocation professionnelle, peuvent contenir des éléments factuels qui sont en réalité présentés de manière subjective par leur auteur. Le fait que les auteurs puissent se mettre en scène et présenter une réalité exagérée ne saurait constituer un motif de redressement fiscal. Seule la réalité compte. On peut ainsi s’interroger sur la pertinence de cette méthode qui, si elle était sans contrôle précis humain, pourrait présenter un risque y compris en ce qui concerne la vie privée.

    Le troisième exemple concerne la surveillance des plateformes de l’économie collaborative (Blablacar, LeBonCoin, Vinted, etc.). Ces dernières ont l’obligation, depuis le vote de la loi fraude le 23 octobre 2018, de transmettre à l’administration fiscale (article 242 bis, CGI), au plus tard au 31 janvier de l’année qui suit les transactions, certaines informations relatives à leurs utilisateurs : les éléments qui identifient l’utilisateur, son statut de particulier ou professionnel, le nombre et le montant brut des transactions réalisées pendant l’année civile précédente, et même les coordonnées du compte bancaire où ont été versés les fonds.

    Pour 2024, l’administration fiscale envisage un engagement accru des contrôles fiscaux grâce au data mining : 50 % des contrôles des professionnels et 36 % des contrôles des particuliers. Cependant, l’IA « n’a débouché que sur 9 à 13 % des résultats financiers jusqu’en 2022[8] ».

    III) Entraîner l’outil d’IA

    Pour entraîner l’outil d’IA, il est nécessaire d’être en possession de très nombreuses données (on parle de « jeux de données ») lors de la phase d’apprentissage (entraînement). Grâce à celles-ci, le cerveau du robot développe des réflexes qui deviendront des règles. C’est grâce à des règles et plus largement des modèles que les IA fonctionnent.

    L’administration fiscale néerlandaise, pourtant reconnue dans la lutte contre la fraude fiscale et sociale, avait malheureusement oublié ce principe, en souhaitant vouloir lutter contre la fraude aux prestations sociales. En 2019, les autorités fiscales néerlandaises avaient utilisé un algorithme d’auto-apprentissage pour créer des profils de risque dans le but de détecter la fraude aux allocations de garde d’enfants. Des dizaines de milliers de foyers furent victimes. Les recherches menées par l’administration fiscale elle-même ont montré que le personnel avait pour instruction de fonder le risque de fraude sur des éléments tels que la nationalité des individus. Le jeu de données était dès lors biaisé, dès le début, par les critères du profil de risque élaborés par l’administration fiscale. L’équité algorithmique (autrement dit, l’absence de tout favoritisme ou discrimination à l’égard d’un individu ou d’un groupe formé par des caractéristiques innées ou acquises) est primordiale en vue d’éviter tout biais algorithmique.

    C’est une difficulté particulièrement importante que celle d’assurer que le contribuable est en mesure de comprendre mais aussi de prévoir les recherches effectuées à son encontre. Juger a posteriori de l’opportunité légale du moyen utilisé pour la recherche de l’infraction en fonction des faits mis en évidence ne constitue pas un système acceptable. Il est évident que la lutte contre la fraude est une priorité démocratique, mais l’absence de contrôle humain réellement efficace, faute de moyens suffisants en personnel, sur le ciblage et sur la décision de poursuite pose des difficultés qui interdisent de laisser la machine choisir.

    En France, la part décevante de l’IA au contrôle fiscal dans le cadre du datamining (qui, en 2022, représente plus de la moitié des contrôles fiscaux « externes, comme les vérifications de comptabilité, mais seulement 13,69 % des résultats financiers) pourrait s’expliquer par le fait « qu’elle repose sur des modèles relativement basiques, bien loin de l’état de l’art de la technologie (sans même parler d’IA générative), et loin de ce qui se fait couramment dans les grandes entreprises pour répondre à leurs besoins métiers, allant de la prospection pétrolière aux services financiers, en passant par la publicité en ligne ou la modélisation des risques sur une infrastructure en réseau (SNCF, RTE, etc.) [9]».

    Dans cet exemple, il ne faut pas cibler l’outil d’IA mais plutôt le personnel de l’administration fiscale.

    IV) Nouvelles technologies et recouvrement fiscal

    Pour réduire la fraude fiscale, un couple « IA + expertise métier » est primordial.

    La première étape serait d’utiliser la blockchain.

    La blockchain est une chaîne de blocs ou conteneurs numériques, dans lesquels sont stockées des informations de toute nature. On peut dire que c’est un registre numérique inaltérable, bâti sur la base d’un consensus entre les participants dans toutes les étapes ou séquences d’une opération.

    Pour garantir la fiabilité et l’intégrité des données, la blockchain fait appel à des « mineurs », choisis parmi ses intervenants (institutions financières, personnes morales, personnes physiques, etc.) qui, suivant des règles prédéfinies valident les informations avant de les inscrire (pour toujours) sur la blockchain. Les blocs d’informations, horodatés et ajoutés à la chaîne, ne peuvent plus être modifiés.

    Généralement, il existe trois types de membres :

    • Les utilisateurs : ils ne font qu’effectuer des paiements et les recevoir. Ils ne s’intéressent pas aux algorithmes et à la création de nouveaux blocs. Lorsqu’ils doivent effectuer des transactions, ils payent des frais de minage.
    • Les nœuds : ils reçoivent les informations des utilisateurs et les transmettent. Ils s’assurent que le système reste décentralisé
    • Les mineurs : ils calculent afin de trouver le prochain bloc et d’enregistrer les transactions qui seront obtenues dans celui-ci. Une fois qu’un mineur a réussi cette opération, il reçoit les frais de minage des transactions enregistrées dans le nouveau bloc découvert.

    Les participants au système sont appelés « nœuds » et sont connectés entre eux de manière distribuée. Tous les intervenants contribuent à l’enrichissement de la base de données.

    La blockchain serait utilisée en vue de créer un registre numérique européen accessible à l’ensemble des administrations fiscales nationales et répertoriant l’ensemble des transactions.

    Créer un registre numérique international semble difficilement réalisable, du fait de la pression politique et des signatures trop récentes des conventions d’assistance administrative en matière fiscale. Toutefois, une autre solution consisterait à ce que la gestion  de cette blockchain et du registre afférent puisse être confiée à une organisation internationale ad hoc, dont la gouvernance associerait les États et les institutions financières privées, et dont les statuts garantiraient son indépendance (mandat clair, possibles immunités, transparence de fonctionnement, caractère non renouvelable des fonctions dirigeantes, etc). Un tel registre offrirait des garanties d’information fiable et aisément accessible tant pour les États que pour les institutions privées, d’une nature différente des structures de règlement transnationaux actuellement sur ce marché telles que SWIFT ou le CIPS. En conséquence, les législations fiscales nationales pourraient prévoir qu’en cas de contrôles fiscaux et d’éventuels redressements, une présomption de régularité et de fiabilité des informations afférentes (charge de la preuve aménagée), s’applique en faveur des transactions réalisées par cette organisation internationale ad hoc.

    Par ailleurs, il serait impératif que les sociétés qui choisissent de ne pas participer à ce processus de vérification fiscale assument une charge de preuve aménagée, qui les contraindrait à démontrer la conformité de leurs opérations. Ce cadre novateur, en établissant des normes claires et des obligations précises, pourrait ainsi favoriser une culture de la transparence tout en dissuadant les comportements évasifs.

    Utiliser la blockchain plutôt qu’un registre offre plusieurs avantages significatifs, notamment en termes de sécurité, de transparence et de décentralisation. Contrairement à un registre traditionnel qui peut être facilement modifié ou falsifié par une entité centrale, la blockchain repose sur un système de consensus distribué, rendant toute tentative de manipulation presque impossible sans l’accord de la majorité des participants. De plus, chaque transaction est enregistrée de manière chronologique et immuable, garantissant ainsi une traçabilité complète et vérifiable. Cela accroît la confiance entre les parties prenantes, car les informations sont accessibles à tous et ne dépendent pas d’une autorité unique. La blockchain apporte donc  une robustesse et une confiance accrues qui dépassent les capacités d’un simple registre.

    Néanmoins, il convient d’adopter une perspective réaliste, car la blockchain présente également certaines limites. En effet, certains pourraient considérer qu’il est plus complexe d’obtenir l’accord de tous les États sur une blockchain que sur des traités ou des conventions fiscales. Par ailleurs, la blockchain entraîne une consommation d’énergie supérieure, ce qui n’est pas le cas d’un registre traditionnel. Enfin, les coûts liés à la création et à la gestion d’une blockchain peuvent s’avérer élevés, alors qu’un registre classique peut se révéler moins onéreux.

    La deuxième étape consisterait à utiliser le Machine Learning, qui permettrait d’appuyer les administrations fiscales nationales et de repérer tous les actifs non déclarés par les contribuables.

    Ne l’oublions pas, le contrôle fiscal n’est pas réalisé au hasard et exige une phase préalable de recueil d’informations. Pour la DGFiP, il s’agit notamment de faire émerger les insuffisances de déclaration de recettes, les domiciliations fictives, les fraudes à la TVA (Carrousels), etc. Les services de l’administration fiscale peuvent utiliser plusieurs types de procédures de collecte d’informations : le droit de communication qui permet d’obtenir des documents auprès d’entreprises, d’administrations ou d’organismes divers et le relevé d’informations comptables ; le droit d’enquête qui permet de rechercher les infractions aux règles de facturation auxquelles sont soumis les assujettis à la TVA ou encore la procédure de visite et de saisie. La mission de recherche de l’information est donc primordiale.

    L’utilisation de l’intelligence artificielle et du data mining dans la lutte contre la fraude à la TVA apparaît particulièrement pertinente, bien qu’elle soit moins efficace pour analyser des montages fiscaux complexes. Avec notre proposition, nous déplaçons effectivement le curseur vers l’intelligence artificielle. Cependant, toute application de cette technologie dépendra du choix des jeux de données d’entraînement et de test, ce qui impliquera un biais de sélection initial déterminé par l’expertise métier. Néanmoins, il sera possible d’établir une forme d’éthique algorithmique afin de minimiser ces biais..

    Le machine learning présente des avantages notables par rapport au data mining. Tout d’abord, il se caractérise par sa précision et son adaptabilité. En apprenant en continu à partir de nouvelles données, il est en mesure d’affiner ses prédictions et s’avère particulièrement efficace dans la détection de la fraude fiscale.

    De surcroît, grâce à des algorithmes avancés, le machine learning permet une analyse prédictive, offrant la possibilité d’anticiper les comportements futurs des contribuables. Cela aide la DGFiP à prévoir les problèmes et à adopter des mesures proactives. Dans un contexte où les volumes de données sont colossaux, le machine learning démontre également une capacité supérieure à traiter ces vastes quantités d’informations de manière plus rapide et efficace que les méthodes de data mining traditionnelles.

    En outre, les algorithmes de machine learning sont capables de déceler des relations et des schémas complexes dans les données, souvent inaccessibles aux méthodes plus simples. Ce niveau de sophistication se traduit également par l’automatisation de nombreuses tâches analytiques, réduisant ainsi le besoin d’interventions manuelles et améliorant l’efficacité opérationnelle.

    Enfin, les modèles de machine learning peuvent être adaptés en fonction des différents types de contribuables ou de situations fiscales spécifiques, permettant ainsi une approche plus ciblée et pertinente.

    Cette proposition nécessite bien évidemment les efforts de toutes les administrations, une adaptation des cadres normatifs à cette nouvelle pratique ainsi qu’une montée en compétences des équipes de la DGFiP sur ces nouveaux sujets (data scientists, data engineers notamment).

    Un premier obstacle pourrait venir du manque de coopération de certains pays et du fait que chaque pays est souverain de sa politique fiscale (le fameux « secret fiscal »). Mais des mesures contre-incitatives pourraient être, à ce moment, mises en place contre les pays récalcitrants.

    Le deuxième obstacle, d’ordre juridique, a été soulevé en septembre 2021, par le ministère de l’Économie, des Finances et de la Souveraineté industrielle et numérique de France.

    A ce moment, l’exécutif français a demandé son avis à la CNIL  en charge de ces sujets et celle-ci s’est montrée moins enthousiaste que les autorités fiscales. Tout en acceptant l’importance de la recherche d’infractions et constatant que le projet contenait certaines garanties sur le traitement non automatisé et le nombre limité d’infractions qui seraient sanctionnées, la CNIL a mentionné expressément des réserves afin de préserver un équilibre entre l’objectif de lutte contre la fraude fiscale et le respect des droits et liberté de personnes.  La CNIL reste toujours très sensible à la question des libertés. Encore récemment, l’institution a réitéré ses commentaires relatifs au contrôle strict des données collectées en fonction de leur destination (lutte exclusive contre la fraude / aide à la régularisation des erreurs). Cette analyse toujours détaillée des propositions de l’exécutif est le minimum pour assurer une forme de proportionnalité des dispositifs. Elle n’empêche pas et ne doit pas empêcher un contrôle approfondi du juge.

    Il est noté de ce point de vue que le contrôle du législateur est indispensable et que la proportionnalité doit être maintenue. Ainsi, seules les données nécessaires à la détection de fraude doivent être utilisées et le contribuable doit pouvoir accéder aux contenus, aux traitements et à la nature des données. La question de la collecte de données, qui ne permettrait pas de mettre en évidence les infractions ciblées au départ mais qui pourrait se révéler utile pour mettre en évidence d’autres infractions inconnues lors de la collecte, pose une autre question essentielle comparable à celle qui avait animée la communauté internationale au sujet des opérations de phishing[10] auprès de banques pour rechercher des comptes non déclarés. La question est ici encore plus problématique si lors de la mise en place de la recherche, on n’est pas en mesure de justifier le recours à l’intelligence artificielle pour rechercher des infractions possiblement identifiées au préalable. Cet outil est plus intrusif et moins contrôlé que l’humain.

    Cette technologie ne remplacera pas l’expertise des agents de la DGFiP. Anticiper des suppressions d’emplois du fait de cet outil apparaît risqué. Si poursuivre l’investissement dans cette technologie  est  souhaitable , elle n’est pas une raison suffisante pour poursuivre la réduction des personnels du contrôle fiscal. C’est l’expertise humaine qui alimente l’algorithme, ne l’oublions pas. Et l’algorithme ne peut être qu’un outil au service du travail humain. Rappelons-le, un inspecteur de la DGFiP coûte entre 50.000 et 100.000 euros par an selon son profil mais, si l’on considère les résultats du contrôle fiscal, « rapporte » 1.500.000 euros. Il est de facto hors de question de faire du contrôle fiscal automatisé.

    Appliquons l’expression « Quand on veut, on peut ». Si nous souhaitons réduire la fraude fiscale de notre quotidien, cela nécessite la mobilisation et l’intégrité de chacun.

    [1] Solidaires-Finances publiques, Évasion et fraudes scales, contrôle scal, janvier  2013, http://archives.solidairesfinancespubliques.fr/gen/cp/dp/dp2013/120122_Rapport_fraude_evasionscale.pdf ; Solidaires-Finances publiques, « Quand la baisse des moyens du contrôle scal entraîne une baisse de sa présence… », septembre 2018, https://solidairesnancespubliques.org/le-syndicat/nos-publications/999-rapport-quand-la-baisse-des-moyens-du-controle-fiscal-entraine-une-baisse-de-sa-presence-chute-inquietante-de-la-couverture-du-tissu-economique-et-scal/download.htm

    [2] https://institut-rousseau.fr/quand-la-politique-dausterite-conduit-a-degrader-volontairement-le-controle-fiscal-et-lefficacite-de-la-lutte-contre-la-fraude/

    [3] F. Perrotin, Ciblage des contrôles fiscaux et datamining, Les petites affiches, n° 101, 20 mai 2020

    [4] T. Carcenac et C. Nougein, L’adéquation des moyens humains et matériels aux enjeux du contrôle fiscal : une évaluation difficile, une stratégie à clarifier, Rapport du Sénat, juillet 2020.

    [5] Délibération n° 2019-114 du 12 septembre 2019 portant avis sur le projet d’article 9 du projet de loi de finances pour 2020.

    [6] Arrêté du 11 mars 2022 portant autorisation par la direction générale des finances publiques du traitement de données à caractère personnel dénommé GALAXIE, JORF, n° 0076 du 31 mars 2022, texte n° 85.

    [7] CA Paris, 5 décembre 2018, n° 18/04953.

    [8] Drezet V. & Gath O., Autour d’impôt : L’impôt et la justice fiscale et sociale expliqués à un·e ami·e qui n’aime pas l’impôt et n’y comprend rien, Syllepse, mars 2024.

    [9] Délégation à la prospective du Sénat, « L’IA et l’avenir du service public », rapport n° 491, 2023-2024.

    [10] L’hameçonnage (phishing en anglais) est une technique frauduleuse destinée à leurrer l’internaute pour l’inciter à communiquer des données personnelles (comptes d’accès, mots de passe…) et/ou bancaires en se faisant passer pour un tiers de confiance.

    Publié le 11 octobre 2024

    Le recours à l’Intelligence artificielle pour lutter contre la fraude fiscale

    Auteurs

    Julien Briot-Hadar
    Économiste, expert en compliance et spécialiste des questions liées à la fraude fiscale.

    Vincent Drezet
    Porte-parole d'Attac, ancien secrétaire général de Solidaires finances publiques.

    En France, les chiffres relatifs à la fraude fiscale ont de quoi impressionner. Après avoir estimé en janvier 2013, l’évitement illégal de l’impôt entre 60 et 80 milliards d’euros par an, le syndicat national Solidaires finances publiques a estimé en 2017[1], qu’il se situait dans la fourchette haute et qu’il était possible qu’il atteigne jusqu’à 100 milliards d’euros.

    Cette estimation du premier syndicat représentatif des agents du ministère chargé des impôts joue un grand rôle, car elle est très souvent reprise dans le débat politique et médiatique.

    Celle-ci, pour la Cour des comptes, se situerait aux alentours de 20 milliards d’euros par an (elle est probablement sous-estimée).

    En cumulant sur 10 années et prenant la fourchette basse de la Cour des Comptes, le coût de la fraude fiscale serait de 400 milliards d’euros (avec l’hypothèse haute du syndicat Solidaires finances publiques, deux fois plus).

    Combattre l’évitement illégal de l’impôt nécessite une stratégie globale. Cela passe en premier lieu par la législation fiscale et pénale. Le grand nombre de dispositifs dérogatoires par exemple nourrit le risque de fraude puisque les multiples conditions qui les assortissent ne sont pas toujours respectées. De ce point de vue, une revue de ces dispositifs ayant pour objectif d’en réduire le nombre et le coût s’impose. Cela passe également par la mobilisation de moyens humains (les personnels des services spécialisés en la matière), juridiques (les procédures de contrôle proprement dites par exemple) et techniques. C’est sur ce dernier point que nous revenons ici, tant il est vrai qu’ils ont constitué la priorité des pouvoirs publics, qui ont, hélas, surtout vu dans l’intelligence artificielle le moyen de poursuivre les suppressions d’emplois au sein de l’administration fiscale (voir sur ce sujet notamment la note de l’Institut Rousseau d’avril 2022[2]).

    I) Big Data et IA à la Direction générale des finances publiques (DGFiP)

    Plusieurs initiatives ont déjà été mises en place dans les pays européens : lutte contre l’escroquerie à la TVA en Belgique via la modélisation automatique des réseaux, dispositif Connect en Angleterre pour détecter les incohérences dans les déclarations fiscales, système nommé Redditometro en Italie pour comparer montants d’imposition et trains de vie constatés.

    La France s’inscrit dans ce sillage, et les premières applications de l’IA dans l’administration de la fraude fiscale apparaissent sporadiquement. L’une des difficultés au déploiement de l’IA est liée à la complexité des missions de ces administrations, étant précisé par ailleurs que l’administration fiscale, déjà très « numérisée » , utilise de longue date des applications prévoyant des possibilités de requêtage très utilisées par les personnels dans le cadre de leurs missions.

    Depuis 2014, Bercy dispose d’une cellule de data mining spécialisée, qui utilise un outil dédié au ciblage de la fraude et valorisation des requêtes (CFVR). Par l’analyse des comportements frauduleux constatés et la modélisation de ces derniers le but est d’identifier des critères caractérisant une personne ayant des comportements à risque de fraude. Le CFVR exploite les informations de 11 bases de données[3]. Précisons-le, initialement, ce traitement automatisé de données a porté sur la détection de la fraude en matière de TVA.

    En 2017, l’outil a été étendu aux personnes physiques, de façon expérimentale, par voie d’arrêté. Selon un rapport du Sénat déposé en 2020 par les sénateurs Thierry Carcenac et Claude Nougein[4], les techniques d’analyse de données utilisées « sont sans cesse étendues. En plus du data mining et du recours à l’IA, se développe le textmining, soit le traitement de données non structurées [textes ou images]. En parallèle, une expérimentation est menée dans plusieurs départements afin de croiser les déclarations des contribuables, les vues aériennes et les plans cadastraux pour traquer les erreurs, intentionnelles ou non, de déclaration des contribuables. Pour ce faire, la DGFiP s’appuie sur un logiciel développé par la société Accenture. » Les algorithmes permettent de faire du data mining, de l’exploration des données grâce à l’IA. Les algorithmes sont capables de détecter des incohérences dans les fichiers entre revenus, opérations financières ou trains de vie par rapport aux déclarations fiscales des ménages.

    Le décret publié le 13 février 2020 au Journal officiel, précisant les modalités de l’article 154 de la loi de finance 2020, a donné le coup d’envoi d’une expérimentation sur trois ans ne couvrant que trois types de fraudes : le trafic de marchandises prohibées, l’activité professionnelle non déclarée et la domiciliation fiscale frauduleuse. Le champ des données prospectées par cette IA dans le cyberespace est particulièrement étendu puisqu’il concerne les réseaux sociaux comme Facebook, les messageries comme Instagram ou encore les sites de commerce en ligne tels que LeBonCoin ou eBay. Ce programme doit permettre aux data scientists d’affiner leur méthode de profilage pour les personnes physiques. Il s’agit de renforcer les outils de détection des fraudes fiscales ou douanières particulièrement graves, pour lesquels les moyens d’investigation traditionnels des administrations sont insuffisants : fausse domiciliation fiscale à l’étranger, activité commerciale occulte, activités illicites telles que la contrebande de tabac ou le commerce de stupéfiants. L’affaire de la domiciliation fiscale de Johnny Hallyday illustre la démarche d’exploitation des réseaux sociaux à des fins de lutte contre la fraude pour déterminer la résidence fiscale effective (France ou États-Unis) au regard de la fiscalité applicable à la succession. L’analyse des contenus publiés par le défunt et sa famille (géolocalisation des photos) avait vocation à retracer ses déplacements et quantifier le nombre de jours passés dans chacun des pays, afin d’évaluer si les critères de résidence fiscale étaient démontrés ou non.

    Consultée en amont sur le projet de loi, compte tenu de l’impact du dispositif sur la vie privée et ses possibles effets sur la liberté d’expression en ligne, la Commission nationale de l’informatique et des libertés (CNIL) a mentionné expressément des réserves afin de préserver un équilibre entre l’objectif de lutte contre la fraude fiscale et le respect des droits et de la liberté des personnes[5] et a indiqué qu’un pareil test « doit s’accompagner de garanties fortes afin de préserver les droits et libertés des personnes concernées ». Une grande prudence dans l’utilisation des données personnelles est exigée aux administrations publiques. Seules les données nécessaires à la détection de fraude fiscale doivent être utilisées par les agents de la DGFiP ou des douaniers (en aucun cas, des sous-traitants) et le contribuable doit pouvoir accéder au contenu et aux traitements et de la nature des données. Les agents de la DGFiP, précisons-le, n’ont accès qu’aux contenus manifestement rendus publics sur le web et, en aucun cas, à la reconnaissance faciale ou aux conversations privées des contribuables. Les données ne doivent pas être stockées et, s’il n’y a aucun soupçon de fraude fiscale, doivent être détruites sous cinq jours.

    L’arrêté du 11 mars 2022 a permis à la DGFiP  la mise en place de l’outil « GALAXIE ». Cet outil est accessible seulement aux agents de la DGFiP[6]. Une des principales fonctions de cartographier les liens existants entre différents contribuables (entre les personnes morales, entre les personnes morales et personnes physiques, etc.) en intégrant des données issues de leurs situations patrimoniales et fiscales.

    Pour finir, la loi de finances pour 2024 autorise les agents de l’administration fiscale à créer de faux comptes et à échanger sur les réseaux sociaux en utilisant des pseudonymes. Elle renforce considérablement les pouvoirs d’investigation de l’administration fiscale sur internet.

    II) Les utilisations de l’IA dans l’administration fiscale française

    Le premier exemple concerne l’outil développé en interne par la DGFiP, en octobre 2021, avec l’appui de Capgemini et Google, baptisé « Foncier innovant », permettant de croiser les déclarations des contribuables et les vues aériennes de l’Institut national de l’information géographique (IGN) afin de repérer les constructions non déclarées (piscines, vérandas, etc.). À partir de ces images, un agent est chargé de vérifier les informations fournies. Lorsqu’une anomalie est détectée, l’administration fiscale demande alors au propriétaire de fournir des explications ou des preuves pour établir que l’erreur provient du fisc.

    Par la suite, la construction non déclarée est venue s’intégrer dans la valeur cadastrale du logement avant d’être intégrée dans le calcul de la taxe foncière et de la taxe d’habitation sur les résidences secondaires. Grâce à cette technologie, l’administration fiscale a déjà identifié 140 000 piscines non déclarées, ce qui a généré 40 millions d’euros de recettes fiscales supplémentaires. Si cet outil a produit des résultats sur les piscines non déclarées, il présente en revanche un bilan décevant en matière d’identification d’extension de bâtiments et de rapport au plan cadastral avec une représentation topographique trop souvent imprécise.

    Le second exemple concerne l’utilisation des réseaux sociaux (Facebook, Instagram, Twitter) par les agents de l’administration fiscale. Il s’agit ici encore de détecter des situations objectives non déclarées mais en utilisant des informations qui, tout en étant disponibles, ne sont pas répertoriées au niveau de l’administration fiscale. La DGFiP ne peut avoir accès aux profils protégés par un mot de passe ou par une inscription spécifique sur ces plateformes. Les collectes d’informations ne peuvent pas non plus porter sur les commentaires lors de conversations sur les réseaux sociaux. Comme nous l’avons indiqué, le champ d’application de cette collecte ne peut porter que pour rechercher des manquements et infractions à l’aide d’activités occultes et de fausse domiciliation à l’étranger.

    Bien entendu, la première cible est celle des personnes exerçant une activité professionnelle non déclarée sous couvert, par exemple de ventes « répétées » sur des plateformes de biens d’occasion ou de location d’appartements à des touristes. Depuis 2020, l’expérimentation a été systématisée sur tous les réseaux sociaux afin de renforcer les outils de détection de fraudes dans des domaines plus vastes en matière fiscale mais aussi douanière.

    L’arrêt de la Cour d’appel de Paris du 5 décembre 2018[7] a affirmé la légalité de la prise en compte des profils LinkedIn pour soupçonner une fraude fiscale. En 2018, les agents de la DGFiP ont, par exemple, constaté sur LinkedIn que deux commerciaux, dépendant d’une société française, travaillaient en fait pour la maison mère située au Royaume-Uni.

    Si l’on peut comprendre l’intérêt de systématiser la détection, on doit aussi noter que les notions sophistiquées de fiscalité internationale font souvent appel à des considérations qualitatives bien qu’objectives, en particulier par exemple pour la notion de résidence fiscale. Les informations contenues sur les réseaux sociaux, y compris des réseaux à vocation professionnelle, peuvent contenir des éléments factuels qui sont en réalité présentés de manière subjective par leur auteur. Le fait que les auteurs puissent se mettre en scène et présenter une réalité exagérée ne saurait constituer un motif de redressement fiscal. Seule la réalité compte. On peut ainsi s’interroger sur la pertinence de cette méthode qui, si elle était sans contrôle précis humain, pourrait présenter un risque y compris en ce qui concerne la vie privée.

    Le troisième exemple concerne la surveillance des plateformes de l’économie collaborative (Blablacar, LeBonCoin, Vinted, etc.). Ces dernières ont l’obligation, depuis le vote de la loi fraude le 23 octobre 2018, de transmettre à l’administration fiscale (article 242 bis, CGI), au plus tard au 31 janvier de l’année qui suit les transactions, certaines informations relatives à leurs utilisateurs : les éléments qui identifient l’utilisateur, son statut de particulier ou professionnel, le nombre et le montant brut des transactions réalisées pendant l’année civile précédente, et même les coordonnées du compte bancaire où ont été versés les fonds.

    Pour 2024, l’administration fiscale envisage un engagement accru des contrôles fiscaux grâce au data mining : 50 % des contrôles des professionnels et 36 % des contrôles des particuliers. Cependant, l’IA « n’a débouché que sur 9 à 13 % des résultats financiers jusqu’en 2022[8] ».

    III) Entraîner l’outil d’IA

    Pour entraîner l’outil d’IA, il est nécessaire d’être en possession de très nombreuses données (on parle de « jeux de données ») lors de la phase d’apprentissage (entraînement). Grâce à celles-ci, le cerveau du robot développe des réflexes qui deviendront des règles. C’est grâce à des règles et plus largement des modèles que les IA fonctionnent.

    L’administration fiscale néerlandaise, pourtant reconnue dans la lutte contre la fraude fiscale et sociale, avait malheureusement oublié ce principe, en souhaitant vouloir lutter contre la fraude aux prestations sociales. En 2019, les autorités fiscales néerlandaises avaient utilisé un algorithme d’auto-apprentissage pour créer des profils de risque dans le but de détecter la fraude aux allocations de garde d’enfants. Des dizaines de milliers de foyers furent victimes. Les recherches menées par l’administration fiscale elle-même ont montré que le personnel avait pour instruction de fonder le risque de fraude sur des éléments tels que la nationalité des individus. Le jeu de données était dès lors biaisé, dès le début, par les critères du profil de risque élaborés par l’administration fiscale. L’équité algorithmique (autrement dit, l’absence de tout favoritisme ou discrimination à l’égard d’un individu ou d’un groupe formé par des caractéristiques innées ou acquises) est primordiale en vue d’éviter tout biais algorithmique.

    C’est une difficulté particulièrement importante que celle d’assurer que le contribuable est en mesure de comprendre mais aussi de prévoir les recherches effectuées à son encontre. Juger a posteriori de l’opportunité légale du moyen utilisé pour la recherche de l’infraction en fonction des faits mis en évidence ne constitue pas un système acceptable. Il est évident que la lutte contre la fraude est une priorité démocratique, mais l’absence de contrôle humain réellement efficace, faute de moyens suffisants en personnel, sur le ciblage et sur la décision de poursuite pose des difficultés qui interdisent de laisser la machine choisir.

    En France, la part décevante de l’IA au contrôle fiscal dans le cadre du datamining (qui, en 2022, représente plus de la moitié des contrôles fiscaux « externes, comme les vérifications de comptabilité, mais seulement 13,69 % des résultats financiers) pourrait s’expliquer par le fait « qu’elle repose sur des modèles relativement basiques, bien loin de l’état de l’art de la technologie (sans même parler d’IA générative), et loin de ce qui se fait couramment dans les grandes entreprises pour répondre à leurs besoins métiers, allant de la prospection pétrolière aux services financiers, en passant par la publicité en ligne ou la modélisation des risques sur une infrastructure en réseau (SNCF, RTE, etc.) [9]».

    Dans cet exemple, il ne faut pas cibler l’outil d’IA mais plutôt le personnel de l’administration fiscale.

    IV) Nouvelles technologies et recouvrement fiscal

    Pour réduire la fraude fiscale, un couple « IA + expertise métier » est primordial.

    La première étape serait d’utiliser la blockchain.

    La blockchain est une chaîne de blocs ou conteneurs numériques, dans lesquels sont stockées des informations de toute nature. On peut dire que c’est un registre numérique inaltérable, bâti sur la base d’un consensus entre les participants dans toutes les étapes ou séquences d’une opération.

    Pour garantir la fiabilité et l’intégrité des données, la blockchain fait appel à des « mineurs », choisis parmi ses intervenants (institutions financières, personnes morales, personnes physiques, etc.) qui, suivant des règles prédéfinies valident les informations avant de les inscrire (pour toujours) sur la blockchain. Les blocs d’informations, horodatés et ajoutés à la chaîne, ne peuvent plus être modifiés.

    Généralement, il existe trois types de membres :

    • Les utilisateurs : ils ne font qu’effectuer des paiements et les recevoir. Ils ne s’intéressent pas aux algorithmes et à la création de nouveaux blocs. Lorsqu’ils doivent effectuer des transactions, ils payent des frais de minage.
    • Les nœuds : ils reçoivent les informations des utilisateurs et les transmettent. Ils s’assurent que le système reste décentralisé
    • Les mineurs : ils calculent afin de trouver le prochain bloc et d’enregistrer les transactions qui seront obtenues dans celui-ci. Une fois qu’un mineur a réussi cette opération, il reçoit les frais de minage des transactions enregistrées dans le nouveau bloc découvert.

    Les participants au système sont appelés « nœuds » et sont connectés entre eux de manière distribuée. Tous les intervenants contribuent à l’enrichissement de la base de données.

    La blockchain serait utilisée en vue de créer un registre numérique européen accessible à l’ensemble des administrations fiscales nationales et répertoriant l’ensemble des transactions.

    Créer un registre numérique international semble difficilement réalisable, du fait de la pression politique et des signatures trop récentes des conventions d’assistance administrative en matière fiscale. Toutefois, une autre solution consisterait à ce que la gestion  de cette blockchain et du registre afférent puisse être confiée à une organisation internationale ad hoc, dont la gouvernance associerait les États et les institutions financières privées, et dont les statuts garantiraient son indépendance (mandat clair, possibles immunités, transparence de fonctionnement, caractère non renouvelable des fonctions dirigeantes, etc). Un tel registre offrirait des garanties d’information fiable et aisément accessible tant pour les États que pour les institutions privées, d’une nature différente des structures de règlement transnationaux actuellement sur ce marché telles que SWIFT ou le CIPS. En conséquence, les législations fiscales nationales pourraient prévoir qu’en cas de contrôles fiscaux et d’éventuels redressements, une présomption de régularité et de fiabilité des informations afférentes (charge de la preuve aménagée), s’applique en faveur des transactions réalisées par cette organisation internationale ad hoc.

    Par ailleurs, il serait impératif que les sociétés qui choisissent de ne pas participer à ce processus de vérification fiscale assument une charge de preuve aménagée, qui les contraindrait à démontrer la conformité de leurs opérations. Ce cadre novateur, en établissant des normes claires et des obligations précises, pourrait ainsi favoriser une culture de la transparence tout en dissuadant les comportements évasifs.

    Utiliser la blockchain plutôt qu’un registre offre plusieurs avantages significatifs, notamment en termes de sécurité, de transparence et de décentralisation. Contrairement à un registre traditionnel qui peut être facilement modifié ou falsifié par une entité centrale, la blockchain repose sur un système de consensus distribué, rendant toute tentative de manipulation presque impossible sans l’accord de la majorité des participants. De plus, chaque transaction est enregistrée de manière chronologique et immuable, garantissant ainsi une traçabilité complète et vérifiable. Cela accroît la confiance entre les parties prenantes, car les informations sont accessibles à tous et ne dépendent pas d’une autorité unique. La blockchain apporte donc  une robustesse et une confiance accrues qui dépassent les capacités d’un simple registre.

    Néanmoins, il convient d’adopter une perspective réaliste, car la blockchain présente également certaines limites. En effet, certains pourraient considérer qu’il est plus complexe d’obtenir l’accord de tous les États sur une blockchain que sur des traités ou des conventions fiscales. Par ailleurs, la blockchain entraîne une consommation d’énergie supérieure, ce qui n’est pas le cas d’un registre traditionnel. Enfin, les coûts liés à la création et à la gestion d’une blockchain peuvent s’avérer élevés, alors qu’un registre classique peut se révéler moins onéreux.

    La deuxième étape consisterait à utiliser le Machine Learning, qui permettrait d’appuyer les administrations fiscales nationales et de repérer tous les actifs non déclarés par les contribuables.

    Ne l’oublions pas, le contrôle fiscal n’est pas réalisé au hasard et exige une phase préalable de recueil d’informations. Pour la DGFiP, il s’agit notamment de faire émerger les insuffisances de déclaration de recettes, les domiciliations fictives, les fraudes à la TVA (Carrousels), etc. Les services de l’administration fiscale peuvent utiliser plusieurs types de procédures de collecte d’informations : le droit de communication qui permet d’obtenir des documents auprès d’entreprises, d’administrations ou d’organismes divers et le relevé d’informations comptables ; le droit d’enquête qui permet de rechercher les infractions aux règles de facturation auxquelles sont soumis les assujettis à la TVA ou encore la procédure de visite et de saisie. La mission de recherche de l’information est donc primordiale.

    L’utilisation de l’intelligence artificielle et du data mining dans la lutte contre la fraude à la TVA apparaît particulièrement pertinente, bien qu’elle soit moins efficace pour analyser des montages fiscaux complexes. Avec notre proposition, nous déplaçons effectivement le curseur vers l’intelligence artificielle. Cependant, toute application de cette technologie dépendra du choix des jeux de données d’entraînement et de test, ce qui impliquera un biais de sélection initial déterminé par l’expertise métier. Néanmoins, il sera possible d’établir une forme d’éthique algorithmique afin de minimiser ces biais..

    Le machine learning présente des avantages notables par rapport au data mining. Tout d’abord, il se caractérise par sa précision et son adaptabilité. En apprenant en continu à partir de nouvelles données, il est en mesure d’affiner ses prédictions et s’avère particulièrement efficace dans la détection de la fraude fiscale.

    De surcroît, grâce à des algorithmes avancés, le machine learning permet une analyse prédictive, offrant la possibilité d’anticiper les comportements futurs des contribuables. Cela aide la DGFiP à prévoir les problèmes et à adopter des mesures proactives. Dans un contexte où les volumes de données sont colossaux, le machine learning démontre également une capacité supérieure à traiter ces vastes quantités d’informations de manière plus rapide et efficace que les méthodes de data mining traditionnelles.

    En outre, les algorithmes de machine learning sont capables de déceler des relations et des schémas complexes dans les données, souvent inaccessibles aux méthodes plus simples. Ce niveau de sophistication se traduit également par l’automatisation de nombreuses tâches analytiques, réduisant ainsi le besoin d’interventions manuelles et améliorant l’efficacité opérationnelle.

    Enfin, les modèles de machine learning peuvent être adaptés en fonction des différents types de contribuables ou de situations fiscales spécifiques, permettant ainsi une approche plus ciblée et pertinente.

    Cette proposition nécessite bien évidemment les efforts de toutes les administrations, une adaptation des cadres normatifs à cette nouvelle pratique ainsi qu’une montée en compétences des équipes de la DGFiP sur ces nouveaux sujets (data scientists, data engineers notamment).

    Un premier obstacle pourrait venir du manque de coopération de certains pays et du fait que chaque pays est souverain de sa politique fiscale (le fameux « secret fiscal »). Mais des mesures contre-incitatives pourraient être, à ce moment, mises en place contre les pays récalcitrants.

    Le deuxième obstacle, d’ordre juridique, a été soulevé en septembre 2021, par le ministère de l’Économie, des Finances et de la Souveraineté industrielle et numérique de France.

    A ce moment, l’exécutif français a demandé son avis à la CNIL  en charge de ces sujets et celle-ci s’est montrée moins enthousiaste que les autorités fiscales. Tout en acceptant l’importance de la recherche d’infractions et constatant que le projet contenait certaines garanties sur le traitement non automatisé et le nombre limité d’infractions qui seraient sanctionnées, la CNIL a mentionné expressément des réserves afin de préserver un équilibre entre l’objectif de lutte contre la fraude fiscale et le respect des droits et liberté de personnes.  La CNIL reste toujours très sensible à la question des libertés. Encore récemment, l’institution a réitéré ses commentaires relatifs au contrôle strict des données collectées en fonction de leur destination (lutte exclusive contre la fraude / aide à la régularisation des erreurs). Cette analyse toujours détaillée des propositions de l’exécutif est le minimum pour assurer une forme de proportionnalité des dispositifs. Elle n’empêche pas et ne doit pas empêcher un contrôle approfondi du juge.

    Il est noté de ce point de vue que le contrôle du législateur est indispensable et que la proportionnalité doit être maintenue. Ainsi, seules les données nécessaires à la détection de fraude doivent être utilisées et le contribuable doit pouvoir accéder aux contenus, aux traitements et à la nature des données. La question de la collecte de données, qui ne permettrait pas de mettre en évidence les infractions ciblées au départ mais qui pourrait se révéler utile pour mettre en évidence d’autres infractions inconnues lors de la collecte, pose une autre question essentielle comparable à celle qui avait animée la communauté internationale au sujet des opérations de phishing[10] auprès de banques pour rechercher des comptes non déclarés. La question est ici encore plus problématique si lors de la mise en place de la recherche, on n’est pas en mesure de justifier le recours à l’intelligence artificielle pour rechercher des infractions possiblement identifiées au préalable. Cet outil est plus intrusif et moins contrôlé que l’humain.

    Cette technologie ne remplacera pas l’expertise des agents de la DGFiP. Anticiper des suppressions d’emplois du fait de cet outil apparaît risqué. Si poursuivre l’investissement dans cette technologie  est  souhaitable , elle n’est pas une raison suffisante pour poursuivre la réduction des personnels du contrôle fiscal. C’est l’expertise humaine qui alimente l’algorithme, ne l’oublions pas. Et l’algorithme ne peut être qu’un outil au service du travail humain. Rappelons-le, un inspecteur de la DGFiP coûte entre 50.000 et 100.000 euros par an selon son profil mais, si l’on considère les résultats du contrôle fiscal, « rapporte » 1.500.000 euros. Il est de facto hors de question de faire du contrôle fiscal automatisé.

    Appliquons l’expression « Quand on veut, on peut ». Si nous souhaitons réduire la fraude fiscale de notre quotidien, cela nécessite la mobilisation et l’intégrité de chacun.

    [1] Solidaires-Finances publiques, Évasion et fraudes scales, contrôle scal, janvier  2013, http://archives.solidairesfinancespubliques.fr/gen/cp/dp/dp2013/120122_Rapport_fraude_evasionscale.pdf ; Solidaires-Finances publiques, « Quand la baisse des moyens du contrôle scal entraîne une baisse de sa présence… », septembre 2018, https://solidairesnancespubliques.org/le-syndicat/nos-publications/999-rapport-quand-la-baisse-des-moyens-du-controle-fiscal-entraine-une-baisse-de-sa-presence-chute-inquietante-de-la-couverture-du-tissu-economique-et-scal/download.htm

    [2] https://institut-rousseau.fr/quand-la-politique-dausterite-conduit-a-degrader-volontairement-le-controle-fiscal-et-lefficacite-de-la-lutte-contre-la-fraude/

    [3] F. Perrotin, Ciblage des contrôles fiscaux et datamining, Les petites affiches, n° 101, 20 mai 2020

    [4] T. Carcenac et C. Nougein, L’adéquation des moyens humains et matériels aux enjeux du contrôle fiscal : une évaluation difficile, une stratégie à clarifier, Rapport du Sénat, juillet 2020.

    [5] Délibération n° 2019-114 du 12 septembre 2019 portant avis sur le projet d’article 9 du projet de loi de finances pour 2020.

    [6] Arrêté du 11 mars 2022 portant autorisation par la direction générale des finances publiques du traitement de données à caractère personnel dénommé GALAXIE, JORF, n° 0076 du 31 mars 2022, texte n° 85.

    [7] CA Paris, 5 décembre 2018, n° 18/04953.

    [8] Drezet V. & Gath O., Autour d’impôt : L’impôt et la justice fiscale et sociale expliqués à un·e ami·e qui n’aime pas l’impôt et n’y comprend rien, Syllepse, mars 2024.

    [9] Délégation à la prospective du Sénat, « L’IA et l’avenir du service public », rapport n° 491, 2023-2024.

    [10] L’hameçonnage (phishing en anglais) est une technique frauduleuse destinée à leurrer l’internaute pour l’inciter à communiquer des données personnelles (comptes d’accès, mots de passe…) et/ou bancaires en se faisant passer pour un tiers de confiance.

      Partager

      EmailFacebookTwitterLinkedInTelegram

      Télécharger en pdf

      Laissez-nous votre email pour télécharger nos travaux

      Télécharger en pdf

      Laissez-nous votre email pour télécharger nos travaux

      Télécharger en pdf

      Laissez-nous votre email pour télécharger nos travaux

      Télécharger en pdf

      Laissez-nous votre email pour télécharger nos travaux