IA et data science décentralisée : reprendre le contrôle ou changer de dépendance ?
Date Published

# IA et data science décentralisée : reprendre le contrôle ou changer de dépendance ?
*En 2026, les outils d'IA générative ont profondément reconfiguré le travail des équipes data. Assistants de code, agents autonomes d'analyse, pipelines auto-générés… la data science s'est partiellement décentralisée, sortant des mains des seuls experts pour irriguer les équipes métier. Une révolution productive, dit-on. Mais du point de vue d'un DSI européen, la question n'est pas « est-ce que ça marche ? » — c'est « à qui profite vraiment ce mouvement ? » Nous avons interrogé le DSI d'une ETI industrielle française, en poste depuis douze ans, qui gère un SI hybride et suit de près les enjeux de souveraineté numérique.*
RiffLab Media — On entend beaucoup dire que l'IA « démocratise » la data science. Dans vos équipes, c'est quoi la réalité concrète en 2026 ?
La réalité, c'est que mes analystes métier font aujourd'hui des choses qu'ils n'auraient pas pu faire seuls il y a trois ans. Ils génèrent des requêtes SQL, ils construisent des visualisations, ils interrogent des datasets sans passer par un data engineer. Sur le papier, c'est un gain de productivité indéniable. Mais dès qu'on gratte un peu, on voit que cette « démocratisation » repose sur une infrastructure qui, dans la plupart des cas, appartient à des acteurs américains. Les modèles tournent sur des clouds américains, les données partent en transit vers des API américaines, et les équipes ne le savent même pas toujours. La décentralisation des usages ne s'est pas accompagnée d'une décentralisation du pouvoir. C'est ça qui me préoccupe.
Vous dites que vos équipes « ne le savent pas toujours ». C'est un problème de gouvernance interne ou un problème structurel lié aux outils eux-mêmes ?
Les deux, franchement. Structurellement, les outils d'IA embarqués dans les suites bureautiques et analytiques dominantes sont conçus pour être transparents — au sens où l'utilisateur n'a pas à se poser de question sur ce qui se passe derrière. C'est du bon design UX pour l'utilisateur final, mais c'est catastrophique pour la gouvernance des données. Quand un analyste utilise un assistant IA intégré à son outil de BI pour « résumer les tendances du trimestre », il ne se demande pas si cette requête transite par un datacenter hors UE. Et moi, je ne peux pas passer ma vie à auditer chaque geste de chaque collaborateur. Donc oui, il y a un problème de gouvernance interne — on a dû retravailler nos politiques d'usage. Mais ce problème existe parce que les acteurs américains ont délibérément conçu des produits où la friction est minimale pour l'utilisateur et maximale pour le DSI qui veut garder le contrôle.
Justement, sur l'outillage — est-ce qu'il existe aujourd'hui des alternatives européennes crédibles pour faire tourner ces workflows de data science IA en interne ou sur des infrastructures souveraines ?
Oui, et c'est là où la situation a vraiment évolué en 2025-2026. On n'est plus dans le désert. Des modèles de langage ouverts, entraînables et déployables sur site ou sur des clouds certifiés européens existent maintenant avec des niveaux de performance qui permettent de couvrir une large partie des cas d'usage analytiques courants. Ce n'est pas la même puissance brute que les grands modèles fermés américains pour des tâches très complexes — soyons honnêtes. Mais pour interroger un entrepôt de données, générer un pipeline de transformation, documenter du code ou produire un rapport structuré, c'est largement suffisant. Le vrai frein aujourd'hui, ce n'est plus technique, c'est organisationnel et politique. Les équipes se sont habituées aux outils dominants. Il y a une inertie réelle. Et les éditeurs américains ont très bien compris que la bataille se joue sur l'adoption, pas sur la performance pure.
On va poser la question qui fâche : est-ce que la décentralisation par l'IA ne crée pas simplement un nouveau vecteur de shadow IT, encore plus difficile à contrôler que l'ancien ?
Oui. Sans ambiguïté. Le shadow IT de première génération, c'était Dropbox et Slack utilisés sans validation. Vous pouviez identifier les flux, bloquer les applications, former les équipes. Le shadow IT IA, c'est beaucoup plus pernicieux parce qu'il est embedded. Il est dans des extensions de navigateur, dans des plugins d'outils que vous avez vous-même achetés, dans des fonctionnalités activées par défaut que vous n'avez pas vue arriver. J'ai découvert il y a six mois qu'un outil de reporting que nous utilisions avait activé une fonction d'« assistance intelligente » dans une mise à jour silencieuse. Cette fonction envoyait des extraits de données vers une API externe pour générer des suggestions. Rien d'illégal dans leurs CGU révisées — qu'évidemment personne n'avait relues. Voilà la réalité du terrain. La décentralisation de la data science par l'IA, si elle n'est pas encadrée de façon très précise, c'est une surface d'exposition considérable.
Face à ça, concrètement, qu'est-ce que vous avez mis en place pour garder la maîtrise sans bloquer la productivité ?
On a travaillé sur trois axes. Le premier, c'est la cartographie des flux de données générés par les outils IA — pas seulement les applications que vous achetez, mais les features d'IA dans les outils existants. C'est un travail ingrat, mais il est indispensable. Le deuxième axe, c'est ce qu'on appelle en interne la « règle du local d'abord » : pour tout nouveau besoin data science impliquant de l'IA, on évalue d'abord ce qui peut tourner sur notre infrastructure ou sur un cloud certifié selon le référentiel SecNumCloud avant de regarder ailleurs. Ce n'est pas dogmatique — si la solution souveraine ne couvre pas le besoin, on le documente et on fait un arbitrage conscient. Mais au moins, le réflexe est inversé par rapport à ce qu'il était. Le troisième axe, c'est la formation des équipes métier — pas sur la technique, mais sur la question « où vont mes données quand je clique ici ? ». Ça peut sembler basique, mais c'est transformateur.
Dernier mot — est-ce que vous pensez que les DSI européens ont collectivement pris la mesure de ce que représente ce mouvement, ou est-ce qu'on est encore dans le déni ?
On est dans une situation schizophrène. Dans les conférences, tout le monde parle de souveraineté, de RGPD, de dépendance stratégique. Et puis on rentre au bureau, et les équipes déploient des agents IA hébergés on ne sait où parce que c'est pratique et que le management a vu une démo impressionnante. Le discours est là. Les actes sont en retard. Ce qui me frappe, c'est que la fenêtre d'opportunité pour construire une vraie alternative européenne est ouverte en ce moment — les briques technologiques existent, les financements publics sont là, la prise de conscience politique est réelle. Mais si les DSI ne créent pas la demande en interne, si on continue d'acheter le chemin de moindre résistance par défaut, on va rater le coche. Et dans cinq ans, on se retrouvera avec un écosystème IA encore plus concentré qu'aujourd'hui, et encore plus difficile à quitter. La décentralisation de la data science, c'est une vraie opportunité de reprendre le contrôle — mais seulement si on décide activement de la saisir. Personne ne va la servir sur un plateau.
*Propos recueillis par la rédaction de RiffLab Media.*
Cet article vous a été utile ?
Recevez chaque vendredi nos analyses sur les alternatives souveraines SaaS. Pas de spam.
Pas de spam. Désinscription en un clic. Données hébergées en Europe.