IA souveraine

Offre IA souveraine intégrée

Offre d'intelligence artificielle (modèles, API, services) hébergée et opérée sur infrastructure souveraine, sans dépendance à un fournisseur étranger.

0 acteurs vérifiés sur ce critère

47 acteurs qui le revendiquent

Définition

L'IA souveraine désigne une offre d'intelligence artificielle (modèles, API d'inférence, services d'assistance) hébergée et opérée sur infrastructure souveraine, sans dépendance opérationnelle ni juridique à un fournisseur étranger.

Critères structurels d'une IA souveraine :

Modèles auto-hébergés sur GPU localisés en France (pas d'API OpenAI, Anthropic, Google).
Pas de remontée de données vers un service tiers (logs, télémétrie, fine-tuning des modèles).
Stack technique maîtrisée : choix du modèle, du pipeline d'inférence, des bibliothèques.
Conformité RGPD documentée sur l'usage des données client pour l'IA.

Une « IA souveraine » bien conçue permet d'utiliser des LLM (Mistral, Llama, Qwen, etc.) dans des cas d'usage métier sans exposer les données traitées hors du périmètre certifié.

Pourquoi c'est important pour un hébergeur HDS

L'usage d'IA sur des données de santé pose deux problèmes majeurs avec les API LLM commerciales (OpenAI, Anthropic, Google) :

Transit des données : la donnée doit quitter le périmètre HDS pour être traitée par l'API. Cela rompt la chaîne de confiance certifiée.
Juridiction extraterritoriale : ces APIs sont opérées par des entreprises US — exposition au CLOUD Act, au FISA 702, et incertitudes RGPD post-Schrems II.

Une IA souveraine intégrée au socle HDS résout ces deux problèmes. Elle permet :

OCR de documents médicaux (ordonnances, comptes-rendus) sans envoi à Google Vision ou GPT-4o-vision.
Synthèse de dossiers patient sans envoi à GPT-4 / Claude.
Aide au codage CIM-10 / CCAM sans recourir à une API externe.
Recherche d'antériorité dans le DPI via RAG sans exposition externe.
Assistants conversationnels internes (FAQ pharma, hotline SOC) sans fuite vers OpenAI.

Comment ce critère est attribué dans le comparateur

✓ Vérifié : page dédiée à l'offre IA sur le site de l'hébergeur, mentionnant explicitement l'hébergement local et l'absence de transit vers une API externe. Liste des modèles déployés et de leur infrastructure.
◐ Revendiqué : mention « IA souveraine » ou « IA française » sans détail technique vérifiable.
? Non documenté : pas d'offre IA mentionnée publiquement.

⚠️ Une « plateforme IA » qui appelle en sous-main une API étrangère n'est pas souveraine. La question pertinente à poser au fournisseur : « où s'exécute l'inférence et quelles données sortent du périmètre HDS ? ».

Pour quel profil c'est critique

Profil	Niveau d'exigence
Hôpital avec projets IA cliniques	Critique
Éditeur SaaS santé intégrant de l'IA	Critique — chaîne de confiance vers vos clients
Recherche médicale utilisant l'IA	Critique — nominatif + sensibilité éthique
Pharma R&D	Critique — propriété intellectuelle
Médecine de ville	Souhaitable — outils IA d'aide au diagnostic
Mutuelle / Assurance	Important — détection fraude, sourcing

Composants d'une offre IA souveraine

Briques techniques typiques :

Cluster GPU : H100, L40S, A100 ou — pour des cas d'usage moins exigeants — V100. Localisé en datacenter HDS-certifié.
Serveurs d'inférence : vLLM, TGI, llama.cpp, SGLang selon le modèle et la charge.
API compatible OpenAI (façade LiteLLM ou équivalent) pour faciliter l'intégration des applications existantes.
Pipeline RAG : indexation, embedder local (bge-m3, nomic-embed-text), vector store (Qdrant, Milvus, pgvector), reranker.
Gouvernance des prompts : journalisation, audit, gestion des secrets, ségrégation par client.
Modèles : Mistral (Large 2, Small 3), Llama 3.x, Qwen 2.5 / 3.x. Choix selon perf vs taille.

Coût d'investissement matériel indicatif : 100 k€ à plusieurs millions selon la dimension.

Plus-value vs coût

Pour un hébergeur, monter une offre IA souveraine est un investissement matériel et de compétences significatif. Mais c'est aussi le vecteur de différenciation le plus puissant de 2025-2027 : le marché va massivement adopter l'IA générative, et les acteurs santé voudront le faire sans transmettre leurs données aux GAFAM.

Pour les clients, vérifier la souveraineté de l'IA proposée est important si vous prévoyez de l'utiliser sur de la donnée santé. C'est un critère qui prend de la valeur année après année.

FAQ

Mistral Le Chat est-il souverain ? Mistral AI est une entreprise française. Cependant, l'API Mistral hébergée par Mistral n'est pas HDS-certifiée (à la date de cette fiche). Pour une intégration dans un workflow HDS, il faut déployer Mistral sur infrastructure HDS (auto-hébergement chez vous ou chez votre hébergeur HDS).

Quels modèles open-weights pour la santé ? Mistral Small 3 / Large 2 (français), Llama 3.x (anglophone fort), Qwen 2.5 / 3.x (multilingue fort, MoE efficaces). Pour la médecine spécialisée : Meditron, PubMedBERT, BioMistral.

Une IA souveraine peut-elle aussi servir d'OCR ? Oui. Les LLM multimodaux (Qwen-VL, Pixtral, GPT-4V en local impossible mais équivalents open) intègrent vision + texte. Cela évite d'utiliser Tesseract + LLM séparés.

Que coûte le fine-tuning sur une infra souveraine ? Très variable : LoRA quelques heures sur 4-8 GPU pour un usage métier, fine-tune complet plusieurs jours sur cluster H100. Beaucoup d'usages se passent de fine-tune en utilisant du RAG bien architecturé.

Glossaire

LLM : Large Language Model — modèle de langage à grande échelle (GPT, Claude, Llama, Mistral, Qwen…).
RAG : Retrieval Augmented Generation — combinaison recherche + génération.
MoE : Mixture of Experts — architecture LLM où une partie seulement des paramètres est active par token.
Auto-hébergement : déploiement du modèle sur infrastructure du fournisseur (vs API externe).

Hébergeurs satisfaisant ce critère

Lecture des trois états. ✓ Vérifié = source publique citée (page officielle, registre ANS / ANSSI / Pappers / RIPE / PeeringDB). ◐ Revendiqué = mention publique partielle, sans verbatim ferme à la date de cet audit. ◔ Démarche en cours = engagement public daté. L'absence de mention n'implique pas l'absence du service — voir notre méthodologie d'équité.