﻿# Offre IA souveraine intégrée

> Catégorie : **IA souveraine** · Slug : `ia-souveraine` · Source canonique : <https://www.hebergeurs-de-donnees-de-sante.fr/criteres/ia-souveraine/>

**Définition courte** : Offre d'intelligence artificielle (modèles, API, services) hébergée et opérée sur infrastructure souveraine, sans dépendance à un fournisseur étranger.

## Statistiques sur les 404 hébergeurs HDS

- ✓ Vérifiés sur source publique : **0**
- ◆ Revendiqués sur source publique : **47**

## Définition

L'**IA souveraine** désigne une offre d'intelligence artificielle (modèles, API d'inférence, services d'assistance) **hébergée et opérée sur infrastructure souveraine**, sans dépendance opérationnelle ni juridique à un fournisseur étranger.

Critères structurels d'une IA souveraine :

1. **Modèles auto-hébergés** sur GPU localisés en France (pas d'API OpenAI, Anthropic, Google).
2. **Pas de remontée de données** vers un service tiers (logs, télémétrie, fine-tuning des modèles).
3. **Stack technique maîtrisée** : choix du modèle, du pipeline d'inférence, des bibliothèques.
4. **Conformité RGPD documentée** sur l'usage des données client pour l'IA.

Une « IA souveraine » bien conçue permet d'utiliser des LLM (Mistral, Llama, Qwen, etc.) dans des cas d'usage métier sans exposer les données traitées hors du périmètre certifié.

## Pourquoi c'est important pour un hébergeur HDS

L'usage d'IA sur des données de santé pose deux problèmes majeurs avec les API LLM commerciales (OpenAI, Anthropic, Google) :

1. **Transit des données** : la donnée doit quitter le périmètre HDS pour être traitée par l'API. Cela rompt la chaîne de confiance certifiée.
2. **Juridiction extraterritoriale** : ces APIs sont opérées par des entreprises US — exposition au CLOUD Act, au FISA 702, et incertitudes RGPD post-Schrems II.

Une IA souveraine intégrée au socle HDS résout ces deux problèmes. Elle permet :
- **OCR de documents médicaux** (ordonnances, comptes-rendus) sans envoi à Google Vision ou GPT-4o-vision.
- **Synthèse de dossiers patient** sans envoi à GPT-4 / Claude.
- **Aide au codage CIM-10 / CCAM** sans recourir à une API externe.
- **Recherche d'antériorité** dans le DPI via RAG sans exposition externe.
- **Assistants conversationnels** internes (FAQ pharma, hotline SOC) sans fuite vers OpenAI.

## Comment ce critère est attribué dans le comparateur

- **✓ Vérifié** : page dédiée à l'offre IA sur le site de l'hébergeur, mentionnant explicitement l'hébergement local et l'absence de transit vers une API externe. Liste des modèles déployés et de leur infrastructure.
- **◐ Revendiqué** : mention « IA souveraine » ou « IA française » sans détail technique vérifiable.
- **? Non documenté** : pas d'offre IA mentionnée publiquement.

⚠️ Une « plateforme IA » qui appelle en sous-main une API étrangère **n'est pas souveraine**. La question pertinente à poser au fournisseur : « où s'exécute l'inférence et quelles données sortent du périmètre HDS ? ».

## Pour quel profil c'est critique

| Profil | Niveau d'exigence |
|---|---|
| Hôpital avec projets IA cliniques | **Critique** |
| Éditeur SaaS santé intégrant de l'IA | **Critique** — chaîne de confiance vers vos clients |
| Recherche médicale utilisant l'IA | **Critique** — nominatif + sensibilité éthique |
| Pharma R&D | **Critique** — propriété intellectuelle |
| Médecine de ville | **Souhaitable** — outils IA d'aide au diagnostic |
| Mutuelle / Assurance | **Important** — détection fraude, sourcing |

## Composants d'une offre IA souveraine

Briques techniques typiques :

1. **Cluster GPU** : H100, L40S, A100 ou — pour des cas d'usage moins exigeants — V100. Localisé en datacenter HDS-certifié.
2. **Serveurs d'inférence** : vLLM, TGI, llama.cpp, SGLang selon le modèle et la charge.
3. **API compatible OpenAI** (façade LiteLLM ou équivalent) pour faciliter l'intégration des applications existantes.
4. **Pipeline RAG** : indexation, embedder local (bge-m3, nomic-embed-text), vector store (Qdrant, Milvus, pgvector), reranker.
5. **Gouvernance des prompts** : journalisation, audit, gestion des secrets, ségrégation par client.
6. **Modèles** : Mistral (Large 2, Small 3), Llama 3.x, Qwen 2.5 / 3.x. Choix selon perf vs taille.

Coût d'investissement matériel indicatif : 100 k€ à plusieurs millions selon la dimension.

## Plus-value vs coût

Pour un hébergeur, monter une offre IA souveraine est un investissement matériel et de compétences significatif. Mais c'est aussi le **vecteur de différenciation le plus puissant de 2025-2027** : le marché va massivement adopter l'IA générative, et les acteurs santé voudront le faire sans transmettre leurs données aux GAFAM.

Pour les clients, vérifier la souveraineté de l'IA proposée est important si vous prévoyez de l'utiliser sur de la donnée santé. C'est un critère qui prend de la valeur année après année.

## FAQ

**Mistral Le Chat est-il souverain ?**
Mistral AI est une entreprise française. Cependant, l'API Mistral hébergée par Mistral n'est pas HDS-certifiée (à la date de cette fiche). Pour une intégration dans un workflow HDS, il faut **déployer Mistral sur infrastructure HDS** (auto-hébergement chez vous ou chez votre hébergeur HDS).

**Quels modèles open-weights pour la santé ?**
Mistral Small 3 / Large 2 (français), Llama 3.x (anglophone fort), Qwen 2.5 / 3.x (multilingue fort, MoE efficaces). Pour la médecine spécialisée : Meditron, PubMedBERT, BioMistral.

**Une IA souveraine peut-elle aussi servir d'OCR ?**
Oui. Les LLM multimodaux (Qwen-VL, Pixtral, GPT-4V en local impossible mais équivalents open) intègrent vision + texte. Cela évite d'utiliser Tesseract + LLM séparés.

**Que coûte le fine-tuning sur une infra souveraine ?**
Très variable : LoRA quelques heures sur 4-8 GPU pour un usage métier, fine-tune complet plusieurs jours sur cluster H100. Beaucoup d'usages se passent de fine-tune en utilisant du RAG bien architecturé.

## Glossaire

- **LLM** : Large Language Model — modèle de langage à grande échelle (GPT, Claude, Llama, Mistral, Qwen…).
- **RAG** : Retrieval Augmented Generation — combinaison recherche + génération.
- **MoE** : Mixture of Experts — architecture LLM où une partie seulement des paramètres est active par token.
- **Auto-hébergement** : déploiement du modèle sur infrastructure du fournisseur (vs API externe).

## Hébergeurs satisfaisant ce critère

### ◆ Revendiqué sur source publique (47)

- [ADISTA](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/adista/)
- [AIRON TELEMATICA](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/airon-telematica/)
- [AKENES](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/akenes/)
- [ALPILINK CLOUD](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/alpilink-cloud/)
- [ALTER WAY](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/alter-way/)
- [ANTEMETA](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/antemeta/)
- [APX INTEGRATION EXERÇANT SOUS LA MARQUE COMMERCIALE AXIANS](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/apx-integration-exercant-sous-la-marque-commerciale-axians/)
- [AQUA RAY](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/aqua-ray/)
- [ARKHN](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/arkhn/)
- [ATOS](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/atos/)
- [AVENIR TELEMATIQUE (ATE)](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/avenir-telematique-ate/)
- [AXESS GROUPE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/axess-groupe/)
- [BERGER LEVRAULT](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/berger-levrault/)
- [BOUYGUES TELECOM BUSINESS SOLUTION](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/bouygues-telecom-business-solution/)
- [CELESTE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/celeste/)
- [CGI FRANCE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/cgi-france/)
- [CLEVER CLOUD](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/clever-cloud/)
- [CLOUD TEMPLE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/cloud-temple/)
- [EXODATA](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/exodata/)
- [FOLIATEAM](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/foliateam/)
- [GROUPE CONSTELLATION](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/groupe-constellation/)
- [GROUPE ITC](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/groupe-itc/)
- [GROUPE OCI](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/groupe-oci/)
- [Guardis](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/guardis/)
- [HEXANET](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/hexanet/)
- [ITINSELL CLOUD](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/itinsell-cloud/)
- [ITS INTEGRA](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/its-integra/)
- [KALANDA](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/kalanda/)
- [KLEE CONSEIL ET INTEGRATION](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/klee-conseil-et-integration/)
- [KOESIO CORPORATE TECHNOLOGIES](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/koesio-corporate-technologies/)
- [LECPAC-CONSULTING](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/lecpac-consulting/)
- [MAINCARE SOLUTIONS](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/maincare-solutions/)
- [NEXPUBLICA FRANCE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/nexpublica-france/)
- [NUMIH FRANCE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/numih-france/)
- [NUMSPOT](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/numspot/)
- [OCI OUEST](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/oci-ouest/)
- [ON X GROUPE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/on-x-groupe/)
- [OUTSCALE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/outscale/)
- [PARTITIO](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/partitio/)
- [PROGINOV](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/proginov/)
- [SCALAIR](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/scalair/)
- [SCALINGO](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/scalingo/)
- [SIGMA INFORMATIQUE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/sigma-informatique/)
- [SOPRA STERIA I2S](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/sopra-steria-i2s/)
- [STE INFORMATIQUE ET TELEMATIQUE CORSE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/ste-informatique-et-telematique-corse/)
- [TAS France](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/tas-france/)
- [UNITEL FRANCE](https://www.hebergeurs-de-donnees-de-sante.fr/hebergeurs/unitel-france/)

## Méthodologie et limites

- ✓ **Vérifié** = source publique citée (registre officiel, verbatim site acteur).
- ◆ **Revendiqué** = mention déclarative non vérifiée indépendamment.
- ◐ **En cours** = démarche datée publiquement.
- — **Non documenté** = information non trouvée. **N'implique pas l'absence du service**.
- Méthodologie complète : <https://www.hebergeurs-de-donnees-de-sante.fr/verification/>
- Équité Guardis vs concurrents : <https://www.hebergeurs-de-donnees-de-sante.fr/equite-methodologique/>

---

_Comparateur édité par Hasgard SARL. Publication éditoriale indépendante. Licence CC BY-SA 4.0._
_Variante Markdown brut : ajoutez `.md` à l'URL de n'importe quelle page._
