« Combien ça coûte ? » est la première question de tout projet RAG — et la plus mal cadrée. Un prix affiché ne dit rien s'il ignore le coût récurrent, la préparation du corpus ou le niveau de conformité. Ce guide décompose le coût réel d'un projet RAG : fourchettes, postes de coût, coût total de possession et retour sur investissement. Il prolonge notre guide du RAG en entreprise sur le volet budgétaire.
Les fourchettes de prix, pour fixer les idées
Les repères sont désormais assez établis sur le marché français :
- RAG simple (corpus unique, déploiement standard, peu d'intégrations) : de l'ordre de 10 000 à 25 000 €.
- RAG multi-sources avec gestion fine des droits d'accès, plusieurs corpus et intégrations métier : de 50 000 à 150 000 €.
- Pilote opérationnel sur un sous-ensemble de documents : souvent livrable en 2 à 4 semaines, pour un budget réduit servant à valider la valeur avant d'industrialiser.
Ces fourchettes sont un point de départ, pas un devis. L'écart entre 25 000 € et 150 000 € ne tient pas au « RAG » lui-même — la brique de base s'est banalisée — mais à tout ce qui l'entoure : sources, droits, déploiement et conformité. D'où l'intérêt de raisonner en postes de coût.
Les postes de coût d'un projet RAG
| Poste | Ce qu'il recouvre | Poids typique |
|---|---|---|
| Cadrage & audit | Cartographie du corpus, choix du cas d'usage, architecture cible | Faible mais déterminant |
| Préparation du corpus | Nettoyage, dédoublonnage, gestion des versions, structuration | Souvent sous-estimé |
| Indexation | Découpage, vectorisation (embeddings), base vectorielle | Moyen |
| Développement & intégration | Pipelines, interface, connexion aux outils (ERP, CRM, GED) | Élevé |
| Infrastructure / hébergement | Cloud mutualisé, cloud privé ou serveurs GPU on-premise | Variable selon déploiement |
| Sécurité & droits d'accès | RBAC/ABAC, journalisation, conformité | Élevé en multi-sources |
| Run & maintenance | Supervision, ré-indexation, évolutions, support | Récurrent (voir TCO) |
CAPEX vs OPEX : le coût ne s'arrête pas à la livraison
L'erreur de chiffrage la plus fréquente est de ne regarder que le coût de mise en place (CAPEX) en oubliant le coût récurrent (OPEX). Or un RAG vit : il consomme et il évolue. Les postes récurrents :
- Consommation des modèles : appels d'API facturés au token (cloud), ou amortissement et exploitation des serveurs GPU (on-premise).
- Hébergement et stockage : base vectorielle, sauvegardes, supervision.
- Ré-indexation : à chaque mise à jour documentaire, le corpus doit être réindexé pour rester à jour.
- Maintenance et évolutions : nouveaux corpus, ajustements de qualité, montée de version des modèles.
Sur trois ans, ce coût total de possession (TCO) peut égaler, voire dépasser, le coût initial. Le chiffrer dès le cadrage évite la mauvaise surprise budgétaire en année deux.
« Le prix d'un RAG ne se lit pas sur le devis de mise en place. Il se lit sur trois ans, consommation et ré-indexation comprises. »
Ce qui fait varier la facture
Cinq leviers expliquent l'essentiel de l'écart de prix :
- Le volume et l'état du corpus : un corpus propre et structuré coûte bien moins cher à préparer qu'un stock hétérogène à nettoyer.
- Le nombre de sources : un corpus unique est simple ; multiplier les sources (GED, intranet, bases métier) multiplie l'intégration.
- Le déploiement : le cloud mutualisé est le moins cher à démarrer ; le on-premise déplace le coût vers l'infrastructure.
- La gestion des droits : un accès uniforme est simple ; des droits fins par profil et par document alourdissent sécurité et tests.
- Le niveau de conformité : un environnement réglementé ajoute validation, audit trail et traçabilité.
Build, buy ou plateforme : trois modèles de coût
| Approche | Coût d'entrée | Limite |
|---|---|---|
| Faire soi-même (build) | Faible en licence, élevé en compétences | Difficile à industrialiser et à maintenir |
| Plateforme RAG-as-a-Service | Rapide, abonnement | Données chez le prestataire, peu verticalisé |
| Sur-mesure souverain | Plus élevé au départ | Le plus adapté aux données sensibles et au métier |
Le choix n'est pas qu'un arbitrage de prix : pour un corpus confidentiel ou réglementé, l'économie d'une plateforme mutualisée se paie en exposition des données. Le coût d'un déploiement souverain s'apprécie au regard de ce qu'il protège — un raisonnement que nous détaillons dans notre guide du RAG souverain et on-premise.
Le coût caché : la qualité du corpus
Le poste le plus systématiquement sous-estimé n'est pas la technologie, c'est la préparation documentaire. Un corpus truffé de doublons, de versions périmées et de formats hétérogènes dégrade la qualité des réponses — et oblige à des allers-retours coûteux. À l'inverse, investir en amont dans un corpus propre et versionné réduit le coût de tout le reste. La règle : garbage in, garbage out — la qualité des réponses ne dépassera jamais celle des documents indexés.
Calculer le ROI : une méthode simple
Le ROI d'un RAG se mesure principalement sur le temps gagné à retrouver et restituer l'information. Une méthode de cadrage simple :
- Estimez le temps passé par vos équipes à chercher de l'information dans la documentation (par semaine et par personne).
- Appliquez un gain réaliste (souvent significatif sur les tâches documentaires répétitives).
- Valorisez ce temps, comparez au coût annuel (CAPEX amorti + OPEX), et raisonnez sur un horizon de deux à trois ans.
Exemple illustratif : si vingt collaborateurs économisent chacun trois heures par semaine sur la recherche documentaire, le temps cumulé récupéré sur un an dépasse largement le coût d'un RAG simple. Au-delà du temps, les gains qualitatifs comptent : moins d'erreurs, meilleure traçabilité, montée en compétence accélérée — plus difficiles à chiffrer, mais réels.
Financer son RAG : le Diag Data IA de Bpifrance
Côté financement, le Diag Data IA de Bpifrance (programme IA Booster France 2030) finance l'intervention d'un expert agréé pour prioriser vos cas d'usage IA, dont le RAG : 13 000 € HT financés à 42 % par Bpifrance pour les PME et ETI éligibles. C'est un levier pertinent pour cadrer un premier projet à coût maîtrisé. Les conditions et autres dispositifs figurent sur notre page intelligence artificielle en France.
Un chiffrage pour votre périmètre ?
Un audit gratuit de 30 minutes suffit à cartographier votre corpus, identifier un premier cas d'usage et cadrer un budget réaliste — CAPEX et TCO compris, sans engagement.
Réserver mon audit IA gratuitQuestions fréquentes
Combien coûte un projet RAG en entreprise ?
Un RAG simple se situe généralement entre 10 000 et 25 000 € ; un RAG multi-sources avec gestion fine des droits va de 50 000 à 150 000 €. Le budget dépend du volume documentaire, du nombre de sources, du mode de déploiement et du niveau de conformité.
Quel est le coût récurrent (OPEX) d'un RAG ?
Appels aux modèles (tokens) ou amortissement des serveurs GPU, hébergement, maintenance, ré-indexation et évolutions. Sur trois ans, ce TCO peut égaler ou dépasser le coût initial : à anticiper dès le cadrage.
Le coût d'un RAG souverain est-il plus élevé ?
Le on-premise déplace le coût vers l'infrastructure GPU plutôt que vers des appels d'API mutualisés. À usage intensif il peut devenir plus économique ; à faible volume, le cloud reste souvent moins cher.
Existe-t-il des aides pour financer un projet RAG ?
Oui : le Diag Data IA de Bpifrance finance l'intervention d'un expert agréé pour prioriser vos cas d'usage IA — 13 000 € HT financés à 42 % pour les PME/ETI éligibles.
Le coût dépend de deux choix structurants
Au fond, le budget d'un RAG se joue sur deux décisions : le mode de déploiement (qui détermine l'arbitrage CAPEX/OPEX — voir le RAG souverain et on-premise) et le niveau de conformité (qui ajoute validation et traçabilité — voir le RAG en secteur réglementé). Pour le cadre général, revenez au guide du RAG en entreprise.