RAG Cost Estimator
Estimation des coûts d'utilisation en temps réel
⚡ Scénarios prédéfinis

Charge rapide d'un profil type — tous les paramètres s'ajustent automatiquement.

🚀 Startup
Petite équipe, quelques PDF, faible volume de requêtes
🏢 PME
Base documentaire moyenne, usage quotidien modéré
🏦 Enterprise
Grand corpus, forte volumétrie, SLA exigeant
📊 Volume d'utilisation
Documents & Pages
Documents ingérés / mois100
Nouveaux documents ajoutés au corpus chaque mois
Pages moyennes par document15
Tokens moyens par page500
~500 tokens ≈ 375 mots ≈ 1 page A4 dense
Requêtes Chat
Requêtes / jour50
Tokens de contexte récupéré2 000
Tokens injectés en contexte depuis OpenSearch (chunks)
Tokens de réponse générée500
Longueur moyenne de la réponse du LLM
Paramètres RAG
Taille des chunks (tokens)512
Chevauchement chunks (%)20%
Re-embedding corpus (×/an)
Ré-indexation complète (changement de modèle…)
🤖 Modèles & Tarifs
Embedding (indexation)
3-small
3-large
ada-002
Voyage-3
Perso
Coût input ($ / 1M tokens)$0.020
Référence :
text-embedding-3-small : $0.020/M
text-embedding-3-large : $0.130/M
ada-002 : $0.100/M  ·  Voyage-3 : $0.060/M
LLM — Génération de réponse
Sonnet 4
Haiku 3.5
GPT-4o
4o mini
Gemini Flash
Perso
Coût input ($ / 1M tokens)$3.00
Coût output ($ / 1M tokens)$15.00
Sonnet $3/$15 · GPT-4o $2.5/$10 · Haiku $0.8/$4 · Flash $0.075/$0.30
PDF → Texte (OCR / parsing)
Docling local
Textract
Azure DI
Google DAI
Perso
Coût ($ / page)$0.000
Docling local (dans OpenRAG) = gratuit ✅
Référence :
Docling local / Docker : gratuit ✅
Amazon Textract : $0.0015/page
Azure Document Intelligence : $0.001/page
💰 Estimation des coûts
Génération LLM / mois
$0.00
requêtes × tokens
Embedding / mois
$0.00
indexation + requêtes
PDF → Texte / mois
$0.00
pages traitées
Répartition des coûts
Projections
Coût / jour$0.00
Coût / mois$0.00
Coût / an$0.00
Coût par requête chat$0.0000
Coût par document ingéré$0.0000
💡 Ajustez les paramètres pour voir l'impact en temps réel.