RAG Cost Estimator

⚡ Scénarios prédéfinis

Charge rapide d'un profil type — tous les paramètres s'ajustent automatiquement.

🚀 Startup

Petite équipe, quelques PDF, faible volume de requêtes

🏢 PME

Base documentaire moyenne, usage quotidien modéré

🏦 Enterprise

Grand corpus, forte volumétrie, SLA exigeant

Documents & Pages

Documents ingérés / mois100

Nouveaux documents ajoutés au corpus chaque mois

Pages moyennes par document15

Tokens moyens par page500

~500 tokens ≈ 375 mots ≈ 1 page A4 dense

Requêtes Chat

Requêtes / jour50

Tokens de contexte récupéré2 000

Tokens injectés en contexte depuis OpenSearch (chunks)

Tokens de réponse générée500

Longueur moyenne de la réponse du LLM

Paramètres RAG

Taille des chunks (tokens)512

Chevauchement chunks (%)20%

Re-embedding corpus (×/an)1×

Ré-indexation complète (changement de modèle…)

Embedding (indexation)

3-small

3-large

ada-002

Voyage-3

Mistral

Perso

Coût input ($ / 1M tokens)$0.020

Référence :
text-embedding-3-small : $0.020/M
text-embedding-3-large : $0.130/M
ada-002 : $0.100/M · Voyage-3 : $0.060/M
mistral-embed : $0.100/M

LLM — Génération de réponse

Sonnet 4

Haiku 3.5

GPT-4o

4o mini

Gemini Flash

M-Small

M-Medium

M-Large

Perso

Coût input ($ / 1M tokens)$3.00

Coût output ($ / 1M tokens)$15.00

Sonnet $3/$15 · GPT-4o $2.5/$10 · Haiku $0.8/$4 · Flash $0.075/$0.30 · M-Small $0.03/$0.11 · M-Large $0.50/$1.50

PDF → Texte (OCR / parsing)

Docling local

Textract

Azure DI

Google DAI

Mistral OCR

Perso

Coût ($ / page)$0.000

Docling local (dans OpenRAG) = gratuit ✅

Référence :
Docling local / Docker : gratuit ✅
Amazon Textract : $0.0015/page
Azure Document Intelligence : $0.001/page
Mistral OCR : $0.001/page

Total / mois

$0.00

toutes opérations

Génération LLM / mois

$0.00

requêtes × tokens

Embedding / mois

$0.00

indexation + requêtes

PDF → Texte / mois

$0.00

pages traitées

Répartition des coûts

Projections

Coût / jour$0.00

Coût / mois$0.00

Coût / an$0.00

Coût par requête chat$0.0000

Coût par document ingéré$0.0000

💡 Ajustez les paramètres pour voir l'impact en temps réel.