Le constat : Personnaliser une IA pour qu'elle comprenne votre métier, votre vocabulaire et vos données — trois approches existent, trois mondes différents. Choisir la mauvaise coûte du temps, de l'argent, et peut tuer un projet.
Prompting, RAG ou fine-tuning ? Cet article décortique les trois approches, donne les critères de décision concrets et termine avec une matrice qui vous permet de choisir en 5 minutes pour votre PME.
1. Les 3 approches en 1 paragraphe
Prompting : on guide le modèle avec des instructions précises et des exemples dans la conversation. Le modèle reste inchangé. RAG : on connecte le modèle à une base documentaire externe, il va y chercher les informations pertinentes avant de répondre. Fine-tuning : on entraîne le modèle sur vos données spécifiques pour modifier ses poids internes.
2. Prompting : quand c'est suffisant
Le prompting suffit quand le modèle a déjà la connaissance générale du sujet et qu'il faut juste l'orienter. Cas typiques en PME : classification de mails entrants, extraction d'informations dans des documents, génération de réponses standardisées, traduction, résumé.
Avantages : démarrage instantané, coût quasi-nul en développement, agilité maximale (un changement de prompt = un changement de comportement). Limites : pas d'accès aux données spécifiques de l'entreprise, fenêtre de contexte limitée, performances qui plafonnent sur les tâches complexes.
3. RAG : la voie royale pour 80% des PME
Le RAG (Retrieval Augmented Generation) connecte le modèle à votre base documentaire. Avant de répondre, l'IA recherche les documents pertinents et s'appuie dessus pour produire sa réponse. C'est l'approche qui combine simplicité de mise en œuvre, contrôle total des données et performance sur les cas métiers.
Cas typiques : chat IA interne sur la base documentaire, assistant client qui répond depuis la FAQ, agent commercial qui pioche dans les fiches produits, expert IA juridique qui cite les contrats. Le RAG est le choix par défaut pour 80% des projets agents IA en PME.
4. Fine-tuning : quand ça devient pertinent
Le fine-tuning modifie les poids internes du modèle. Cette approche est puissante mais coûteuse, et ne devient pertinente que dans trois cas précis : vocabulaire ultra-spécialisé absent des données d'entraînement du modèle de base, ton ou style très particulier à votre marque qui doit être appris dans la profondeur, volume de données d'entraînement disponible (10 000+ exemples qualifiés).
Limite majeure souvent oubliée : votre fine-tuning reste sur le modèle de base utilisé. Quand un nouveau modèle sort (Claude 4.8, GPT-5), vous devez refaire le fine-tuning sur la nouvelle base. Le RAG, lui, est agnostique au modèle.
5. Matrice de décision en 5 questions
Cinq questions pour choisir en 5 minutes :
- Vos données changent souvent ? Oui → RAG. Non, stables → fine-tuning envisageable
- Volume de données métier ? < 100 docs → prompting. 100 à 100 000 → RAG. > 100 000 + qualifié → fine-tuning
- Besoin de citer la source ? Oui (juridique, médical, conformité) → RAG obligatoire
- Ton très spécifique à apprendre ? Oui, profondément ancré → fine-tuning. Non, instructions suffisent → prompting
- Budget développement ? Faible (< 5k€) → prompting. Moyen (10-30k€) → RAG. Élevé (50k€+) → fine-tuning envisageable
6. 4 erreurs fréquentes
Erreur 1 : choisir le fine-tuning par effet de mode
Le fine-tuning sonne plus "pro" mais coûte 5 à 10 fois plus cher que le RAG pour des performances rarement supérieures sur les usages PME. Tester d'abord le RAG, basculer si nécessaire.
Erreur 2 : démarrer par le fine-tuning sans avoir de données qualifiées
Sans 1 000 exemples qualifiés minimum (vraies questions, vraies réponses validées), le fine-tuning produit des modèles instables. Constituer ce corpus prend souvent plus de temps que le projet lui-même.
Erreur 3 : croire que le prompting est "amateur"
Le prompt engineering est un vrai métier en 2026. Un bon prompt remplace souvent un mauvais fine-tuning. Investir dans la qualité du prompt avant de vouloir tout custom.
Erreur 4 : ignorer que les approches se combinent
Les déploiements les plus performants en production combinent les trois : prompting structuré + RAG sur la base documentaire + fine-tuning léger sur des cas ultra-spécifiques. La question n'est pas "lequel choisir" mais "quel mix".
Synthèse : 3 approches, 1 décision
- Prompting : tâches simples, démarrage immédiat, agilité maximale
- RAG : choix par défaut pour 80% des PME, données métier en temps réel
- Fine-tuning : cas ultra-spécialisés avec corpus qualifié important
- Les trois se combinent en production pour les meilleurs résultats