Prompt Engineering: Systematic Patterns for Reliable LLM Outputs

Le prompt engineering n'est plus du bricolage ad hoc -- c'est devenu une discipline avec des patterns reproductibles, des cadres d'évaluation et des stratégies d'optimisation systématiques. Cet article catalogue les techniques fondamentales, les associe aux cas d'usage et fournit un cadre pour choisir la bonne approche.

Taxonomie des Techniques

Techniques de Prompt Engineering
│
├── Prompting Basique
│   ├── Zero-Shot : Instruction directe, sans exemples
│   ├── Few-Shot : 2-5 exemples demontrant la sortie souhaitee
│   └── System Prompting : Definition du rôle et du comportement
│
├── Amelioration du Raisonnement
│   ├── Chain-of-Thought (CoT) : "Reflechis étape par étape"
│   ├── Tree-of-Thought (ToT) : Explorer plusieurs chemins de raisonnement
│   ├── Self-Consistency : Echantillonner plusieurs chemins CoT, vote majoritaire
│   └── Step-Back Prompting : Abstraire avant de resoudre
│
├── Patterns Agent
│   ├── ReAct : Raisonner + Agir en étapes alternees
│   ├── Reflexion : Auto-evaluer et reessayer
│   ├── Plan-and-Execute : Planifier d'abord, executer ensuite
│   └── Tool-Use : Router vers des outils/APIs externes
│
├── Contrôle de Sortie
│   ├── Sortie Structuree : Application de schema JSON/XML
│   ├── Génération Contrainte : Contraintes basees sur la grammaire
│   └── Parsing de Sortie : Post-traitement avec validation
│
└── Optimisation
    ├── Chainage de Prompts : Decomposer en sous-taches
    ├── Meta-Prompting : Utiliser le LLM pour générer/affiner les prompts
    └── Style DSPy : Optimisation programmatique des prompts

Tableau Comparatif des Patterns

Technique	Complexité	Impact Latence	Impact Coût	Gain Fiabilité	Tier Modèle
Zero-Shot	Faible	Aucun	Minimal	Baseline	Tout
Few-Shot	Faible	Minimal (+tokens)	Faible	+15-30%	Tout
Chain-of-Thought	Faible	+30-50%	+30-50%	+20-40% raisonnement	Moyen+
Self-Consistency	Moyen	3-5x (parallele)	3-5x	+10-20% vs CoT	Moyen+
ReAct	Eleve	Variable (appels outils)	Variable	Eleve pour tâches outils	Large
Sortie Structuree	Faible	Minimal	Minimal	Eleve pour le parsing	Tout
Chainage de Prompts	Moyen	Additif par étape	Additif	Eleve pour tâches complexes	Tout

Matrice de Decision : Cas d'Usage vers Technique

Cas d'Usage	Technique Recommandee	Alternative	A Eviter
Classification	Few-Shot	Zero-Shot + exemples système	CoT (excessif)
Résumé	Zero-Shot + contraintes	Few-Shot avec exemples de style	Self-Consistency
Génération de code	Few-Shot + Sortie Structuree	CoT pour logique complexe	Zero-Shot pour complexe
Math/raisonnement	CoT + Self-Consistency	Tree-of-Thought	Zero-Shot
Extraction de données	Few-Shot + Sortie Structuree	Chainage de Prompts	Sortie non structurée
Recherche multi-étapes	ReAct / Plan-and-Execute	Chainage de Prompts	Tir unique
Ecriture creative	System prompt + contraintes	Few-Shot pour le style	Sur-contraindre
Aide a la decision	CoT + Sortie Structuree	Tree-of-Thought	Zero-Shot

Anti-Patterns a Eviter

Anti-Patterns Courants
│
├── Bourrage de Prompt
│   └── Trop de contexte → le modèle perd le focus
│       Correction : Prioriser, resumer, utiliser RAG
│
├── Surcharge d'Instructions
│   └── 20+ règles dans le system prompt → contradictions
│       Correction : Instructions hierarchiques, tester chaque règle
│
├── Contamination des Exemples
│   └── Les exemples few-shot biaisent vers des patterns etroits
│       Correction : Exemples divers, inclure les cas limites
│
└── Pas de Pipeline d'Ãvaluation
    └── Modifier les prompts sans mesurer l'impact
        Correction : A/B tester, suivre les métriques dans le temps

Ressources

Prompt Engineering Guide (DAIR.AI) -- référence open-source comprehensive
Documentation Prompt Engineering Anthropic -- bonnes pratiqués spécifiques Claude
Guide Prompt Engineering OpenAI -- patterns spécifiques GPT
Framework DSPy (Stanford) -- optimisation programmatique des prompts
Chain-of-Thought Prompting (Wei et al.) -- article de recherche fondateur :::