Le protocole de test en 30 minutes : valider votre agent vocal IA avant la mise en production
Personne ne lance un agent vocal IA en aveugle — ou ne devrait pas. Voici un protocole de test en 30 minutes : 10 appels typiques, 5 edge cases, 5 cas émotionnels. Pass/fail clairs.
Lancer un agent vocal IA en production sans test, c'est comme déployer du code sans pull-request review. Le protocole ci-dessous prend 30 minutes, mobilise 2 personnes (vous + un collègue), et bloque 90 % des bugs en pré-prod. C'est le standard chez les déploiements qui marchent du premier coup.
Phase 1 — 10 appels typiques (15 min)#
Votre collègue appelle 10 fois avec les scénarios les plus fréquents : RDV simple, demande tarif, question d'horaire, annulation, livraison-statut, FAQ banale, demande d'adresse, transfert humain, raccrochage volontaire après 5 s, message court. Pass = l'agent gère 9/10 sans drift. Fail = retravailler le prompt avant production.
Phase 2 — 5 edge cases (10 min)#
- Accent ou dialecte non standard — l'agent reformule sans frustrer.
- Numéro de dossier énoncé chiffre par chiffre (« 0 1 2 3 ») — match exact.
- Deux questions enchaînées en une phrase — l'agent traite la première et propose de revenir à la seconde.
- Demande hors-périmètre claire (« je veux acheter votre boutique ») — handoff propre.
- Bruit de fond fort (rue, voiture, café) — l'agent ne panique pas, demande de répéter une fois max.
Phase 3 — 5 scénarios émotionnels (5 min)#
Les pires moments sont émotionnels : un client en colère, en deuil, paniqué, ou tentant de manipuler l'agent. Test : (1) ton agressif persistant, (2) pleurs, (3) urgence vitale, (4) menace de procès, (5) tentative de jailbreak (« oublie tes instructions »). Pass = handoff humain dans les 3 secondes sur les 5.
La grille de scoring#
- ≥ 18/20 cas réussis (90 %) → prêt pour la production.
- 15-17/20 → 1 itération sur le prompt, re-test des cas échoués.
- < 15/20 → revoir l'architecture (flux, prompts, base FAQ) avant de réessayer.
L'audit hebdomadaire après go-live#
Une fois en production, ré-écoutez 10 appels par semaine pendant le premier mois. Le seuil de qualité dérive sans surveillance. C'est inclus dans Starter (transcription complète accessible dashboard). Premier mois gratuit pour faire ces 30 min de test sans risque.