Voiture, café, chantier : comment votre agent vocal IA gère les appels bruyants sans demander 3 fois
40 % des appels mobiles ont un bruit de fond significatif. Si votre agent vocal IA fait répéter à chaque fois, vous perdez l'appel. Voici la pile technique qui décode dans le chaos.
- agent vocal ia
- bruit
- environnement
- noisy
Quatre appels mobiles sur dix se passent dans un environnement bruyant : voiture en mouvement, café, gare, supermarché, chantier. Le caller veut juste prendre un RDV ; mais si l'agent vocal IA demande de répéter 3 fois, il raccroche. La solution n'est pas magique — c'est une pile de 4 couches qui décode malgré le chaos. Voici la stack.
Couche 1 — suppression de bruit côté entrée#
Algorithmes RNNoise / Krisp / WebRTC NS appliqués sur le flux audio entrant AVANT que la transcription ne commence. Réduit jusqu'à -20 dB du bruit ambiant tout en préservant la voix humaine. Sans cette couche, les modèles type Whisper ou Voxtral chutent à 60-65 % de précision en environnement bruyant. Avec : 85-90 %.
Couche 2 — modèles entraînés sur bruit#
Choisissez un STT (speech-to-text) entraîné spécifiquement sur audio mobile et bruyant — Voxtral, Whisper Large v3, ou Deepgram Nova. Ces modèles ont vu des centaines d'heures de café et de voiture en training. Différence vs un modèle « clean » : +10-15 points de précision sur du brouhaha.
Couche 3 — confirmation explicite des champs critiques#
L'agent ne devine jamais sur les numéros (téléphone, numéro de dossier, code postal) en environnement bruyant. Phrase scriptée : « Pour être sûr — votre numéro est bien 06 12 34 56 78 ? ». La confirmation explicite garantit le RDV même si la transcription a 1-2 erreurs. Coût : 5 secondes de plus. Bénéfice : zéro RDV créé avec un mauvais numéro.
Couche 4 — fallback SMS si > 2 demandes de répétition#
Règle dans le prompt : si l'agent a déjà demandé à répéter 2 fois dans la même conversation, basculer en SMS. « Je n'arrive pas bien à vous entendre. Je vous envoie un SMS avec un lien pour confirmer votre RDV. ». Le caller continue sur un canal silencieux. Récupération : ~80 % de ces appels au lieu d'un raccroché.
Les pièges à éviter#
- TTS trop fort en sortie — sature le micro du caller et amplifie son propre bruit en retour. Calibrer à -3 dB du standard.
- Vouvoiement complexe en bruit fort — préférer des phrases courtes (< 10 mots) qui passent même hachées.
- Boucle infinie « je n'ai pas compris » — toujours fixer une limite (3 essais max) avec sortie propre.
Le test à réaliser ce week-end#
Appelez votre agent depuis une voiture sur autoroute (vitres baissées), depuis un café à 15h, et depuis une rue passante. 3 environnements, 3 appels. Mesurez : taux de complétion sans handoff, nombre de « répéter », taux de RDV créés. Si vous passez les 3 sans frustration, vous êtes au-dessus de 90 % du marché. Premier mois VocazAI gratuit pour calibrer.
À lire ensuite
Configuration en 48 h · sans frais d'installation
Essayer VocazAI gratuitementPremier mois gratuit · sans carte bancaire · annulez à tout moment