Caso de estudio: banco argentino evoluciona de agente humano a voicebot a biometría de voz
Análisis comparativo de tres modelos de autenticación en un banco argentino: agente humano, voicebot con TTS, y biometría de voz. Costos, tiempos y ROI.
Phonomica
Equipo de contenido
15 de agosto de 2024
Actualizado: 15 de enero de 2025
Caso de estudio: banco argentino evoluciona de agente humano a voicebot a biometría de voz
Tiempo de lectura: 8 minutos
Industria: Banca
Región: Argentina
Fecha: Agosto 2024
Resumen ejecutivo
Un banco argentino con 400,000 llamadas mensuales atravesó tres etapas de evolución en su proceso de autenticación:
- 2019-2022: Autenticación con agente humano (KBA tradicional)
- 2022-2024: Migración a voicebot con TTS para preguntas de seguridad
- 2024-presente: Implementación de biometría de voz con Phonomica
Este caso analiza los costos, tiempos y resultados de cada modelo, demostrando que el voicebot—aunque más económico que el agente humano—sigue siendo significativamente más costoso y menos seguro que la biometría de voz.
Contexto
El banco
- Tipo: Banco comercial con fuerte presencia en banca de personas
- Clientes: ~1.5 millones de clientes activos
- Llamadas mensuales: 400,000 promedio
- Contact center: Operación tercerizada con ~180 posiciones
- Canales: Teléfono (60%), app (30%), sucursal (10%)
El desafío inicial
En 2022, el banco enfrentaba:
- Costo operativo alto: $0.65/minuto de operación
- AHT elevado: 6:20 minutos promedio
- Autenticación lenta: 55-70 segundos por llamada
- Tasa de fraude: 0.8% de llamadas con intento de fraude
- NPS bajo: +18 en proceso de autenticación
La presión de reducir costos sin sacrificar seguridad llevó a evaluar alternativas.
Fase 1: Autenticación con Agente Humano (2019-2022)
El proceso
Cliente llama → Agente atiende → Solicita datos:
1. Nombre completo
2. DNI
3. Fecha de nacimiento
4. Pregunta de seguridad (variable)
5. Verificación en sistema
→ Cliente autenticado → Continúa llamada
Tiempo promedio: 55-70 segundos
Análisis de costos (mensual)
| Concepto | Cálculo | Monto |
|---|---|---|
| Tiempo autenticación | 400,000 × 62 seg / 60 | 413,333 minutos |
| Costo operativo | 413,333 × $0.65 | $268,667 |
| Fraude (0.8% × $2,500 avg) | 3,200 × $2,500 | $8,000,000 ⚠️ |
| Llamadas recuperación | 16,000 × $3.25 | $52,000 |
| Total mensual | ~$8.32M |
Nota: El costo de fraude incluye pérdidas directas, investigación y remediación.
Métricas
| Métrica | Valor |
|---|---|
| Tiempo autenticación | 62 segundos promedio |
| Costo por autenticación | $0.67 |
| Tasa de autenticación exitosa | 85% |
| Transferencias por falla de auth | 12% |
| NPS autenticación | +18 |
| Tasa de fraude | 0.8% |
Problemas identificados
- Costo alto: El tiempo de agente es el recurso más caro
- Inconsistencia: Cada agente hacía las preguntas diferente
- Vulnerabilidad: Social engineering frecuente
- Escalabilidad: Picos de demanda requerían más agentes
Fase 2: Autenticación con Voicebot/IVR (2022-2024)
La decisión
El banco decidió migrar la autenticación a un voicebot con TTS (Text-to-Speech) antes de derivar al agente. La lógica: “Si automatizamos la autenticación, el agente puede ir directo al problema.”
El proceso
Cliente llama → IVR identifica motivo → Voicebot:
"Bienvenido a Banco X. Para verificar su identidad,
por favor ingrese su número de DNI seguido de numeral..."
→ Valida DNI
"Ahora ingrese su fecha de nacimiento en formato
día, mes, año..."
→ Valida fecha
"Por último, ingrese los últimos 4 dígitos de su
tarjeta de débito..."
→ Valida
→ "Gracias, lo comunicamos con un asesor"
→ Agente atiende (ya autenticado)
Tiempo promedio: 45-55 segundos
Modelo de costos del voicebot
El proveedor de voicebot cobra por segundo de TTS generado:
| Concepto | Precio |
|---|---|
| TTS por segundo | $0.008 |
| Reconocimiento de voz (ASR) | $0.006/seg |
| Minuto de llamada IVR | $0.02 |
| Setup mensual | $2,500 |
Análisis de costos (mensual)
Costos de voicebot:
| Concepto | Cálculo | Monto |
|---|---|---|
| TTS (promedio 25 seg de audio) | 400,000 × 25 × $0.008 | $80,000 |
| ASR (promedio 15 seg) | 400,000 × 15 × $0.006 | $36,000 |
| Minutos IVR | 400,000 × 0.83 min × $0.02 | $6,640 |
| Setup mensual | Fijo | $2,500 |
| Subtotal voicebot | $125,140 |
Costos operativos residuales:
| Concepto | Cálculo | Monto |
|---|---|---|
| Fallback a agente (18% fallan) | 72,000 × 62 seg / 60 × $0.65 | $48,360 |
| Llamadas recuperación | 12,000 × $3.25 | $39,000 |
| Fraude (0.7% - leve mejora) | 2,800 × $2,500 | $7,000,000 |
| Subtotal operativo | $7,087,360 |
Total mensual: ~$7.21M
Métricas
| Métrica | Antes (Agente) | Con Voicebot | Cambio |
|---|---|---|---|
| Tiempo autenticación | 62 seg | 50 seg | -19% |
| Costo por autenticación | $0.67 | $0.31* | -54% |
| Tasa auth exitosa | 85% | 82% | -3% |
| Transferencias por falla | 12% | 18% | +6% |
| NPS autenticación | +18 | +12 | -6 pts |
| Tasa de fraude | 0.8% | 0.7% | -12% |
*Solo costo directo de autenticación, sin fraude.
Problemas del voicebot
1. Experiencia de usuario degradada
El voicebot era percibido como:
- “Robótico y frío”
- “Lento para entender”
- “Frustrante cuando no reconoce lo que digo”
Resultado: NPS bajó de +18 a +12. Los clientes extrañaban al humano.
2. Tasa de éxito menor
18% de las llamadas fallaban la autenticación por voicebot:
- Errores de reconocimiento de voz
- Clientes que no entendían instrucciones
- Timeouts
- Clientes que colgaban frustrados
Estos 72,000 casos/mes terminaban con un agente de todos modos, duplicando el costo.
3. Seguridad similar
El voicebot seguía usando KBA (preguntas de seguridad). Un atacante con DNI, fecha de nacimiento y últimos 4 dígitos de tarjeta (información obtenible) podía pasar igual.
La reducción de fraude de 0.8% a 0.7% fue marginal.
4. Costo de TTS se acumula
A $0.008/segundo de TTS, el costo parecía bajo. Pero con 400,000 llamadas × 25 segundos promedio = $80,000/mes solo en TTS.
Fase 3: Biometría de Voz con Phonomica (2024-presente)
La decisión
Después de 2 años con voicebot, el banco concluyó:
“Automatizamos el proceso incorrecto. No necesitamos un robot que haga las mismas preguntas; necesitamos eliminar las preguntas.”
El proceso
Cliente llama → IVR identifica motivo →
"Gracias por llamar a Banco X"
[Sistema captura 3-4 segundos de voz del cliente]
[Biometría verifica vs voiceprint enrollado]
[Anti-spoofing valida que es voz real]
→ Si match: "Hola Juan, lo comunicamos con un asesor"
→ Agente atiende: "Hola Juan, ya lo tenemos verificado.
¿En qué puedo ayudarlo?"
Tiempo de autenticación: 3-4 segundos (invisible al cliente)
Modelo de costos Phonomica
| Concepto | Precio |
|---|---|
| Enrollment | $0.10 |
| Verificación estándar | $0.02 |
| Verificación avanzada (anti-spoof) | $0.04 |
| Storage (por voiceprint/mes) | $0.005 |
Análisis de costos (mensual)
Costos de biometría:
| Concepto | Cálculo | Monto |
|---|---|---|
| Verificaciones (100%) | 400,000 × $0.04 | $16,000 |
| Enrollments nuevos | 8,000 × $0.10 | $800 |
| Storage voiceprints | 600,000 × $0.005 | $3,000 |
| Subtotal biometría | $19,800 |
Costos operativos:
| Concepto | Cálculo | Monto |
|---|---|---|
| Fallback (3% no enrollados) | 12,000 × 50 seg × $0.01/seg | $6,000 |
| Fraude (0.08%) | 320 × $2,500 | $800,000 |
| Subtotal operativo | $806,000 |
Total mensual: ~$825,800
Métricas comparativas
| Métrica | Agente | Voicebot | Biometría | Mejor vs Voicebot |
|---|---|---|---|---|
| Tiempo auth | 62 seg | 50 seg | 4 seg | -92% |
| Costo/auth* | $0.67 | $0.31 | $0.05 | -84% |
| Tasa éxito | 85% | 82% | 97% | +15% |
| Fallback | 12% | 18% | 3% | -83% |
| NPS auth | +18 | +12 | +62 | +50 pts |
| Tasa fraude | 0.8% | 0.7% | 0.08% | -89% |
*Costo directo sin fraude.
Comparación de costos totales
Resumen mensual
| Componente | Agente Humano | Voicebot | Biometría |
|---|---|---|---|
| Costo autenticación | $268,667 | $125,140 | $19,800 |
| Fallback/recuperación | $52,000 | $87,360 | $6,000 |
| Fraude | $8,000,000 | $7,000,000 | $800,000 |
| TOTAL | $8,320,667 | $7,212,500 | $825,800 |
Ahorro vs cada alternativa
Biometría vs Voicebot:
- Ahorro mensual: $6,386,700
- Ahorro anual: $76.6 millones
- Reducción: 89%
Biometría vs Agente Humano:
- Ahorro mensual: $7,494,867
- Ahorro anual: $90 millones
- Reducción: 90%
El detalle del fraude
Por qué el voicebot no mejoró la seguridad
El voicebot automatizó el proceso de KBA, pero KBA sigue siendo vulnerable:
| Vector de ataque | ¿Voicebot protege? | ¿Biometría protege? |
|---|---|---|
| Datos robados (DNI, fecha nac.) | ❌ No | ✅ Sí |
| Social engineering | ❌ No | ✅ Sí |
| Replay de grabación | ❌ No | ✅ Sí (anti-spoof) |
| Deepfake de voz | ❌ No | ✅ Sí (anti-spoof) |
| Insider con acceso a datos | ❌ No | ✅ Sí |
El voicebot verifica lo que sabés. La biometría verifica quién sos.
Reducción de fraude real
| Período | Incidentes/mes | Pérdida/mes |
|---|---|---|
| Con agente humano | 3,200 | $8,000,000 |
| Con voicebot | 2,800 | $7,000,000 |
| Con biometría | 320 | $800,000 |
La biometría redujo el fraude 90%, mientras que el voicebot solo lo redujo 12%.
El factor NPS
La paradoja del voicebot
El banco esperaba que automatizar mejoraría la experiencia. Ocurrió lo contrario:
| Momento | NPS Autenticación | Comentarios frecuentes |
|---|---|---|
| Agente humano | +18 | ”Al menos es una persona” |
| Voicebot | +12 | ”Es lento y no me entiende” |
| Biometría | +62 | ”Ni me di cuenta que me verificaron” |
Por qué bajó con voicebot
- Fricción similar, menos humana: Seguía pidiendo datos, pero sin empatía
- Errores de reconocimiento: “No entendí, repita por favor” frustra
- Sensación de “máquina”: Los clientes se sentían menos valorados
- Tiempo similar: 50 segundos sigue siendo mucho
Por qué subió con biometría
- Invisible: El cliente no sabe que está siendo verificado
- Instantáneo: De 50 segundos a 4 segundos
- Reconocimiento: “Hola Juan” genera sensación de ser conocido
- Sin fricción: No tiene que recordar ni ingresar nada
Timeline de implementación
Migración voicebot → biometría
| Fase | Duración | Actividad |
|---|---|---|
| Piloto | 6 semanas | 10% del volumen, enrollment de clientes frecuentes |
| Expansión | 8 semanas | 50% del volumen, enrollment masivo |
| Full rollout | 4 semanas | 100% del volumen, optimización |
| Apagado voicebot | 2 semanas | Migración completa, voicebot como fallback mínimo |
Coexistencia durante transición
Durante 4 meses, ambos sistemas coexistieron:
- Clientes con voiceprint → biometría
- Clientes sin voiceprint → voicebot (y enrollment)
- Fallback → agente humano
Lecciones aprendidas
1. Automatizar el proceso incorrecto no ayuda
“Pusimos un robot a hacer preguntas de seguridad. Seguían siendo preguntas de seguridad.”
La lección: antes de automatizar, preguntate si el proceso debería existir.
2. El costo de TTS se acumula
$0.008/segundo parece barato hasta que multiplicás por millones de segundos.
A escala, el modelo pay-per-second de TTS es más caro que la biometría pay-per-transaction.
3. KBA es inseguro sin importar quién pregunte
Un bot preguntando “¿fecha de nacimiento?” es igual de vulnerable que un humano preguntando lo mismo.
La seguridad no mejora por automatizar; mejora por cambiar el método.
4. La experiencia importa tanto como el costo
El voicebot ahorró dinero pero empeoró el NPS. La biometría ahorró más dinero Y mejoró el NPS.
5. El fraude es el costo oculto más grande
En este caso, el fraude representaba 96% del costo total con agente humano y 97% con voicebot.
La biometría atacó el problema real.
Conclusión
La evolución de este banco ilustra un patrón común:
- Agente humano: Caro, lento, inseguro, pero “funciona”
- Voicebot: Automatiza el proceso sin cuestionarlo; ahorra algo pero no resuelve el problema de fondo
- Biometría de voz: Elimina el proceso problemático; resuelve costo, tiempo, experiencia Y seguridad
El voicebot fue un paso intermedio necesario para que el banco entendiera que el problema no era “quién hace las preguntas” sino “que existan preguntas”.
Resumen de resultados
| Métrica | Agente → Voicebot | Voicebot → Biometría |
|---|---|---|
| Costo total | -13% | -89% |
| Tiempo auth | -19% | -92% |
| Fraude | -12% | -89% |
| NPS | -6 pts | +50 pts |
ROI de migrar de voicebot a biometría: 3,200%
¿Tu empresa está en la fase de voicebot? Contactanos para evaluar la migración a biometría de voz.
Recursos relacionados
Artículos relacionados
La amenaza de los deepfakes de voz: guía completa 2025
Todo sobre los deepfakes de voz: cómo funcionan, casos reales de fraude, cómo detectarlos y cómo proteger tu empresa. Guía actualizada 2025.
Guía completaCómo funciona la biometría de voz: guía completa 2025
Guía completa sobre cómo funciona la biometría de voz: desde la ciencia detrás de tu voz única hasta implementación práctica. Todo lo que necesitás saber.
Guía completaROI de biometría de voz en contact centers: guía completa
Calculá el ROI de biometría de voz para tu contact center. Incluye metodología, ejemplos prácticos y análisis detallado.
¿Querés implementar biometría de voz?
Agendá una demo y descubrí cómo Phonomica puede ayudarte.