Caso de estudio 8 min caso estudio banco comparación voicebot biometría IVR vs biometría voz

Caso de estudio: banco argentino evoluciona de agente humano a voicebot a biometría de voz

Análisis comparativo de tres modelos de autenticación en un banco argentino: agente humano, voicebot con TTS, y biometría de voz. Costos, tiempos y ROI.

P

Phonomica

Equipo de contenido

15 de agosto de 2024

Actualizado: 15 de enero de 2025

Caso de estudio: banco argentino evoluciona de agente humano a voicebot a biometría de voz

Tiempo de lectura: 8 minutos
Industria: Banca
Región: Argentina
Fecha: Agosto 2024


Resumen ejecutivo

Un banco argentino con 400,000 llamadas mensuales atravesó tres etapas de evolución en su proceso de autenticación:

  1. 2019-2022: Autenticación con agente humano (KBA tradicional)
  2. 2022-2024: Migración a voicebot con TTS para preguntas de seguridad
  3. 2024-presente: Implementación de biometría de voz con Phonomica

Este caso analiza los costos, tiempos y resultados de cada modelo, demostrando que el voicebot—aunque más económico que el agente humano—sigue siendo significativamente más costoso y menos seguro que la biometría de voz.


Contexto

El banco

  • Tipo: Banco comercial con fuerte presencia en banca de personas
  • Clientes: ~1.5 millones de clientes activos
  • Llamadas mensuales: 400,000 promedio
  • Contact center: Operación tercerizada con ~180 posiciones
  • Canales: Teléfono (60%), app (30%), sucursal (10%)

El desafío inicial

En 2022, el banco enfrentaba:

  • Costo operativo alto: $0.65/minuto de operación
  • AHT elevado: 6:20 minutos promedio
  • Autenticación lenta: 55-70 segundos por llamada
  • Tasa de fraude: 0.8% de llamadas con intento de fraude
  • NPS bajo: +18 en proceso de autenticación

La presión de reducir costos sin sacrificar seguridad llevó a evaluar alternativas.


Fase 1: Autenticación con Agente Humano (2019-2022)

El proceso

Cliente llama → Agente atiende → Solicita datos:
  1. Nombre completo
  2. DNI
  3. Fecha de nacimiento
  4. Pregunta de seguridad (variable)
  5. Verificación en sistema
→ Cliente autenticado → Continúa llamada

Tiempo promedio: 55-70 segundos

Análisis de costos (mensual)

ConceptoCálculoMonto
Tiempo autenticación400,000 × 62 seg / 60413,333 minutos
Costo operativo413,333 × $0.65$268,667
Fraude (0.8% × $2,500 avg)3,200 × $2,500$8,000,000 ⚠️
Llamadas recuperación16,000 × $3.25$52,000
Total mensual~$8.32M

Nota: El costo de fraude incluye pérdidas directas, investigación y remediación.

Métricas

MétricaValor
Tiempo autenticación62 segundos promedio
Costo por autenticación$0.67
Tasa de autenticación exitosa85%
Transferencias por falla de auth12%
NPS autenticación+18
Tasa de fraude0.8%

Problemas identificados

  1. Costo alto: El tiempo de agente es el recurso más caro
  2. Inconsistencia: Cada agente hacía las preguntas diferente
  3. Vulnerabilidad: Social engineering frecuente
  4. Escalabilidad: Picos de demanda requerían más agentes

Fase 2: Autenticación con Voicebot/IVR (2022-2024)

La decisión

El banco decidió migrar la autenticación a un voicebot con TTS (Text-to-Speech) antes de derivar al agente. La lógica: “Si automatizamos la autenticación, el agente puede ir directo al problema.”

El proceso

Cliente llama → IVR identifica motivo → Voicebot:
  "Bienvenido a Banco X. Para verificar su identidad,
   por favor ingrese su número de DNI seguido de numeral..."
  → Valida DNI
  "Ahora ingrese su fecha de nacimiento en formato
   día, mes, año..."
  → Valida fecha
  "Por último, ingrese los últimos 4 dígitos de su
   tarjeta de débito..."
  → Valida
→ "Gracias, lo comunicamos con un asesor"
→ Agente atiende (ya autenticado)

Tiempo promedio: 45-55 segundos

Modelo de costos del voicebot

El proveedor de voicebot cobra por segundo de TTS generado:

ConceptoPrecio
TTS por segundo$0.008
Reconocimiento de voz (ASR)$0.006/seg
Minuto de llamada IVR$0.02
Setup mensual$2,500

Análisis de costos (mensual)

Costos de voicebot:

ConceptoCálculoMonto
TTS (promedio 25 seg de audio)400,000 × 25 × $0.008$80,000
ASR (promedio 15 seg)400,000 × 15 × $0.006$36,000
Minutos IVR400,000 × 0.83 min × $0.02$6,640
Setup mensualFijo$2,500
Subtotal voicebot$125,140

Costos operativos residuales:

ConceptoCálculoMonto
Fallback a agente (18% fallan)72,000 × 62 seg / 60 × $0.65$48,360
Llamadas recuperación12,000 × $3.25$39,000
Fraude (0.7% - leve mejora)2,800 × $2,500$7,000,000
Subtotal operativo$7,087,360

Total mensual: ~$7.21M

Métricas

MétricaAntes (Agente)Con VoicebotCambio
Tiempo autenticación62 seg50 seg-19%
Costo por autenticación$0.67$0.31*-54%
Tasa auth exitosa85%82%-3%
Transferencias por falla12%18%+6%
NPS autenticación+18+12-6 pts
Tasa de fraude0.8%0.7%-12%

*Solo costo directo de autenticación, sin fraude.

Problemas del voicebot

1. Experiencia de usuario degradada

El voicebot era percibido como:

  • “Robótico y frío”
  • “Lento para entender”
  • “Frustrante cuando no reconoce lo que digo”

Resultado: NPS bajó de +18 a +12. Los clientes extrañaban al humano.

2. Tasa de éxito menor

18% de las llamadas fallaban la autenticación por voicebot:

  • Errores de reconocimiento de voz
  • Clientes que no entendían instrucciones
  • Timeouts
  • Clientes que colgaban frustrados

Estos 72,000 casos/mes terminaban con un agente de todos modos, duplicando el costo.

3. Seguridad similar

El voicebot seguía usando KBA (preguntas de seguridad). Un atacante con DNI, fecha de nacimiento y últimos 4 dígitos de tarjeta (información obtenible) podía pasar igual.

La reducción de fraude de 0.8% a 0.7% fue marginal.

4. Costo de TTS se acumula

A $0.008/segundo de TTS, el costo parecía bajo. Pero con 400,000 llamadas × 25 segundos promedio = $80,000/mes solo en TTS.


Fase 3: Biometría de Voz con Phonomica (2024-presente)

La decisión

Después de 2 años con voicebot, el banco concluyó:

“Automatizamos el proceso incorrecto. No necesitamos un robot que haga las mismas preguntas; necesitamos eliminar las preguntas.”

El proceso

Cliente llama → IVR identifica motivo → 
  "Gracias por llamar a Banco X"
  [Sistema captura 3-4 segundos de voz del cliente]
  [Biometría verifica vs voiceprint enrollado]
  [Anti-spoofing valida que es voz real]
→ Si match: "Hola Juan, lo comunicamos con un asesor"
→ Agente atiende: "Hola Juan, ya lo tenemos verificado.
   ¿En qué puedo ayudarlo?"

Tiempo de autenticación: 3-4 segundos (invisible al cliente)

Modelo de costos Phonomica

ConceptoPrecio
Enrollment$0.10
Verificación estándar$0.02
Verificación avanzada (anti-spoof)$0.04
Storage (por voiceprint/mes)$0.005

Análisis de costos (mensual)

Costos de biometría:

ConceptoCálculoMonto
Verificaciones (100%)400,000 × $0.04$16,000
Enrollments nuevos8,000 × $0.10$800
Storage voiceprints600,000 × $0.005$3,000
Subtotal biometría$19,800

Costos operativos:

ConceptoCálculoMonto
Fallback (3% no enrollados)12,000 × 50 seg × $0.01/seg$6,000
Fraude (0.08%)320 × $2,500$800,000
Subtotal operativo$806,000

Total mensual: ~$825,800

Métricas comparativas

MétricaAgenteVoicebotBiometríaMejor vs Voicebot
Tiempo auth62 seg50 seg4 seg-92%
Costo/auth*$0.67$0.31$0.05-84%
Tasa éxito85%82%97%+15%
Fallback12%18%3%-83%
NPS auth+18+12+62+50 pts
Tasa fraude0.8%0.7%0.08%-89%

*Costo directo sin fraude.


Comparación de costos totales

Resumen mensual

ComponenteAgente HumanoVoicebotBiometría
Costo autenticación$268,667$125,140$19,800
Fallback/recuperación$52,000$87,360$6,000
Fraude$8,000,000$7,000,000$800,000
TOTAL$8,320,667$7,212,500$825,800

Ahorro vs cada alternativa

Biometría vs Voicebot:

  • Ahorro mensual: $6,386,700
  • Ahorro anual: $76.6 millones
  • Reducción: 89%

Biometría vs Agente Humano:

  • Ahorro mensual: $7,494,867
  • Ahorro anual: $90 millones
  • Reducción: 90%

El detalle del fraude

Por qué el voicebot no mejoró la seguridad

El voicebot automatizó el proceso de KBA, pero KBA sigue siendo vulnerable:

Vector de ataque¿Voicebot protege?¿Biometría protege?
Datos robados (DNI, fecha nac.)❌ No✅ Sí
Social engineering❌ No✅ Sí
Replay de grabación❌ No✅ Sí (anti-spoof)
Deepfake de voz❌ No✅ Sí (anti-spoof)
Insider con acceso a datos❌ No✅ Sí

El voicebot verifica lo que sabés. La biometría verifica quién sos.

Reducción de fraude real

PeríodoIncidentes/mesPérdida/mes
Con agente humano3,200$8,000,000
Con voicebot2,800$7,000,000
Con biometría320$800,000

La biometría redujo el fraude 90%, mientras que el voicebot solo lo redujo 12%.


El factor NPS

La paradoja del voicebot

El banco esperaba que automatizar mejoraría la experiencia. Ocurrió lo contrario:

MomentoNPS AutenticaciónComentarios frecuentes
Agente humano+18”Al menos es una persona”
Voicebot+12”Es lento y no me entiende”
Biometría+62”Ni me di cuenta que me verificaron”

Por qué bajó con voicebot

  1. Fricción similar, menos humana: Seguía pidiendo datos, pero sin empatía
  2. Errores de reconocimiento: “No entendí, repita por favor” frustra
  3. Sensación de “máquina”: Los clientes se sentían menos valorados
  4. Tiempo similar: 50 segundos sigue siendo mucho

Por qué subió con biometría

  1. Invisible: El cliente no sabe que está siendo verificado
  2. Instantáneo: De 50 segundos a 4 segundos
  3. Reconocimiento: “Hola Juan” genera sensación de ser conocido
  4. Sin fricción: No tiene que recordar ni ingresar nada

Timeline de implementación

Migración voicebot → biometría

FaseDuraciónActividad
Piloto6 semanas10% del volumen, enrollment de clientes frecuentes
Expansión8 semanas50% del volumen, enrollment masivo
Full rollout4 semanas100% del volumen, optimización
Apagado voicebot2 semanasMigración completa, voicebot como fallback mínimo

Coexistencia durante transición

Durante 4 meses, ambos sistemas coexistieron:

  • Clientes con voiceprint → biometría
  • Clientes sin voiceprint → voicebot (y enrollment)
  • Fallback → agente humano

Lecciones aprendidas

1. Automatizar el proceso incorrecto no ayuda

“Pusimos un robot a hacer preguntas de seguridad. Seguían siendo preguntas de seguridad.”

La lección: antes de automatizar, preguntate si el proceso debería existir.

2. El costo de TTS se acumula

$0.008/segundo parece barato hasta que multiplicás por millones de segundos.

A escala, el modelo pay-per-second de TTS es más caro que la biometría pay-per-transaction.

3. KBA es inseguro sin importar quién pregunte

Un bot preguntando “¿fecha de nacimiento?” es igual de vulnerable que un humano preguntando lo mismo.

La seguridad no mejora por automatizar; mejora por cambiar el método.

4. La experiencia importa tanto como el costo

El voicebot ahorró dinero pero empeoró el NPS. La biometría ahorró más dinero Y mejoró el NPS.

5. El fraude es el costo oculto más grande

En este caso, el fraude representaba 96% del costo total con agente humano y 97% con voicebot.

La biometría atacó el problema real.


Conclusión

La evolución de este banco ilustra un patrón común:

  1. Agente humano: Caro, lento, inseguro, pero “funciona”
  2. Voicebot: Automatiza el proceso sin cuestionarlo; ahorra algo pero no resuelve el problema de fondo
  3. Biometría de voz: Elimina el proceso problemático; resuelve costo, tiempo, experiencia Y seguridad

El voicebot fue un paso intermedio necesario para que el banco entendiera que el problema no era “quién hace las preguntas” sino “que existan preguntas”.


Resumen de resultados

MétricaAgente → VoicebotVoicebot → Biometría
Costo total-13%-89%
Tiempo auth-19%-92%
Fraude-12%-89%
NPS-6 pts+50 pts

ROI de migrar de voicebot a biometría: 3,200%


¿Tu empresa está en la fase de voicebot? Contactanos para evaluar la migración a biometría de voz.


Recursos relacionados

¿Querés implementar biometría de voz?

Agendá una demo y descubrí cómo Phonomica puede ayudarte.