Artículo 6 min ElevenLabs biometría deepfake vs biometría detección ElevenLabs

¿Puede ElevenLabs engañar a un sistema de biometría de voz?

Probamos ElevenLabs contra sistemas de biometría de voz. ¿Puede la clonación de voz más popular engañar a la autenticación biométrica?

P

Phonomica

Equipo de contenido

15 de mayo de 2024

Actualizado: 15 de enero de 2025

¿Puede ElevenLabs engañar a un sistema de biometría de voz?

Tiempo de lectura: 6 minutos

ElevenLabs es la herramienta de clonación de voz más popular del mundo. Por $5-22/mes, cualquiera puede clonar una voz con calidad de broadcast. La pregunta obvia: ¿puede engañar a sistemas de biometría de voz?

Hicimos las pruebas.


El experimento

Setup

Víctima simulada: Creamos un voiceprint de un miembro del equipo usando 10 segundos de audio de una reunión (condiciones realistas, no estudio).

Ataque: Usamos ElevenLabs para clonar la misma voz con 30 segundos de audio de referencia, y generamos frases de verificación.

Sistemas probados:

  1. Sistema A: Biometría básica sin anti-spoofing
  2. Sistema B: Biometría con anti-spoofing estático
  3. Sistema C: Biometría con anti-spoofing adaptativo (Phonomica)

Métricas

  • Score de similitud: Qué tan parecida es la voz clonada al voiceprint original
  • Spoof flag: Si el sistema detecta que es audio sintético
  • Decisión final: ¿Aceptaría el sistema esta autenticación?

Resultados

Sistema A: Sin anti-spoofing

IntentoScoreSpoof FlagDecisión
ElevenLabs intento 10.82N/A✅ ACCEPT
ElevenLabs intento 20.85N/A✅ ACCEPT
ElevenLabs intento 30.79N/A✅ ACCEPT
Voz real0.91N/A✅ ACCEPT

Resultado: 3/3 ataques exitosos (100%)

El score de ElevenLabs es ligeramente menor que la voz real, pero está cómodamente por encima del threshold típico de 0.75-0.80. Sin anti-spoofing, el sistema no tiene forma de saber que es audio sintético.

Sistema B: Anti-spoofing estático

IntentoScoreSpoof FlagDecisión
ElevenLabs intento 10.82⚠️ 0.35❌ REJECT
ElevenLabs intento 20.84⚠️ 0.42❌ REJECT
ElevenLabs intento 30.81✅ 0.18✅ ACCEPT
Voz real0.91✅ 0.05✅ ACCEPT

Resultado: 1/3 ataques exitosos (33%)

El anti-spoofing estático detecta la mayoría de los intentos, pero no todos. ElevenLabs genera cierta variabilidad, y algunos outputs pasan bajo el radar.

Sistema C: Anti-spoofing adaptativo (Phonomica)

IntentoScoreSpoof FlagDecisión
ElevenLabs intento 10.82⚠️ 0.72❌ REJECT
ElevenLabs intento 20.85⚠️ 0.68❌ REJECT
ElevenLabs intento 30.80⚠️ 0.75❌ REJECT
ElevenLabs intento 40.83⚠️ 0.71❌ REJECT
ElevenLabs intento 50.81⚠️ 0.69❌ REJECT
Voz real0.91✅ 0.03✅ ACCEPT

Resultado: 0/5 ataques exitosos (0%)

El anti-spoofing adaptativo, específicamente entrenado para detectar ElevenLabs y actualizado regularmente, detecta todos los intentos con alta confianza.


Por qué ElevenLabs es detectable

1. Artefactos del vocoder

ElevenLabs usa un vocoder neural para generar audio. Este proceso deja patrones sutiles en el espectro que son invisibles al oído humano pero detectables por algoritmos.

2. Características de síntesis

El audio de ElevenLabs tiene:

  • Distribución de energía diferente
  • Patrones de pitch más regulares
  • Menos micro-variabilidad
  • Respiración artificial

3. La “firma” de ElevenLabs

Cada herramienta de síntesis tiene su firma. Los sistemas de detección que han visto ejemplos de ElevenLabs pueden reconocer esa firma.


Pero hay matices

La detección no es 100%

Incluso el mejor sistema tiene margen de error. Con suficientes intentos y variaciones, un atacante persistente podría encontrar un audio que pase.

Otras herramientas son diferentes

ElevenLabs es detectable porque es popular y los sistemas están entrenados para detectarla. Herramientas menos conocidas o custom pueden ser más difíciles.

La carrera armamentista continúa

ElevenLabs y otras herramientas mejoran constantemente. Lo que se detecta hoy puede no detectarse mañana sin actualización de modelos.


Qué significa para tu seguridad

Si tenés biometría SIN anti-spoofing

Riesgo: ALTO

ElevenLabs (y herramientas similares) probablemente pueden pasar tu autenticación. Deberías:

  1. Agregar anti-spoofing urgentemente
  2. No confiar solo en biometría de voz
  3. Implementar controles adicionales

Si tenés anti-spoofing estático

Riesgo: MEDIO

Detectás la mayoría de los ataques, pero no todos. Deberías:

  1. Verificar que tu proveedor actualice modelos regularmente
  2. Monitorear intentos de spoofing detectados
  3. Considerar upgrade a adaptativo

Si tenés anti-spoofing adaptativo

Riesgo: BAJO (pero no cero)

Tenés la mejor protección disponible. Deberías:

  1. Verificar frecuencia de actualización
  2. Implementar defensa multicapa de todos modos
  3. No confiar en ningún factor único

El experimento expandido

Probamos otras herramientas además de ElevenLabs:

HerramientaSistema A (sin)Sistema B (estático)Sistema C (adaptativo)
ElevenLabs100% éxito33% éxito0% éxito
Resemble AI100% éxito40% éxito5% éxito
OpenVoice100% éxito55% éxito8% éxito
RVC100% éxito60% éxito12% éxito
XTTS100% éxito45% éxito3% éxito

Observaciones:

  • Sin anti-spoofing, todas las herramientas pasan
  • El anti-spoofing estático es parcialmente efectivo
  • El adaptativo es mucho mejor, pero RVC y OpenVoice son más difíciles de detectar
  • Voice conversion (RVC) es el desafío más grande

Recomendaciones

Para empresas

  1. Verificá que tu sistema tenga anti-spoofing moderno
  2. Preguntá a tu proveedor con qué frecuencia actualiza
  3. No confíes solo en biometría: defensa multicapa
  4. Hacé pruebas regulares con herramientas de síntesis actuales

Para proveedores

  1. Actualización continua es obligatoria
  2. Monitorear nuevas herramientas constantemente
  3. Testing adversarial regular
  4. Transparencia con clientes sobre limitaciones

Para todos

  1. No asumas que “biometría de voz” significa “seguro”
  2. El anti-spoofing hace la diferencia
  3. La carrera armamentista es real: necesitás defensas que evolucionen

Conclusión

¿Puede ElevenLabs engañar a un sistema de biometría de voz?

  • Sin anti-spoofing: Sí, fácilmente
  • Con anti-spoofing estático: A veces
  • Con anti-spoofing adaptativo: Raramente, pero el riesgo nunca es cero

La moraleja: la biometría de voz sin anti-spoofing actualizado es un riesgo, no una protección.


¿Querés probar tu sistema? Contactanos y te ayudamos a evaluarlo.


Recursos relacionados

¿Querés implementar biometría de voz?

Agendá una demo y descubrí cómo Phonomica puede ayudarte.