Estafas con clonación de voz por IA: cómo funcionan y cómo proteger a su familia

Seguridad y estafas Guide9 min de lectura·Actualizado el 4 de julio de 2026
La respuesta corta

Las estafas con clonación de voz por IA usan una grabación corta —tomada de las redes sociales— para crear una llamada falsa que suena exactamente como un familiar real. Los estafadores inventan una urgencia para que envíe dinero rápidamente. Una palabra clave familiar acordada de antemano es la forma más sencilla y fiable de detener la estafa.

Las estafas de voz no son nuevas, pero la IA las ha hecho mucho más convincentes que cualquier cosa anterior. Hoy es posible crear en minutos una llamada de alguien que suena exactamente como su hijo, su nieta o su cónyuge, usando un fragmento de un vídeo público. Saber cómo se construyen estas llamadas —y tener un plan sencillo preparado de antemano— marca una diferencia real.

Cómo se desarrolla la llamada

La llamada suele comenzar con una emergencia. La voz al otro lado suena angustiada: un accidente de coche, una detención, una situación médica repentina. El objetivo es mantenerle emocionalmente alterado y actuando rápido. El pánico anula nuestra cautela habitual.

A menudo se suma un segundo interlocutor —haciéndose pasar por abogado, policía o médico— que explica por qué hay que mover dinero ahora mismo y le pide que no llame a nadie más primero. La urgencia es el punto central. Los estafadores saben que una persona tranquila que simplemente cuelgue y llame directamente a su hijo no caerá en la trampa.

El método de pago es casi siempre imposible de rastrear: tarjetas de regalo, transferencias bancarias o criptomonedas. Las emergencias reales no funcionan así.

Por qué unos pocos segundos de audio son suficientes

Las herramientas de IA para voz pueden aprender las características distintivas de una voz —su tono, ritmo, acento y pequeñas peculiaridades personales— a partir de una muestra sorprendentemente corta. Los vídeos publicados en redes sociales, clips de TikTok o Instagram, apariciones en YouTube, grabaciones de pódcast o incluso saludos del buzón de voz son fuentes potenciales.

La copia no es perfecta, pero no tiene que serlo. Las llamadas telefónicas ya comprimen el audio y añaden ruido de fondo. Una voz lo suficientemente parecida, combinada con una historia angustiante y una llamada corta, suele resultar convincente en el momento.

Por eso decirse a sí mismo «reconocería la voz de mi propia hija» no es una defensa fiable. La voz clonada no intenta engañar a un experto en una habitación silenciosa: solo necesita engañar a un padre preocupado en una conexión telefónica imperfecta durante noventa segundos.

Señales de alerta durante la llamada

Aunque la voz suene bien, otras partes de la llamada a menudo indican que algo va mal. Esté atento a estas señales:

  • La persona que llama le presiona para que actúe de inmediato. Las emergencias reales permiten un momento para pausar y verificar. Los estafadores no.
  • Le dicen que no llame a nadie más. Ningún abogado, policía u hospital real le dirá esto.
  • La solución requiere tarjetas de regalo, transferencias bancarias o criptomonedas. Las fianzas, las facturas hospitalarias y los honorarios legales no se pagan de esta manera.
  • La persona que llama evita detalles personales concretos. Un familiar real conocerá su historia compartida, el nombre de un amigo en común o un detalle familiar que un extraño no sabría.
  • La calidad de la llamada parece extrañamente distorsionada. Un tono ligeramente robótico o pequeñas pausas pueden ser una pista, aunque las herramientas más nuevas están mejorando en ocultar estas señales.

El plan familiar de cinco minutos

La protección más eficaz es una palabra clave familiar compartida: una frase corta e inusual que solo conozca su familia. Si alguien llama afirmando ser un familiar en apuros, usted pide la palabra clave. Un estafador no la sabrá.

Elija una frase rara y memorable. Escoja algo que nunca usaría en una conversación cotidiana. Evite apodos o cualquier cosa que pueda surgir de forma natural. Algo como «martillo lila» o «la caja de recetas de la abuela» funciona bien. Cuanto más específica e inusual, mejor.

Compártala en privado. Dígasela a todos los miembros de la familia que puedan recibir o hacer una llamada de emergencia. Hágalo en persona o en una conversación privada directa, no en un chat grupal donde se pueden hacer capturas de pantalla fácilmente.

Acuerde una sola regla. Quien llame afirmando ser un familiar en una emergencia debe decir la palabra clave cuando se le pida, sin excepciones. Acuerden de antemano que aunque el interlocutor diga que no puede decir la palabra en ese momento, usted igualmente cuelga y llama directamente. Una emergencia real puede esperar dos minutos.

Practíquenla una vez. Hagan una llamada breve en la que alguien pida la palabra y otra persona la diga correctamente. Esto hace que se sienta natural y confirma que todos la tienen bien. Toma unos treinta segundos.

Qué hacer cuando llega una llamada sospechosa

Incluso con una palabra clave establecida, esta es la secuencia correcta para cualquier llamada de emergencia sospechosa:

  1. Mantenga la calma. La urgencia es una herramienta que el interlocutor usa en su contra.
  2. Pida la palabra clave. Si no pueden proporcionarla, cuelgue.
  3. Llame a su familiar al número que ya tiene guardado, nunca use el número que le haya dado el interlocutor.
  4. No envíe dinero, tarjetas de regalo ni criptomonedas basándose en una sola llamada inesperada. Verifique siempre primero.
  5. Reporte la llamada a las autoridades competentes si cree que fue una estafa.

Lo más importante que puede hacer es darse tiempo. Los estafadores dependen del pánico. Una pausa de dos minutos para llamar de vuelta a un número conocido suele ser suficiente para romper la ilusión.

Qué probar a continuación: Consulte la guía paso a paso en Palabras clave para familias y aprenda cómo se usa la misma tecnología de IA para crear vídeos falsos en Cómo detectar un vídeo deepfake.

Publicado el 4 de julio de 2026 · Actualizado el 4 de julio de 2026Cómo lo probamos →

Preguntas frecuentes

¿Cómo pueden los estafadores clonar una voz tan rápido?
Las herramientas de IA modernas solo necesitan un fragmento corto —a veces unos pocos segundos— para producir una copia convincente de una voz. Los vídeos públicos en redes sociales, YouTube o incluso un mensaje de voz pueden usarse como fuente.
¿Podré detectar que la voz es falsa?
A menudo no. Las voces clonadas pueden sonar muy parecidas a la persona real, especialmente en una llamada telefónica donde la calidad de audio varía de todos modos. Es mejor confiar en un método de verificación como una palabra clave que en sus propios oídos.
¿Qué debo hacer si recibo una de estas llamadas?
Cuelgue y llame a su familiar al número que ya tiene guardado. Nunca llame de vuelta al número que le proporcione la persona que llamó. Nunca envíe dinero, tarjetas de regalo ni transferencias bancarias basándose en una sola llamada inesperada.
¿El saludo de mi buzón de voz es suficiente para que alguien clone mi voz?
Puede serlo. Las muestras más largas con habla natural dan más material a los estafadores, pero incluso un saludo corto es un punto de partida. Los vídeos públicos en redes sociales son objetivos aún más fáciles.
¿Debo compartir la palabra clave familiar por mensaje de texto o chat grupal?
No. Compártala en persona o en una conversación privada directa. Cuantas menos personas la conozcan fuera de su familia inmediata, mejor funciona.
Radim Sekera
Fundador y editor

Radim es desarrollador de software que pasa el día construyendo con IA y las noches explicándosela a familiares que no les importa cómo funciona, solo qué puede hacer por ellos. Cada guía se prueba a mano antes de publicarse.