Cibercriminales manipulan a los asistentes de IA con comandos ocultos en la web. Conoce cómo opera PromptFix y qué hábitos adoptar para protegerte.

La inteligencia artificial ha transformado radicalmente las reglas del juego en el ecosistema digital, convirtiéndose en una herramienta de doble filo. Si bien esta tecnología es hoy un elemento clave para la prevención y detección de ciberataques, también se ha transformado en un instrumento potente para ejecutar acciones maliciosas. La premisa es inquietante: la IA, diseñada para ayudarnos, también puede ser engañada y utilizada como un vector de ataque directo contra las víctimas.

En este contexto, ESET, compañía líder en detección proactiva de amenazas, ha encendido las alarmas sobre una nueva técnica denominada PromptFix. Se trata de una variante específica del conocido prompt injection, diseñada meticulosamente para engañar a los asistentes de inteligencia artificial que hoy se encuentran integrados en la mayoría de los navegadores web modernos.

La evolución del engaño digital

El término PromptFix surge como una evolución sofisticada de la técnica ClickFix, la cual solía engañar a los usuarios para que hicieran clic en verificaciones falsas con el fin de ejecutar acciones dañinas. Sin embargo, la nueva modalidad va un paso más allá en la automatización del delito. Mediante instrucciones ocultas, esta técnica logra que la IA interactúe con sitios web maliciosos o de phishing sin que el usuario lo perciba.

Para comprender la gravedad del asunto, es fundamental escuchar a los expertos. Martina Lopez, Investigadora de Seguridad Informática de ESET Latinoamérica, explica la mecánica detrás de esta amenaza: “Los actores maliciosos insertan instrucciones ocultas en contenido aparentemente legítimo para que la IA realice ciertas acciones sin que el usuario lo sepa ni tenga que intervenir. Por ejemplo, hacer clic en botones invisibles que simulan verificaciones, descargar archivos maliciosos o interactuar con enlaces fraudulentos”.

¿Cómo funciona la trampa?

La efectividad de un ataque PromptFix radica en su invisibilidad. Los cibercriminales ocultan instrucciones maliciosas en sitios web que han sido comprometidos o en contenidos que ellos mismos controlan dentro de plataformas públicas, como comentarios en Reddit o publicaciones en Facebook.

Las técnicas de ocultamiento son variadas y creativas: pueden esconder las instrucciones mediante texto invisible, camuflarlas en comentarios HTML, incrustar texto dentro de imágenes o esconder información en archivos digitales sin que su apariencia externa se vea alterada.

El momento crítico ocurre cuando un usuario navega por uno de estos sitios y solicita a su asistente de IA que resuma el contenido o extraiga puntos clave. El modelo de lenguaje procesa todo el texto disponible sin distinguir entre los datos legítimos y las instrucciones maliciosas. De esta manera, la IA interpreta los comandos ocultos como si fueran solicitudes legítimas hechas por el propio usuario.

Las consecuencias pueden ser severas. Esto puede llevar al agente de IA a realizar acciones no deseadas, como interactuar con enlaces fraudulentos, iniciar descargas de archivos infectados con malware, hacer clic en botones ocultos para evadir pasos de validación o exponer credenciales sensibles.

Guía práctica: hábitos para blindar tu navegación

Dado que la característica distintiva de PromptFix es su capacidad para operar sin el conocimiento de la víctima, la prevención se vuelve la única barrera efectiva. Desde ESET destacan una serie de buenos hábitos que todos los usuarios deberían implementar de inmediato para estar protegidos:

  • No autorizar acciones automáticas: Nunca se debe permitir la automatización por defecto. Si la inteligencia artificial desea hacer clic, enviar un archivo o completar un formulario, debe estar configurada para pedir permiso y obtener la confirmación explícita del usuario primero.
  • Limitar el alcance del agente: Es vital no otorgar permisos irrestrictos a la IA. Se recomienda no permitir que navegue libremente por internet, restringir su acceso a las contraseñas guardadas y deshabilitar el uso del autocompletado.
  • Filtrar archivos e imágenes: Considerando que los atacantes esconden instrucciones en medios visuales, lo ideal es pasar los archivos por un filtro que busque texto oculto o señales extrañas antes de permitir que la IA los procese.
  • Listas blancas de sitios: Configure su asistente para que solamente interactúe con sitios web que sean conocidos y confiables.
  • Bloqueo ante la duda: Si el sistema detecta un enlace sospechoso, la norma debe ser bloquearlo y pedir autorización manual antes de proceder.

La seguridad digital es un entorno en constante cambio y la inteligencia artificial, aunque útil, requiere una supervisión humana atenta para no convertirse en la puerta de entrada para los ciberdelincuentes.

*En la creación de este texto se usaron herramientas de inteligencia artificial.