OpenAI ha activado Lockdown Mode, una nueva función de seguridad para ChatGPT diseñada para reducir el riesgo de exposición de información sensible ante ataques de prompt injection. La medida apunta a uno de los problemas más delicados del uso de asistentes de inteligencia artificial: las instrucciones maliciosas ocultas en páginas web, archivos u otras fuentes que el sistema puede leer durante una consulta.
Este tipo de ataque no siempre depende de lo que escribe el usuario. También puede estar en el contenido que ChatGPT analiza para responder. Una página web, un documento o una fuente externa pueden incluir órdenes invisibles para la persona, pero legibles para el modelo, con el objetivo de alterar su comportamiento o forzar la salida de datos que no deberían compartirse.
El riesgo crece con el uso empresarial de la IA
La función llega en un momento clave. Cada vez más empresas usan herramientas de IA para revisar documentación interna, analizar información de clientes, preparar informes o trabajar con datos estratégicos. En ese contexto, el riesgo ya no está solo en la conversación, sino en todas las conexiones que el asistente utiliza para completar una tarea.
Con Lockdown Mode activado, ChatGPT limita varias capacidades vinculadas a fuentes externas. Según la información comunicada por OpenAI, este modo desactiva la navegación web en directo, de modo que el sistema solo puede acceder a contenido almacenado en caché. También bloquea la recuperación y visualización de imágenes procedentes de la web, aunque la generación de imágenes continúa disponible.
Qué funciones limita Lockdown Mode
La protección afecta además a herramientas avanzadas como deep research y el modo agente. Estas funciones permiten al sistema buscar, organizar información y ejecutar tareas con mayor autonomía, pero también amplían la superficie de riesgo cuando intervienen fuentes externas. Al restringirlas, OpenAI reduce las vías por las que una instrucción oculta podría manipular la respuesta de ChatGPT o facilitar una filtración.
La compañía no presenta Lockdown Mode como una barrera definitiva. OpenAI reconoce que ChatGPT todavía podría verse afectado por ataques de prompt injection incluso con esta capa de protección activa. El problema podría aparecer en contenido web almacenado en caché o en un archivo subido por el propio usuario, y llegar a influir en la precisión o el comportamiento de una respuesta.
Menos autonomía a cambio de más control
Por eso, el objetivo no es eliminar por completo la amenaza, sino disminuir la probabilidad de exfiltración de datos. Es una diferencia importante. Lockdown Mode funciona como un modo más restrictivo para escenarios en los que la seguridad pesa más que la comodidad de tener todas las herramientas conectadas.
La función está pensada especialmente para perfiles que trabajan con información sensible. Hablamos de empresas, equipos legales, departamentos financieros, profesionales con datos confidenciales o usuarios que necesitan apoyarse en IA generativa sin abrir tantas puertas a contenidos externos potencialmente manipulados.
Disponibilidad y próximos pasos
OpenAI ya ha comenzado el despliegue de Lockdown Mode en cuentas ChatGPT Business de autoservicio y en determinadas cuentas personales que cumplen los requisitos. La disponibilidad se irá aplicando a los perfiles elegibles, según la compañía.
La novedad refuerza una tendencia cada vez más clara en el sector: la seguridad de la inteligencia artificial no depende solo del modelo, sino también de las herramientas que se conectan a su alrededor. A medida que los asistentes digitales ganan acceso a webs, archivos, imágenes y tareas automatizadas, los controles sobre esas conexiones se convierten en una parte central del producto.
