OpenAI presenta GPT-5.4 con versiones Pro y Thinking orientadas al trabajo profesional

OpenAI ha presentado GPT-5.4, una nueva versión de su modelo fundacional que la compañía sitúa como su sistema “más capaz y eficiente” para tareas profesionales. El lanzamiento no llega solo. Junto a la versión estándar, OpenAI introduce GPT-5.4 Thinking, orientado al razonamiento, y GPT-5.4 Pro, pensado para escenarios de alto rendimiento.

La apuesta es clara: convertir el modelo en una herramienta más útil para trabajo real y menos dependiente de demostraciones llamativas. El foco ya no está solo en responder bien, sino en resolver tareas complejas con más velocidad, menos coste y menos errores.

Uno de los cambios más destacados está en la API. OpenAI amplía la ventana de contexto hasta un millón de tokens, la mayor capacidad que ha ofrecido hasta ahora. Esto permite trabajar con cantidades de información mucho más grandes en una sola interacción. Un ejemplo práctico sería cargar contratos extensos, documentación técnica y notas internas de una empresa sin tener que fragmentarlo todo en múltiples solicitudes.

Esa mejora de contexto no es solo una cifra para titulares. Tiene implicaciones directas en el uso profesional. Un equipo legal puede revisar documentación amplia en un único flujo. Un analista financiero puede cruzar informes, hojas de cálculo y presentaciones sin perder continuidad. Cuando el modelo mantiene más contexto, reduce fricción y ahorra tiempo.

OpenAI también asegura que GPT-5.4 utiliza los tokens de forma más eficiente. Traducido a un entorno de negocio, esto significa que el sistema puede abordar problemas similares consumiendo menos recursos que versiones anteriores. Para empresas que operan a gran escala, esa diferencia impacta en costes, latencia y viabilidad operativa.

En rendimiento, la compañía destaca avances en varios benchmarks. GPT-5.4 logra resultados superiores en pruebas como OSWorld-Verified y WebArena Verified, centradas en uso de ordenador y navegación en entornos complejos. También alcanza un 83% en GDPval, una evaluación interna de OpenAI orientada a tareas de conocimiento profesional.

A eso se suma su posición en APEX-Agents, una prueba de Mercor enfocada en habilidades aplicadas a áreas como derecho o finanzas. Según Brendan Foody, consejero delegado de esa plataforma, GPT-5.4 sobresale en la creación de entregables complejos de largo recorrido, como presentaciones, análisis jurídicos o modelos financieros. La promesa ya no gira solo en torno a contestar preguntas, sino a producir trabajo utilizable.

Ese matiz importa. Durante años, muchos modelos han impresionado en conversaciones breves, pero se han debilitado en tareas largas y estructuradas. Elaborar una presentación coherente de 20 diapositivas o construir un análisis financiero consistente exige más que brillantez puntual. Exige continuidad, criterio y menos fallos acumulados.

Precisamente ahí OpenAI pone otro acento: la reducción de errores. Según la compañía, GPT-5.4 es un 33% menos propenso a cometer errores en afirmaciones individuales frente a GPT-5.2. Además, el conjunto de respuestas presenta un 18% menos de errores en general. En ámbitos donde una cifra mal colocada o una referencia jurídica incorrecta puede alterar una decisión, esa mejora resulta más relevante que cualquier eslogan comercial.

El lanzamiento también introduce cambios en la forma en que el modelo utiliza herramientas externas desde la API. OpenAI incorpora Tool Search, un sistema que permite consultar las definiciones de herramientas solo cuando son necesarias. Antes, esas definiciones debían incluirse desde el principio en el prompt del sistema, lo que disparaba el consumo de tokens cuando el número de herramientas disponibles era elevado.

Un ejemplo sencillo ayuda a entenderlo. Si una empresa conecta el modelo con diez herramientas distintas, desde CRM hasta base documental interna, el sistema ya no necesita cargar toda esa información en cada interacción. Solo busca la herramienta cuando realmente la va a usar. Eso mejora eficiencia y simplifica la arquitectura técnica.

En paralelo, OpenAI ha puesto el foco en la seguridad del razonamiento. La compañía ha incorporado una evaluación específica sobre el llamado chain-of-thought, el proceso mediante el cual los modelos muestran pasos intermedios al razonar tareas complejas. Algunos investigadores venían advirtiendo de que estos modelos podían representar ese proceso de forma incompleta o engañosa.

Según OpenAI, las pruebas realizadas indican que el riesgo de ese comportamiento es menor en GPT-5.4 Thinking. La compañía sostiene que esta versión presenta menos capacidad para ocultar su razonamiento, lo que refuerza la utilidad de supervisar ese proceso en contextos sensibles. La seguridad ya no se limita a filtrar respuestas peligrosas; también pasa por entender cómo razona el sistema cuando trabaja.

OpenAI quiere que GPT-5.4 se perciba como una infraestructura de trabajo profesional, no solo como un chatbot más potente. Más contexto, mejor uso de herramientas, menos errores y mayor control del razonamiento forman parte de esa estrategia.

¿Será suficiente este nuevo modelo para frenar la salida de usuarios de ChatGPT a Cluade?

No hay comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *