Colaboraciones Inteligencia artificial Tecnología

GPT-5: ¿Mucho ruido… y pocas nueces?

19/08/2025

762

El nuevo modelo de OpenAI, presentado como un “experto a nivel de doctorado”, reduce drásticamente las alucinaciones y mejora en velocidad y costo frente a sus competidores, pero aún así su lanzamiento estuvo marcado por controversias.

Por Fernando Rodríguez Henostroza, columnista.

El 7 de agosto de 2025 marcó un hito en el desarrollo de la Inteligencia Artificial (IA) con el lanzamiento de GPT-5, la más reciente iteración del Modelo de Lenguaje Grande (LLM) de OpenAI. Anunciado con la ambiciosa etiqueta de ser una «experto a nivel de doctorado», este modelo llegó para reemplazar por completo a sus predecesores, incluido GPT-4o, prometiendo una nueva era en la interacción humano-máquina.

El CEO de OpenAI, Sam Altman, no dudó en comparar este lanzamiento con el Proyecto Manhattan, sugiriendo la magnitud de su impacto potencial.

Entre las afirmaciones más destacadas de OpenAI, se encuentra una drástica reducción en la tasa de alucinaciones, pasando de más del 20% en versiones anteriores a un impresionante 4.8%.

Algunas métricas independientes incluso sitúan esta cifra en un 1.4% (según Vectara y WandB.ai), lo que representa una mejora sustancial frente a competidores como Grok 4 (4.8%) y Gemini 2.5 Pro (2.6%). GPT-5 también promete un salto significativo en razonamiento, capacidades de codificación («vibe coding») y escritura, con la habilidad de seleccionar la «mejor respuesta de 10.000 opciones».

En el ámbito del rendimiento, GPT-5 ha mostrado resultados prometedores. En tareas de codificación, se sitúa prácticamente a la par con Claude Opus 4.1 en el benchmark SWE-Bench Verified, con una ligera ventaja del 0.4%. Además, se ha reportado que es «casi el doble de rápido y el doble de económico que Grok 4», un punto clave de fricción con las afirmaciones de Elon Musk.

Las sombras de un lanzamiento

A pesar de las promesas, el lanzamiento de GPT-5 no estuvo exento de controversias y críticas. La comunidad de usuarios y figuras influyentes de la IA han levantado su voz, señalando tanto limitaciones técnicas como implicaciones éticas y funcionales.

Elon Musk, una voz prominente en el sector, ha sido uno de los críticos más vocales, afirmando que su modelo Grok 4 supera a GPT-5 en el benchmark ARC-AGI (Abstract Reasoning Challenge), diseñado para medir habilidades de razonamiento general. Aunque Grok 4 puede tener un mejor puntaje en este test, se ha señalado que su costo por tarea es significativamente más alto, haciendo que GPT-5 sea una opción más eficiente en términos de valor. De hecho, datos de arcprize.org sugieren que una versión anterior de OpenAI (o3-preview) obtenía una puntuación mucho mayor en ARC-AGI-1 que GPT-5, lo que podría indicar una regresión en ciertas capacidades de razonamiento abstracto.

Gary Marcus, reconocido crítico de la IA, calificó a GPT-5 de «retrasado, sobrevalorado y decepcionante» en su Substack. Sus principales argumentos giran en torno a una ralentización del progreso en comparación con iteraciones anteriores y la persistente falta de «modelos del mundo» en los LLM, lo que limita su verdadera comprensión y razonamiento.

Demis Hassabis de Google DeepMind ha articulado la preocupación sobre la «inteligencia artificial dentada» (jagged intelligence), donde los modelos pueden sobresalir en tareas extremadamente complejas como las Olimpiadas de Matemáticas, pero fallar en problemas de matemáticas de secundaria, una crítica que puede aplicarse a GPT-5.

La comunidad de usuarios ha experimentado una «rebelión» o «contragolpe» significativo. Muchos expresaron su descontento por la eliminación abrupta de modelos anteriores como GPT-4o, al que consideraban más «personal» y «divertido». Los usuarios de GPT-5 reportaron una percepción de «pérdida de personalidad», describiendo el modelo como «estéril».

Se quejaron de problemas funcionales, como un peor manejo de archivos, pérdida de contexto en conversaciones largas y una disminución en la calidad de la escritura creativa y la síntesis académica. Sam Altman de OpenAI reconoció un «lanzamiento accidentado», prometio el regreso de GPT-4o para usuarios de pago, lo cual ha cumplido.

El horizonte de la IA

GPT-5 se presenta como un paso adelante en la carrera de la IA, con mejoras notables en reducción de alucinaciones y eficiencia. Sin embargo, también subraya los desafíos persistentes en la comprensión del mundo real, la personalización de la interacción y la gestión de las expectativas del usuario. Las críticas de expertos y el descontento de la comunidad, junto con las implicaciones éticas de su integración, nos recuerdan que el camino hacia una Inteligencia Artificial verdaderamente madura y beneficiosa es complejo y requiere una navegación cuidadosa

Mirando hacia el futuro, el lanzamiento de GPT-5 indica varias tendencias clave. La primera es un cambio de enfoque de los modelos monolíticos a un ecosistema de agentes de IA especializados y eficientes. El sistema de niveles de OpenAI y sus modelos ‘mini’ y ‘nano’ son un claro indicio de que la industria se dirige hacia un panorama de modelos adaptados a casos de uso específicos.

Artículo anterior

TCL lanza en Perú los primeros monitores gaming QD-Mini LED

Artículo siguiente

Cómo insertar la IA en el aula

GPT-5: ¿Mucho ruido… y pocas nueces?

Las sombras de un lanzamiento

El horizonte de la IA

Televisores Aiwa con Roku TV integrado llegan al Perú

Fake Call Detection: Android frena estafas de deepfakes de voz con nueva función

De cómo los recicladores impulsan negocios sostenibles

Most Popular

Cuidado con el Wi-Fi: redes en sedes de fútbol son un riesgo

Televisores Aiwa con Roku TV integrado llegan al Perú

JBL lanza en Perú el parlante portátil Xtreme 5

Fake Call Detection: Android frena estafas de deepfakes de voz con nueva función

Recent Comments

SELECCIÓN DEL EDITOR

Google impulsa el talento digital en Perú con becas para cursos de IA y certificaciones profesionales

Cáncer en Perú 2024: Proyecciones y estrategias de prevención

De Jorge Cuyubamba a investigadores bamba | Opinión

NO TE PIERDAS

Fake Call Detection: Android frena estafas de deepfakes de voz con nueva función

Por qué un chatbot de IA no debe reemplazar a tu médico

¿Por qué tantos niños están hablando más tarde?

CATEGORÍAS POPULARES

¿QUIÉNES SOMOS?

SÍGUENOS EN: