La nueva generación de inteligencia artificial de Google destaca por un razonamiento de vanguardia y comprensión multimodal nativa, capaz de descifrar la complejidad de cualquier tarea, desde el aprendizaje hasta la codificación avanzada.

Google acaba de dar un salto cuántico en el panorama de la inteligencia artificial con el lanzamiento de Gemini 3. Este nuevo modelo no es solo una actualización, sino un hito que, según sus creadores, marca un paso significativo en el camino hacia la inteligencia artificial general (IAG). La novedad principal radica en que Gemini 3 es el modelo más inteligente que Google ha desarrollado hasta la fecha, combinando la capacidad de razonamiento profundo con una comprensión multimodal nativa que le permite abordar cualquier idea con una profundidad y matices sin precedentes.

La compañía ha enfocado el desarrollo de esta tecnología para que sea capaz de ayudarte a “aprender, construir y planificar cualquier cosa”, llevando las capacidades avanzadas al mundo más rápido que nunca. Para Sundar Pichai, CEO de Google and Alphabet, la era de Gemini ha sido un proyecto masivo y exitoso: «Hace casi dos años iniciamos la era Gemini, uno de nuestros mayores proyectos científicos y de producto jamás emprendidos como empresa. Desde entonces, ha sido increíble ver cuánto le gusta a la gente.» Pichai destaca el impacto masivo: la Visión General de IA ya cuenta con 2.000 millones de usuarios mensuales, y la aplicación Gemini supera los 650 millones de usuarios al mes.

Razonamiento que entiende la complejidad

Lo que realmente diferencia a Gemini 3 Pro —la primera versión del modelo disponible en preliminar— es su razonamiento de vanguardia. Está diseñado para entender la profundidad y los matices, ya sea capturando las sutiles pistas de una idea creativa o desentrañando las capas superpuestas de un problema complejo. Además, ha demostrado ser mucho mejor para comprender el contexto y la intención detrás de la solicitud del usuario, simplificando la interacción y haciéndola más precisa.

El rendimiento del modelo ha batido récords en la industria. Superó significativamente a su predecesor, Gemini 2,5 Pro, en todas las principales pruebas de referencia de IA, y encabeza la tabla de clasificación de LMArena con 1.501 puntos, superando el récord anterior por 50 puntos ELO. Esto demuestra que es capaz de un razonamiento de nivel de doctorado, logrando puntuaciones máximas como el 91,9% en GPQA Diamond y un nuevo estado del arte del 23,4% en MathArena Apex.

En el ámbito de la comprensión multimodal, es decir, la capacidad de procesar texto, imágenes, vídeo, audio y código simultáneamente, Gemini 3 Pro también establece nuevos estándares con puntuaciones revolucionarias como el 87,2% en Video-MMMU.

La promesa de “Deep Think” y los Agentes

Llevando este razonamiento aún más lejos, Google está introduciendo Gemini 3 Deep Think, un modo de razonamiento mejorado que promete un salto cualitativo. Este modo va más allá de la versión Pro, alcanzando un 41,0% en Humanity’s Last Exam (sin el uso de ninguna herramienta) y un 93,8% en GPQA Diamond, demostrando una habilidad sin precedentes para resolver problemas aún más complejos.

Para Demis Hassabis, CEO de Google DeepMind, y Koray Kavukcuoglu, CTO de Google DeepMind and Chief AI Architect, Google, este lanzamiento es crucial: «Hoy damos otro gran paso en el camino hacia la inteligencia artificial general (IAG) y lanzamos Gemini 3.» Ellos lo describen como «el mejor modelo del mundo para la comprensión multimodal y nuestro modelo de codificación de agentes y vibraciones más potente hasta la fecha.»

Estas capacidades impulsan el desarrollo de agentes de IA, que son programas capaces de ejecutar tareas complejas de forma autónoma. Un ejemplo de esto es la nueva plataforma de desarrollo Google Antigravity, presentada para que los desarrolladores puedan operar a un nivel superior, enfocado en tareas. Utiliza las capacidades de razonamiento y codificación agentiva de Gemini 3 para planificar y ejecutar tareas de software complejas de principio a fin, transformando la asistencia de IA en un socio activo de desarrollo.

Aplicaciones tangibles para la vida diaria

Para el usuario promedio, las capacidades de Gemini 3 se traducen en herramientas de gran utilidad.

  • Aprender cualquier cosa: El modelo puede descifrar y traducir recetas escritas a mano en diferentes idiomas para crear un libro de cocina familiar, o analizar artículos académicos y generar código para crear tarjetas didácticas interactivas y visualizaciones. Si estás aprendiendo a jugar pickleball, puede analizar un vídeo de tus partidos, identificar áreas de mejora y generar un plan de entrenamiento. La tecnología llega al Buscador en el Modo IA, habilitando experiencias de interfaz de usuario generativas, como simulaciones interactivas sobre temas complejos, como el funcionamiento de la ARN polimerasa.
  • Planificar cualquier cosa: Gracias a su mejor planificación a largo plazo, demostrada en pruebas de gestión de negocios simulados, Gemini 3 puede actuar en nombre del usuario, navegando por flujos de trabajo más complejos y de varios pasos. Esto incluye desde clasificar tu bandeja de entrada de Gmail hasta planificar un itinerario de viaje de forma integral, todo bajo tu control y guía.

Google ha comenzado a implementar Gemini 3 en una amplia gama de productos y servicios, incluyendo el Modo IA en el Buscador, la aplicación Gemini, AI Studio, Vertex AI y la plataforma Google Antigravity. La compañía también ha puesto un énfasis especial en la seguridad, asegurando que Gemini 3 es su modelo más seguro hasta la fecha, sometido al conjunto más amplio de evaluaciones de seguridad antes de su lanzamiento.

*En la creación de este texto se usaron herramientas de inteligencia artificial.