El gigante tecnológico quiere revolucionar el mercado con el lanzamiento de Gemini 3,5 Flash, sus nuevas gafas inteligentes Android XR y herramientas de agentes de IA aplicadas a la ciencia y la productividad diaria, entre otras novedades anunciadas en el I/O 2026.

En la última edición del evento Google I/O 2026, la compañía del buscador más famoso del planeta dejó en claro que la inteligencia artificial ya no es solo una herramienta de consulta pasiva, sino un motor de acción directa. Bajo el liderazgo de su director ejecutivo, la empresa consolidó una estrategia integral que abarca desde silicio personalizado hasta modelos de frontera capaces de resolver flujos de trabajo altamente complejos de manera autónoma.

«Llegamos a una etapa del ciclo de la IA en la que las personas quieren ver su valor en los productos que usan todos los días» , afirmó Sundar Pichai, CEO de Google and Alphabet. El directivo destacó que, a diez años de haber reorientado la firma hacia un enfoque centrado en esta tecnología, el procesamiento mensual de información en sus plataformas se multiplicó por siete en el último año, superando la descomunal cifra de 3,2 mil billones de tokens al mes.

A continuación, detallamos las innovaciones más importantes presentadas en el evento, organizadas por su impacto y relevancia para el futuro de los usuarios y la comunidad global.

1. Gemini 3,5 Flash: Inteligencia de frontera y velocidad sin precedentes

La gran estrella del evento fue la presentación de Gemini 3,5, la familia de modelos más reciente diseñada específicamente para ejecutar tareas complejas a largo plazo mediante el uso de agentes inteligentes. La serie inicia su despliegue global con Gemini 3,5 Flash, un modelo que rompe la tradicional barrera de elección entre calidad de respuesta y velocidad de procesamiento.

De acuerdo con las pruebas técnicas de la compañía, Gemini 3,5 Flash es cuatro veces más rápido en tokens de respuesta por segundo en comparación con otros modelos de frontera de la industria. Además, supera de forma consistente a versiones previas como Gemini 3,1 Pro en pruebas de rendimiento agéntico y de programación como Terminal-Bench 2,1 (alcanzando un 76,2%) y MCP Atlas (con un 83,6%).

Este equilibrio permite que tareas que antes requerían horas de desarrollo o días de auditoría financiera se realicen en una fracción de tiempo y a menos de la mitad del costo operativo habitual. El modelo ya se encuentra disponible para el público general a través de la aplicación Gemini y en el Buscador de Google. Asimismo, los directivos anunciaron que la versión Gemini 3,5 Pro ya se usa de forma interna y se lanzará oficialmente el próximo mes.

2. Lentes inteligentes de audio: La IA se desprende de las pantallas

Otra de las sorpresas más comentadas de la jornada fue el anuncio del ecosistema Android XR, desarrollado de forma conjunta con gigantes como Samsung y Qualcomm. En este marco, se presentaron las nuevas monturas de gafas inteligentes de audio en alianza con las reconocidas marcas de diseño Gentle Monster y Warby Parker.

Estas gafas de audio, que llegarán al mercado a finales de este año, están diseñadas para que el usuario pueda interactuar con el asistente digital Gemini con solo decir «Hey Google» o tocar un costado del armazón. El dispositivo integra bocinas privadas sobre la oreja con un sonido sumamente nítido, permitiendo realizar consultas multimodales en tiempo real. Por ejemplo, el usuario puede preguntar detalles sobre un menú, pedir indicaciones de navegación paso a paso con mapas, traducir la voz de un interlocutor extranjero adaptando el tono original o solicitar que Gemini ordene un café mediante Doordash en segundo plano, interviniendo únicamente para la confirmación final del pago.

3. Agentes de información y una renovación histórica del Buscador

El buscador de Google experimentó su actualización de interfaz y funcionamiento más profunda en los últimos 25 años gracias a la integración de un nuevo cuadro de búsqueda inteligente potenciado por IA. Este espacio ahora es completamente dinámico y permite a los usuarios describir de forma exacta lo que necesitan mediante combinaciones de texto, voz, imágenes, archivos y videos.

La plataforma da paso formal a la era de los agentes en el Buscador. La primera fase incluirá los denominados agentes de información, programas que operan las 24 horas del día en segundo plano analizando la web (blogs, redes sociales y datos en tiempo real de deportes o finanzas) para enviar resúmenes accionables al usuario. Un ejemplo práctico provisto por la firma es la búsqueda de un apartamento: el usuario define sus requisitos específicos y el agente monitoreará continuamente la red, notificando de inmediato cuando aparezca una oferta compatible.

Adicionalmente, se anunciaron capacidades agénticas de reserva. El sistema podrá buscar disponibilidad de servicios locales (como salones de karaoke o restaurantes) con criterios específicos e incluso podrá realizar llamadas telefónicas autónomas en representación del usuario para coordinar citas en rubros como cuidado de mascotas, reparaciones del hogar o belleza. Esta última función se habilitará inicialmente para residentes de Estados Unidos durante su temporada de verano.

Por último, el Buscador sumará capacidades de programación agéntica a través de Google Antigravity, creando interfaces de usuario personalizadas al instante. Si un usuario desea armar un plan de bienestar o una mudanza, la IA escribirá código en tiempo real para generar paneles y planillas de seguimiento interactivas que funcionen como mini aplicaciones a medida.

4. Gemini for Science: Acelerando el método científico con agentes de uso general

En el ámbito de la innovación y la salud, se presentó la colección de herramientas experimentales Gemini for Science en Google Labs, cuyo objetivo central es funcionar como un multiplicador del ingenio de los investigadores ante la enorme avalancha de literatura científica que se publica anualmente.

«Creemos que una nueva era de descubrimiento no necesita modelos especializados con un alcance acotado, sino agentes de uso general que los investigadores puedan aprovechar en todos los campos científicos» , explicaron de manera conjunta Pushmeet Kohli, Chief Scientist de Google Cloud y vicepresidente de Google DeepMind , junto con Yossi Matias, vicepresidente y gerente general de Google Research.

La iniciativa se compone de tres prototipos principales en Google Labs:

  • Hypothesis Generation (potenciado por Co-Scientist): Simula discusiones científicas ejecutando competencias de ideas entre múltiples agentes para evaluar, debatir y generar nuevas hipótesis verificadas con rigor bibliográfico.
  • Computational Discovery (potenciado por AlphaEvolve y ERA): Un motor agéntico que genera y califica miles de variaciones de código en paralelo para ejecutar experimentos computacionales complejos en epidemiología o predicción de energía solar en semanas en lugar de meses.
  • Literature Insights (potenciado por NotebookLM): Examina masivamente la literatura científica existente, estructurando los hallazgos en tablas comparativas personalizadas y permitiendo la creación de informes, infografías o resúmenes en formatos multimedia.

Grandes consorcios farmacéuticos y químicos como BASF, Klarna, Daiichi Sankyo y Bayer Crop Science ya emplean versiones preliminares de estas soluciones empresariales para optimizar cadenas de suministro y acelerar investigaciones esenciales. De forma complementaria, los artículos de investigación que validan los modelos ERA y Co-Scientist fueron publicados formalmente en la prestigiosa revista «Nature».

5. Google Flow y Flow Music: Nuevos horizontes para la creación multimedia

Para el sector de las industrias creativas, la suite de producción artística Google Flow incorporó el modelo multimodal Gemini Omni Flash. Este sistema permite un salto cualitativo en la edición precisa de secuencias de video combinando instrucciones en lenguaje natural con grabaciones reales.

La plataforma suma el Google Flow Agent, un asistente que puede redactar y probar diálogos entre personajes, proponer giros en las tramas narrativas o realizar ediciones por lotes de manera automatizada en miles de recursos gráficos a la vez. Asimismo, la función Google Flow Tools abre la puerta al denominado vibe coding, un concepto que permite a los creadores diseñar e implementar herramientas personalizadas de posproducción o efectos visuales utilizando lenguaje común, prescindiendo por completo del conocimiento de código técnico de programación.

Por su parte, Google Flow Music —que integra el modelo de audio Lyria 3 Pro— implementó la capacidad de realizar modificaciones de precisión sección por sección sin alterar el resto de la pista musical. También introdujo la opción de reescribir de forma automática versiones cover de canciones creadas en la plataforma, manteniendo la estructura melódica original pero variando el ritmo o la estética a estilos específicos como formatos de baja fidelidad (lo-fi).

6. Una multimillonaria inversión en infraestructura global

Sostener la velocidad y el volumen de datos que demandan estas herramientas requiere de una fuerte inyección de capital en infraestructura de cómputo. En este sentido, los portavoces de la empresa revelaron que las inversiones anuales en CapEx escalaron desde los 31.000 millones de dólares registrados en el 2022 hasta una proyección estimada de 190.000 millones de dólares para el cierre de este año.

Esta inversión da sustento a la octava generación de sus unidades de procesamiento tensorial (TPU), adoptando por primera vez una arquitectura especializada de doble chip comercial: el modelo TPU 8t, optimizado para tareas de preentrenamiento masivo a nivel global, y el chip TPU 8i, diseñado específicamente para minimizar la latencia durante la inferencia y ejecución de solicitudes en tiempo real. Ambas placas de silicio personalizado duplican el rendimiento de procesamiento por watt, alineándose con las metas corporativas de escalabilidad energética sustentable.

*En la creación de este texto se usaron herramientas de inteligencia artificial.