<p>Doce meses después de lanzar al mercado la inteligencia artificial <strong>Gemini</strong>, Google tiene lista ya la segunda versión y, según la empresa, el nuevo conjunto de modelos de lenguaje supondrán un salto importante hacia lo que la industria denomina «agentes artificiales», <strong>inteligencias artificiales con iniciativa capaces de resolver tareas complejas sin la ayuda de instrucciones humanas.</strong></p>
La nueva versión de Gemini llegará oficialmente en enero pero ya se puede probar en algunos servicios de la compañía. La empresa está trabajando para ofrecer IA con iniciativa propia
Doce meses después de lanzar al mercado la inteligencia artificial Gemini, Google tiene lista ya la segunda versión y, según la empresa, el nuevo conjunto de modelos de lenguaje supondrán un salto importante hacia lo que la industria denomina «agentes artificiales», inteligencias artificiales con iniciativa capaces de resolver tareas complejas sin la ayuda de instrucciones humanas.
En una rueda de prensa celebrada en la sede de la empresa en Mountain View, Google ha demostrado las capacidades mejoradas del sistema, como la generación de imágenes en tiempo real y la posibilidad de mantener conversaciones naturales en varias lenguas. Entre esas nuevas funciones la más interesante es que Gemini 2.0 puede acceder directamente a productos de Google como el buscador o incluso ejecutar código.
De momento Gemini 2.0 sólo está disponible en una versión, denominada Gemini 2.0 Flash, que estará disponible en algunos servicios para desarrolladores. A partir de enero, habrá nuevas versiones y más integración con las herramientas de Google.
La empresa ha mostrado cuál podría ser su impacto en varios de los proyectos en los que está trabajando. A mediados de año, por ejemplo, Google mostró por primera vez Project Astra, un prototipo de gafas inteligentes y aplicaciones móviles capaces de identificar diferentes objetos en el campo de visión y entender el contexto de las escenas.
Con los nuevos modelos de Gemini 2, este tipo de dispositivos y aplicaciones serán capaces de identificar los objetos de forma más rápida, producir respuestas con menor latencia y recordar todo lo que ha visto en los últimos 10 minutos.
Otro proyecto, desvelado hoy, es Deep Research, un agente virtual que será capaz de navegar por la web, buscar información y presentar información detallada a modo de resumen para el usuarios. Mariner, otra aplicación desconocida hasta ahora, permitirá a una IA manejar un navegador web como lo haría un ser humano, moviendo el cursor y rellenando formularios o campos de búsqueda para resolver cualquier tarea que necesite el usuario.
Este tipo de tecnologías son necesarias para conseguir inteligencias artificiales capaces realmente de realizar acciones, no sólo contestar preguntas. Un sistema como mariner, por ejemplo, sería capaz de pedir una cita en un centro de salud o presentar una declaración de impuestos de forma autónoma en nombre de alguien usando las interfaces web ya existentes.
La compañía ha asegurado que está trabajando también en agentes inteligentes capaces de aprender a jugar a un videojuego tan sólo observando algunas partidas.
Junto a Gemini 2.0 Google ha presentado también Trillium, la sexta generación de procesadores pensados para tareas de inteligencia artificial, que son el cerebro de Gemini 2.0. EL chip está pensado para acelerar los cálculos vectoriales que son la esencia de los modelos largos de lenguaje (la que hace posible las modernas herramientas de IA). Más de 100.000 de estos chips son necesarios para crear el ordenador que hace posible la nueva versión.
El chip ofrece un rendimiento 4,7 veces superior al modelo anterior, con mayor velocidad de conexión a la memoria. También consigue un aumento del 67% en eficiencia energética, una métrica cada vez más importante dado el enorme consumo energético de los centros de datos destinados a tareas de inteligencia artificial.
Tecnología