Notebookcheck Logo

Google anuncia los modelos Gemini 2.0 para "la era agéntica

Google anuncia los modelos Gemini 2.0 para "la era agéntica" (Fuente de la imagen: Google)
Google anuncia los modelos Gemini 2.0 para "la era agéntica" (Fuente de la imagen: Google)
Google ha anunciado la nueva generación de la familia Gemini 2.0 de modelos de IA construidos para "la era agéntica" Gemini 2.0 Flash está disponible en Google AI Studio y Vertex AI.

Nueve meses después del lanzamiento de Gemini 1.5, Google anunció la próxima gran actualización del Modelo de Lenguaje Grande (LLM), Gemini 2.0. El primer modelo de la familia, Gemini 2.0 Flash, puede seleccionarse como modelo experimental en Google AI Studio y Vertex AI.

Gemini 2.0 Flash tiene "un rendimiento mejorado con tiempos de respuesta igual de rápidos" y supera a 1.5 Flash con "el doble de velocidad" Además de la entrada multimodal como imágenes, texto, vídeo y audio, el nuevo LLM admite imágenes mezcladas con texto y audio multilingüe de texto a voz.

2.0 Flash también puede acceder de forma nativa a Google Search y admite la ejecución de código de terceros y funciones predefinidas. Google también pone a disposición de los desarrolladores su API Multimodal Live. Una versión optimizada para chat de Flash 2.0 estará disponible en navegadores de escritorio y móviles. Google afirma que pronto estará disponible una versión para la aplicación móvil Gemini.

El prototipo de investigación Project Astra de Google también se ha actualizado con Gemini 2.0 y ahora cuenta con mejores diálogos, razonamientos y compatibilidad nativa con herramientas como Google Search, Lens y Maps. Dispone de hasta 10 minutos de memoria durante la sesión.

El Proyecto Mariner, otro prototipo de investigación construido sobre 2.0, puede comprender instrucciones complejas y acceder a información de la pantalla de un navegador, incluidos "píxeles y elementos web como texto, código, imágenes y formularios, y luego utiliza esa información a través de una extensión experimental de Chrome para completar tareas por usted"

El tercer prototipo, un asistente de código de IA experimental, Jules, puede integrarse directamente en los flujos de trabajo de GitHub. Dispone de capacidades de razonamiento y lógica para abordar retos de código y desarrollar un plan para resolverlos bajo la supervisión del desarrollador.

Google afirma que también ha construido agentes de IA "utilizando Gemini 2.0 que pueden ayudarle a navegar por el mundo virtual de los videojuegos. Puede razonar sobre el juego basándose únicamente en la acción de la pantalla y ofrecer sugerencias sobre qué hacer a continuación en una conversación en tiempo real."

Fuente(s)

Please share our article, every link counts!
Mail Logo
Rohith Bhaskar, 2024-12-12 (Update: 2024-12-12)