Notebookcheck Logo

La herramienta de IA DiffUHaul de Nvidia puede mover objetos en imágenes

El modelo de IA DiffUHaul de Nvidia puede mover objetos en imágenes (Fuente de la imagen: Omri Avrahami en YouTube)
El modelo de IA DiffUHaul de Nvidia puede mover objetos en imágenes (Fuente de la imagen: Omri Avrahami en YouTube)
Investigadores de Nvidia han desarrollado una nueva herramienta de IA que puede reubicar objetos en imágenes. La herramienta puede cambiar la posición de un objeto en una imagen sin afectar al fondo.

Investigadores de Nvidia han publicado en un artículo sobre una nueva herramienta de IA, DiffUHaul, que puede comprender y mover objetos dentro de una imagen sin cambiar el tamaño ni el fondo. El documento dice que la herramienta "aprovecha la comprensión espacial de un modelo localizado de texto a imagen, para la tarea de arrastre de objetos"

Los modelos actuales de texto a imagen tienen dificultades con las tareas complejas de edición de imágenes porque carecen de "razonamiento espacial" DiffuHaul resuelve este problema incorporándolo al modelo, lo que le permite rastrear objetos a través de una imagen, reubicándolos "sin fisuras" sin alterar nada más.

Para lograrlo, la herramienta enmascara el objeto durante los pasos de eliminación de ruido, lo que le ayuda a comprender su ubicación y separarlo del fondo. A continuación, interpola la diferencia entre la imagen original y la generada para colocar el objeto en una nueva posición sin tocar el fondo. Después, los detalles y rasgos más finos de la imagen original se trasladan a la nueva para mantener la coherencia.

DiffUHaul se basa en BlobGENun modelo que utiliza la comprensión espacial para componer imágenes a partir de indicaciones complejas. El documento afirma que la herramienta no requiere entrenamiento, lo que significa que se creó sin ningún conjunto de datos y funciona nada más sacarla de la caja.

Please share our article, every link counts!
Mail Logo
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2024 12 > La herramienta de IA DiffUHaul de Nvidia puede mover objetos en imágenes
Rohith Bhaskar, 2024-12- 3 (Update: 2024-12- 3)