Notebookcheck Logo

Meta's OK-Robot puede ordenar una habitación sin ayuda

El sistema de IA de OK-Robot sólo consigue recoger el 58,5 % de los objetos en hogares especialmente desordenados (imagen simbólica: DALL-E / AI)
El sistema de IA de OK-Robot sólo consigue recoger el 58,5 % de los objetos en hogares especialmente desordenados (imagen simbólica: DALL-E / AI)
OK-Robot, un nuevo sistema de IA, permite a los robots ordenar los hogares que son nuevos para ellos. El sistema reconoce los objetos y los coloca en el lugar adecuado. OK-Robot sigue teniendo dificultades en habitaciones muy desordenadas, pero el proyecto de Meta tiene mucho más éxito en habitaciones menos desordenadas.

El nuevo OK-Robot AI está diseñado para que una gran variedad de robots puedan ordenar habitaciones que son completamente nuevas para ellos. Por ejemplo, pueden recoger ropa sucia o juguetes del suelo y colocarlos en otro lugar. Otros sistemas robóticos suelen estar diseñados para funcionar en un entorno conocido.

OK-Robot trabaja con VLM (Vision-Language Models), un tipo de sistema de IA que es capaz de procesar y comprender información de texto o habla directa e imágenes al mismo tiempo. También es interesante señalar que OK-Robot trabaja con una variedad de sistemas de código abierto Modelos de IA y ha sido preentrenado con grandes conjuntos de datos que están a disposición del público.

En el lado positivo, no es necesario proporcionar al robot ningún dato de entrenamiento adicional en el entorno, simplemente funciona. En el lado negativo, sólo puede recoger un objeto y dejarlo en otro lugar. No se le puede pedir que abra un cajón, porque sólo sabe hacer esas dos cosas.

- Lerrel Pinto, profesor adjunto de informática en la Universidad de Nueva York, que codirigió el proyecto

OK-Robot no sólo funciona en el laboratorio y ha sido probado en 10 habitaciones diferentes (imagen: arvix)
OK-Robot no sólo funciona en el laboratorio y ha sido probado en 10 habitaciones diferentes (imagen: arvix)

El sistema fue probado por investigadores de la Universidad de Nueva York y Meta utilizando el robot comercial Stretch de Hello Robot. 171 experimentos de recogida y entrega se llevaron a cabo en diferentes hogares. Durante los experimentos, el robot escaneó el entorno utilizando el Record3D para iPhone para crear un vídeo en 3D. A continuación, el sistema OK Robot ejecutó un modelo de reconocimiento de objetos de IA sobre cada fotograma del vídeo.

Esto permitió al robot identificar todos los objetos de su entorno, como una mesa, un sofá, unas gafas, un zapato y una lámpara. A continuación se le indicó que recogiera determinados objetos, lo que hizo en el 82,2 % de los casos, siempre que la habitación no estuviera demasiado desordenada. En las habitaciones más caóticas, sin embargo, la tasa de éxito fue significativamente inferior.

Yo diría que es bastante inusual depender por completo de modelos estándar, y que es bastante impresionante hacer que funcionen. Hemos asistido a una revolución en el aprendizaje automático que ha hecho posible crear modelos que funcionan no sólo en los laboratorios, sino en el mundo abierto. Ver que esto funciona realmente en un entorno físico real es una información muy útil.

- Matthias Minderer, investigador principal de visión por ordenador en Google DeepMind, que no participó en el proyecto

OK-Robot utiliza modelos de conocimiento abierto como CLIP, Lang-SAM, AnyGrasp y OWL-ViT (imagen: arvix)
OK-Robot utiliza modelos de conocimiento abierto como CLIP, Lang-SAM, AnyGrasp y OWL-ViT (imagen: arvix)

El sistema está aún muy lejos de la perfección; por ejemplo, a veces tiene dificultades para comprender la entrada del habla, y su modelo de agarre también tiene problemas con algunos objetos. No obstante, el proyecto demuestra que los modelos actuales son capaces de desenvolverse relativamente bien con un vocabulario abierto y, al mismo tiempo, son capaces de navegar directamente hacia los objetos adecuados en espacios desconocidos.

Fuentes

MIT Technology Review | VentureBeat | imagen teaser: imagen simbólica de DALL-E / AI | imágenes 2,3: arvix

Please share our article, every link counts!
Mail Logo
Nicole Dominikowski, 2024-02-13 (Update: 2024-02-13)