Notebookcheck Logo

Ya está disponible en línea el generador de vídeo de IA de código abierto Pyramid Flow

Fotograma de un corto de texto a vídeo creado con Pyramid Flow (Fuente de la imagen: Pyramid Flow en GitHub)
Fotograma de un corto de texto a vídeo creado con Pyramid Flow (Fuente de la imagen: Pyramid Flow en GitHub)
Procedente de China, Pyramid Flow es un modelo de IA de código abierto capaz de crear vídeos virtuales de alta resolución (768p). Según el equipo que está detrás, este modelo puede generar un vídeo de cinco segundos y 384p en menos de un minuto. La licencia MIT cubre Pyramid Flow, que se sometió a un entrenamiento con conjuntos de datos de código abierto.

Ya se ha hecho popular en los vídeos tutoriales de YouTube, Pyramid Flow es un nuevo modelo de IA que se ha entrenado a partir de conjuntos de datos de código abierto, que suman alrededor de 10 millones de vídeos. Obra de un equipo que reúne a investigadores en IA de la Universidad de Pekín, Kuaishou Technology y la Universidad de Correos y Telecomunicaciones de Pekín, Pyramid Flow es en sí mismo de código abierto. Amparado por los términos de la licencia MIT https://en.wikipedia.org/wiki/MIT_License, puede generar contenidos de vídeo virtuales de alta resolución (768p), y obviamente brilla cuando tiene que tratar con 384p. Según sus creadores, puede generar un vídeo de cinco segundos en menos de un minuto (utilizando la GPU A100 en una configuración de hardware no revelada, al parecer).

En algunos escenarios, Pyramid Flow sobresale. Sin embargo, cuando se trata de ciertas indicaciones de texto, los resultados distan mucho de ser satisfactorios. Como sigue ocurriendo con muchas aplicaciones de IA generativa, trabajar con una herramienta de este tipo conlleva una cierta dosis de aleatoriedad. El lado positivo es que el enfoque de este modelo utiliza mucha menos potencia de cálculo que sus competidores y, dado que su código es de código abierto, los interesados pueden utilizarlo en aplicaciones locales o en la nube sin tener que preocuparse por la parte de las licencias.

Sin embargo, los investigadores de IA que crearon Pyramid Flow enumeraron todos los conjuntos de datos utilizados para entrenarla, pero no mencionaron nada sobre los problemas de derechos de autor que pueden surgir. Aunque algunos creadores de contenidos afirman que los vídeos virtuales realizados con material de código abierto violan los derechos de los titulares de los derechos de autor, Pyramid Flow podría ser útil para poner a punto este tipo de contenidos sin tener que involucrar a terceros.

Los interesados en la IA desde una perspectiva de código abierto pueden hacerse con Open-Source AI: The Future of Data Research de J.D. TjonWolf en Amazon por 9,99 dólares (Kindle) o 12,99 dólares (edición de bolsillo).

Fuente(s)

Please share our article, every link counts!
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2024 10 > Ya está disponible en línea el generador de vídeo de IA de código abierto Pyramid Flow
Codrut Nistor, 2024-10-15 (Update: 2024-10-15)