Shengshu Technology revela un nuevo generador de vídeo con IA para enfrentarse a Sora de OpenAI

Shengshu Technology presenta Vidu 1.5, un modelo de IA capaz de generar vídeos realistas a partir de indicaciones textuales (Fuente de la imagen: Vidu)

Shengshu Technology ha anunciado una nueva IA multimodal Vidu 1.5 que puede generar vídeos realistas a partir de imágenes e indicaciones textuales. El modelo de IA puede empalmar personas, objetos y entornos en un único vídeo generado, gracias a la capacidad de coherencia de múltiples entidades. El modelo ya está disponible para todo el mundo a través de la página web oficial de Vidu.

Abhinav Fating (traducido por Ninh Duy), Publicado 11/14/2024 🇺🇸 🇫🇷 ...

Shengshu Technology ha revelado su último modelo de IA, el Vidu 1.5. La empresa pretende aventurarse en el ámbito de la generación de texto a vídeo e imagen a vídeo, introduciendo un nuevo competidor en el mercado para competir contra empresas de la talla de OpenAI Sora que se anunció a principios de este año. Para quien no conozca Shengshu Technology, se trata de una empresa emergente de IA que se fundó el año pasado en marzo de 2023.

El nuevo modelo de IA de la empresa es bastante similar al Sora de OpenAI, aunque con algunos retoques. El Vidu 1.5 tiene capacidad para generar vídeos de hasta ocho segundos de duración a partir de imágenes, así como de indicaciones textuales. El modelo de IA utiliza su propia función de coherencia de múltiples entidades para empalmar a la perfección personas, objetos y entornos mientras genera un vídeo a partir de las indicaciones del usuario.

Vidu también cuenta con una función denominada coherencia de múltiples ángulos, que permite a los usuarios generar vídeos a partir de cualquier imagen introducida o subiendo tres fotos de un mismo sujeto. El sitio IA afirma además que el modelo de IA utiliza funciones de control avanzadas para añadir mejor movimiento y fondos detallados en la salida generada. Según el fabricante del modelo, puede generar un vídeo de ocho segundos en menos de 30 segundos.

Vidu también ha listado algunos vídeos de IA en su página web oficial generados por el modelo Vidu 1.5, que parecen muy realistas. Pero la pega es que sólo puede crear vídeos de ocho segundos, mientras que su competidor directo, el modelo Sora, le permite producir vídeos de hasta un minuto de duración.

Hablando de la resolución de vídeo, el Vidu 1.5 presume de ser capaz de producir vídeos a una resolución máxima de 1080p. El Vidu 1.5 tiene sus propias imperfecciones. Por ejemplo, algunos vídeos generados por la IA carecen de pequeños detalles y también revelan algunos movimientos poco realistas, como en una escena de un coche en la que las llamas atraviesan el centro del vehículo. Aunque no se trata de defectos importantes y ni siquiera son perceptibles hasta que se observan de cerca,.

La IA multimodal Vidu 1.5 funciona con un modelo freemium. La versión gratuita le permite generar un clip de 4 segundos con una resolución de velocidad, mientras que la versión premium, que le costará 9,99 dólares al mes, le permite generar vídeos de 8 segundos con una resolución de hasta 1080p. Vidu 1.5 ya está disponible para todo el mundo a través de su página web oficial .

Comprar iPhone 16 Pro Max en Amazon