Shengshu Technology revela un nuevo generador de vídeo con IA para enfrentarse a Sora de OpenAI
Shengshu Technology ha revelado su último modelo de IA, el Vidu 1.5. La empresa pretende aventurarse en el ámbito de la generación de texto a vídeo e imagen a vídeo, introduciendo un nuevo competidor en el mercado para competir contra empresas de la talla de OpenAI Sora que se anunció a principios de este año. Para quien no conozca Shengshu Technology, se trata de una empresa emergente de IA que se fundó el año pasado en marzo de 2023.
El nuevo modelo de IA de la empresa es bastante similar al Sora de OpenAI, aunque con algunos retoques. El Vidu 1.5 tiene capacidad para generar vídeos de hasta ocho segundos de duración a partir de imágenes, así como de indicaciones textuales. El modelo de IA utiliza su propia función de coherencia de múltiples entidades para empalmar a la perfección personas, objetos y entornos mientras genera un vídeo a partir de las indicaciones del usuario.
Vidu también cuenta con una función denominada coherencia de múltiples ángulos, que permite a los usuarios generar vídeos a partir de cualquier imagen introducida o subiendo tres fotos de un mismo sujeto. El sitio IA afirma además que el modelo de IA utiliza funciones de control avanzadas para añadir mejor movimiento y fondos detallados en la salida generada. Según el fabricante del modelo, puede generar un vídeo de ocho segundos en menos de 30 segundos.
Vidu también ha listado algunos vídeos de IA en su página web oficial generados por el modelo Vidu 1.5, que parecen muy realistas. Pero la pega es que sólo puede crear vídeos de ocho segundos, mientras que su competidor directo, el modelo Sora, le permite producir vídeos de hasta un minuto de duración.
Hablando de la resolución de vídeo, el Vidu 1.5 presume de ser capaz de producir vídeos a una resolución máxima de 1080p. El Vidu 1.5 tiene sus propias imperfecciones. Por ejemplo, algunos vídeos generados por la IA carecen de pequeños detalles y también revelan algunos movimientos poco realistas, como en una escena de un coche en la que las llamas atraviesan el centro del vehículo. Aunque no se trata de defectos importantes y ni siquiera son perceptibles hasta que se observan de cerca,.
La IA multimodal Vidu 1.5 funciona con un modelo freemium. La versión gratuita le permite generar un clip de 4 segundos con una resolución de velocidad, mientras que la versión premium, que le costará 9,99 dólares al mes, le permite generar vídeos de 8 segundos con una resolución de hasta 1080p. Vidu 1.5 ya está disponible para todo el mundo a través de su página web oficial .
Fuente(s)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck