Notebookcheck Logo

DeepSeek lanza un modelo mejorado de IA V3 tres meses después de su lanzamiento inicial

Lanzamiento de DeepSeek-V3-0324 con rendimiento y capacidades mejoradas. (Fuente de la imagen: DeepSeek)
Lanzamiento de DeepSeek-V3-0324 con rendimiento y capacidades mejoradas. (Fuente de la imagen: DeepSeek)
El lanzamiento de DeepSeek-V3-0324 se produce tres meses después del lanzamiento inicial de DeepSeek V3 en diciembre de 2024. Este modelo actualizado ha mejorado su rendimiento y sus capacidades, como la creación de páginas web atractivas e informes bien redactados en chino.

DeepSeek, una empresa china de IA, ha lanzado DeepSeek-V3-0324, una versión actualizada de su modelo de gran lenguaje (LLM) de IA V3, que se lanzó originalmente en diciembre de 2024. El modelo V3 sorprendió al mundo por sus requisitos de hardware de entrenamiento mucho menores, su tiempo de entrenamiento más corto y sus costes de API más bajos, además de su alto rendimiento frente a otras IA de la competencia, como los modelos GPT de OpenAI.

El modelo V3 actualizado es un modelo de IA sin razonamiento, lo que significa que intenta responder a las preguntas rápidamente y no se toma tiempo extra para pensar en los problemas difíciles, a diferencia del modelo R1 de DeepSeek. Su tamaño de 685.000 millones de parámetros lo sitúa entre los mayores LLM disponibles públicamente. El último modelo está disponible para su uso bajo la licencia MIT.

DeepSeek-V3-0324 obtuvo entre un 5,3% y un 19,8% más de puntuación en los puntos de referencia de IA que el V3 original. Su rendimiento es comparable al de otras IA punteras, como GPT-4.5 y Claude Sonnet 3.7.

El modelo actualizado también ha mejorado sus capacidades. Un área de mejora es su capacidad refinada para crear páginas web atractivas y front-ends para juegos en línea. Otra mejora es su capacidad para buscar, escribir y traducir mejor en chino.

Los lectores que deseen experimentar con el DeepSeek-V3-0324 685B completo necesitarán al menos 700 GB de espacio de almacenamiento libre y varias GPU Nvidia A100/H100. Las versiones destiladas y con parámetros más pequeños del modelo pueden ejecutarse en una sola GPU, como la Nvidia 3090(a la venta aquí en Amazon).

La IA de DeepSeek-V3-0324 mejora su rendimiento con respecto a la versión original, con puntuaciones más altas en los benchmarks de IA. (Fuente de la imagen: DeepSeek)
La IA de DeepSeek-V3-0324 mejora su rendimiento con respecto a la versión original, con puntuaciones más altas en los benchmarks de IA. (Fuente de la imagen: DeepSeek)

Lanzamiento de DeepSeek-V3-0324

Importante aumento del rendimiento del razonamiento

Mayores capacidades de desarrollo front-end

Capacidades de uso de herramientas más inteligentes

Para tareas de razonamiento no complejas, recomendamos utilizar V3 - basta con desactivar "DeepThink"

El uso de la API se mantiene sin cambios

Los modelos se publican ahora bajo la licencia MIT, ¡igual que DeepSeek-R1!

Please share our article, every link counts!
Mail Logo
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2025 03 > DeepSeek lanza un modelo mejorado de IA V3 tres meses después de su lanzamiento inicial
David Chien, 2025-03-29 (Update: 2025-03-29)