Notebookcheck Logo

Deepseek presenta Deepseek V3 AI LLM con acceso gratuito a chatbot

Deepseek abre a todos el acceso gratuito al chatbot Deepseek V3 AI LLM. (Fuente de la imagen: Deepseek)
Deepseek abre a todos el acceso gratuito al chatbot Deepseek V3 AI LLM. (Fuente de la imagen: Deepseek)
La empresa china de IA ha mejorado su LLM Deepseek V2, clasificado entre los diez primeros, con el lanzamiento de Deepseek V3. El LLM es significativamente más barato que la mayoría de las IA de la competencia gracias a una cuidadosa optimización del proceso de entrenamiento.

Deepseek ha presentado su último modelo de gran lenguaje (LLM) de inteligencia artificial Deepseek V3, y tanto el modelo como el chatbot están disponibles de forma gratuita.

Todos los LLM que alimentan los chatbots habituales de hoy en día se entrenan con millones de documentos para comprender las conexiones entre palabras y temas. Cuantos más parámetros tengan estos modelos, mejor será el rendimiento de los chatbots a la hora de responder a las preguntas de los usuarios. Sin embargo, los miles de millones de parámetros utilizados requieren mucha potencia de cálculo y energía, por lo que un ajuste cuidadoso del proceso de entrenamiento es clave para mantener bajos los costes y el tiempo de entrenamiento.

Para lograr estos objetivos, Deepseek utilizó una innovadora estrategia de equilibrio de la carga junto con cálculos en coma flotante de 8 bits y menor precisión (FP8), el método exclusivo de la empresa para reducir el uso de la memoria (Multi-Head Latent Attention o MLA) y otros métodos detallados en su documento técnico.

La cuidadosa optimización del proceso de entrenamiento de Deepseek V3 mantuvo los costes por debajo de los 6 millones de dólares, a diferencia de los 78 millones de dólares de para entrenar al GPT-4 de OpenAI o los más de 500 millones de dólares por ejecución estimados en para entrenar el GPT-5 de OpenAI. Unos costes más bajos y un entrenamiento más rápido reducen el coste para los usuarios comerciales de Deepseek. Los ecologistas también pueden celebrar el menor uso de energía y la reducción de las emisiones de carbono que requiere el entrenamiento de Deepseek V3.

Deepseek V2 ya estaba clasificado entre los diez modelos LLM de IA más potentes disponibles, y las pruebas comparativas preliminares de chatbot de la empresa indicaron que ganó en 12 de 21 pruebas contra los LLM mejor clasificados, como Anthropic Claude 3.5 Sonnet y OpenAI GPT-4o.

Los lectores pueden utilizar gratuitamente el chatbot Deepseek V3 para ayudar a redactar ensayos, proporcionar respuestas y simplificar el trabajo. Las empresas pueden empezar a crear aplicaciones utilizando la API de la plataforma V3. Aquellos que traten de guardar secretos deben saber que todos los datos del chat se guardan en servidores ubicados en la República Popular China. Sin embargo, las mayores empresas estadounidenses que están detrás de los mejores LLM de IA de la actualidad, como Facebook, han sido sorprendidas compartiendo datostambién.

Deepseek V3 gana en 12 de las 21 pruebas de referencia LLM contra los mejores LLM, como OpenAI GPT-4o y Anthropic Claude 3.5 Sonnet. (Fuente de la imagen: Deepseek en Github)
Deepseek V3 gana en 12 de las 21 pruebas de referencia LLM contra los mejores LLM, como OpenAI GPT-4o y Anthropic Claude 3.5 Sonnet. (Fuente de la imagen: Deepseek en Github)
Las primeras evaluaciones comparativas de Deepseek V3 en el Open Large Model AI Leaderboard sugieren que se encuentra entre las diez IA LLM más potentes del mundo. (Fuente de la imagen: Open Large Model AI)
Las primeras evaluaciones comparativas de Deepseek V3 en el Open Large Model AI Leaderboard sugieren que se encuentra entre las diez IA LLM más potentes del mundo. (Fuente de la imagen: Open Large Model AI)
La cuidadosa optimización del proceso de formación redujo enormemente el coste y el tiempo de creación del LLM Deepseek V3, lo que se tradujo en una gran reducción de los costes de utilización. (Fuente de la imagen: Deepseek en X)
La cuidadosa optimización del proceso de formación redujo enormemente el coste y el tiempo de creación del LLM Deepseek V3, lo que se tradujo en una gran reducción de los costes de utilización. (Fuente de la imagen: Deepseek en X)
Please share our article, every link counts!
Mail Logo
David Chien, 2024-12-29 (Update: 2024-12-29)