La central de tecnología financiera de Jack Ma ha aprovechado chips de fabricación propia de Alibaba y Huawei para entrenar modelos de IA que parecen rivalizar con las GPU H800 de Nvidia.
Según personas con conocimiento del asunto, Ant Group ha descubierto una forma de entrenar modelos de IA en semiconductores fabricados en China, reduciendo los costes en torno a un 20 por ciento en comparación con los métodos convencionales.
Los conocedores del asunto afirman que los resultados de Ant se comparan favorablemente con los chips H800 de Nvidia Corp, que actualmente no están disponibles para las empresas chinas debido a los Controles de exportación de EE.UU. Aunque Ant sigue utilizando hardware de Nvidia para algunos de sus trabajos de IA, al parecer la empresa está poniendo ahora más énfasis en los procesadores AMD y en las alternativas chinas para sus últimos modelos.
Ant publicó este mes un documento de investigación en el que afirmaba que sus modelos Ling-Plus y Ling-Lite superaban incluso a Meta Platforms Inc. en ciertos puntos de referencia. Si estos resultados se mantienen, estos sistemas podrían representar un gran salto adelante para la IA china al reducir drásticamente los gastos de formación y despliegue de los servicios de IA.
El documento señala que utilizar hardware de alto rendimiento para entrenar 1 billón de tokens cuesta aproximadamente 6,35 millones de yuanes (unos 880.000 dólares). Pero con el enfoque optimizado de la empresa -y un equipo de menores especificaciones- esa cifra se reduce a unos 5,1 millones de yuanes (unos 700.000 dólares). Para los que no estén familiarizados, los tokens son esencialmente las unidades de información que utilizan estos modelos para aprender y producir resultados.
De cara al futuro, Ant pretende utilizar estos modelos de IA para aplicaciones sanitarias y financieras. A principios de este año, adquirió la plataforma en línea china Haodf.com para reforzar sus servicios de IA centrados en la atención sanitaria. Ant también opera una aplicación de "asistente vital" de IA llamada Zhixiaobao y una herramienta de IA de asesoramiento financiero llamada Maxiaocai.
Ambos modelos Ling son de código abierto: Ling-Lite cuenta con 16.800 millones de parámetros, mientras que Ling-Plus pesa 290.000 millones. Aunque se trata de cifras elevadas, siguen siendo inferiores a las de otros grandes modelos de IA: los expertos estiman que GPT-4.5 tiene alrededor de 1,8 billones de parámetros y DeepSeek-R1, 671.000 millones.
Ant reconoció algunos baches en el camino, sobre todo en lo que respecta a la estabilidad durante el entrenamiento. El documento de investigación señalaba que pequeños cambios en el hardware o en el diseño del modelo provocaban a veces grandes picos en las tasas de error.
Fuente(s)
Bloomberg (en inglés)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck