XAI, la empresa de Elon Musk, ha lanzado la familia Grok 3 de modelos de gran lenguaje de IA de vanguardia que, por lo general, superan a otras IA en las pruebas de referencia de IA estandarizadas.
Los modelos Grok 3 se entrenaron en el clúster de superordenadores Colossus de la empresa, que utiliza 100.000 GPU Hopper Tensor Core de Nvidia. Se han lanzado un par de modelos no razonadores estándar y mini (Grok 3 beta y Grok 3 mini beta) junto con un par de modelos razonadores (Grok 3 beta (Think) y Grok 3 mini beta (Think)).
En general, los modelos no razonadores superan a las anteriores IA que encabezan las listas, como OpenAI GPT-4o y DeepSeek-V3. Una de las razones es que disponen de una ventana de contexto de un millón de tokens, lo que permite a la IA utilizar cantidades muy grandes de texto. Esto mejora la capacidad de los modelos para sintetizar la respuesta correcta a partir de diversas fuentes. Dicho esto, los modelos Grok 3 beta siguen respondiendo a las preguntas de búsqueda de hechos con una precisión inferior al 50% (referencia SimpleQA), por lo que los humanos seguirán teniendo trabajo mañana.
Los modelos de razonamiento piensan paso a paso a través de indicaciones complejas, lo que permite al usuario ver el proceso de pensamiento de la IA. Esto permite que estas IA resuelvan los problemas como lo haría un experto, resolviendo partes más pequeñas del problema y combinando los resultados para obtener una respuesta adecuada. Al seleccionar el agente DeepSearch, u opción de búsqueda, se le indicará a Grok 3 que realice búsquedas amplias y profundas en Internet y que utilice intérpretes de código antes de generar informes que resuman sus hallazgos. Los modelos de Grok 3 (Think) suelen ser los mejores en la resolución de problemas matemáticos, en la respuesta a preguntas de opción múltiple de nivel universitario y en la realización de tareas de codificación frente a otras IA.
xAI espera seguir afinando Grok 3 para mejorar su rendimiento en los próximos meses en un clúster de superordenadores de 200.000 GPU. Grok 3 ya está disponible para todos los usuarios en X y Grok.com. Los usuarios gratuitos pueden encontrar límites de uso, mientras que los usuarios de pago tendrán acceso a funciones avanzadas.
Fuente(s)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck