Apple un estudio revela un fallo importante en los modelos lingüísticos de la IA: La precisión cae hasta un 65
Un reciente estudio realizado por algunos investigadores en Apple está sacudiendo la forma en que pensamos sobre la inteligencia de los grandes modelos lingüísticos (LLM) como ChatGPT. El estudio, dirigido por Iman Mirzadeh, utilizó una nueva prueba llamada GSM-Symbolic para ver lo bien que estos sistemas de IA manejan las matemáticas y el pensamiento lógico.
Lo que encontraron no fue muy bueno para las IA. Cuando introdujeron información adicional aleatoria en las preguntas, la precisión de los modelos cayó en picado: en algunos casos, hasta un 65%. La pregunta principal ni siquiera cambió. Esto sugiere que estos sistemas de IA carecen de una verdadera comprensión de sus tareas.
El estudio señala una diferencia esencial entre parecer inteligente y comprender las cosas. Muchas respuestas generadas por IA parecen correctas a primera vista, pero cuando se profundiza en ellas, se desmoronan. Esto pone de relieve que hablar como un humano no significa que la máquina esté pensando como tal.
Por ello, el estudio sugiere que debemos replantearnos hasta qué punto confiamos y dependemos de estos sistemas. Seguro que pueden hacer cosas increíbles, pero tienen algunos defectos significativos, especialmente con problemas difíciles o complicados. Reconocer estas debilidades es clave si queremos utilizar la IA de forma responsable.
En definitiva, este estudio nos recuerda que, aunque la IA puede ser útil, debemos mantener una mirada crítica sobre lo que puede y no puede hacer. A medida que estas herramientas se conviertan en una parte más importante de nuestras vidas, conocer sus límites será crucial si queremos utilizarlas de forma inteligente y responsable.
Fuente(s)
WinFuture (en alemán)
Top 10 Análisis
» Top 10 Portátiles Multimedia
» Top 10 Portátiles de Juego
» Top 10 Portátiles de Juego ligeros
» Top 10 Portátiles Asequibles de Oficina/Empresa
» Top 10 Portátiles de Juego Ligeros
» Top 10 Portátiles de Oficina/Empresa Premium
» Top 10 Estaciones de Trabajo
» Top 10 Subportátiles
» Top 10 Ultrabooks
» Top 10 Convertibles
» Top 10 Tablets
» Top 10 Tablets Windows
» Top 10 Tablets de menos de 250 Euros
» Top 10 Phablets (>5.5")
» Top 10 Smartphones
» Top 10 Smartphones (≤5")
» Top 10 Smartphones de menos de 300 Euros
» Top 10 Smartphones de menos de 120 Euros
» Top 10 Portátiles de menos de 1000 Euros
» Top 10 Portátiles de menos de 500 Euros
» Top 10 Portátiles de menos de 300 Euros
» Los Mejores Displays de Portátiles Analizados por Notebookcheck