IBM lanza los modelos de IA de código abierto Granite 3.0 para empresas

Ya están disponibles los modelos de IA de código abierto IBM Granite 3.0 para empresas (Fuente de la imagen: IBM)

Amparada por los términos de la licencia Apache 2.0, la familia de modelos de IA IBM Granite 3.0 está dirigida a clientes empresariales y ofrece un rendimiento máximo junto con (supuestamente) el conjunto más completo de funciones de detección de riesgos y daños del mercado. Los interesados pueden descargar los modelos de Hugging Face.

Codrut Nistor (traducido por Ninh Duy), Publicado 10/22/2024 🇺🇸 🇫🇷 ...

Hoy mismo, IBM ha presentado su familia de modelos de IA más avanzada hasta la fecha, elevando el número de versión de Granite a 3.0. Ya en septiembre de 2023, IBM presentó los modelos de base Granite https://www.ibm.com/blog/building-ai-for-business-ibms-granite-foundation-models/y ahora cambian la familia a un modelo de código abierto al tiempo que mejoran todos los demás aspectos. Todos los modelos Granite 3.0 (que se mencionarán más adelante) están cubiertos por los términos de la licencia Apache 2.0, lo que permite que tanto los clientes empresariales como la comunidad en general puedan aprovecharlos.

Las tres ramas de Granite 3.0 y los miembros de cada una son estos:

Propósito general/idioma: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Guardias y Seguridad: Granito Guardián 3.0 8B, Granito Guardián 3.0 2B
Mezcla de expertos: Granito 3.0 3B-A800M Instruct, Granito 3.0 1B-A400M Instruct, Granito 3.0 3B-A800M Base, Granito 3.0 1B-A400M Base

A diferencia de sus competidores, que se entrenan a partir de datos públicos, los modelos Granite de IBM utilizan datos de la empresa y pueden integrarse fácilmente en diversos flujos de trabajo y entornos empresariales, reduciendo los costes hasta 23 veces en comparación con los grandes modelos de frontera. Según IBM, el entrenamiento de estos nuevos modelos implicó más de 12 billones de tokens sobre datos tomados de 12 lenguajes naturales diferentes y 116 lenguajes de programación distintos.

Uno de los aspectos más destacados de la familia es Guardian 3.0, que viene con una detección de riesgos y daños líder en el mercado, que tiene en cuenta el fundamento, la relevancia del contexto y la relevancia de la respuesta, además de los atributos ya habituales como el sesgo social, el odio, la toxicidad, la blasfemia, la violencia, el jailbreaking, etc.

Quienes deseen iniciarse en el Granite 3.0 de IBM (o pasar a las nuevas piezas de código) pueden dirigirse a Hugging Face y hacerse con ellas. Aunque una selección de modelos llegará a los microservicios NIM de Nvidia y a las integraciones de Google Cloud Vertex AI Model Garden con Hugging Face, las variantes de instrucciones de los nuevos modelos lingüísticos Granite 3.0 8B y 2B y los modelos Granite Guardian 3.0 8B y 2B están disponibles para uso comercial a través de la plataforma IBM watsonx plataforma.

A finales de agosto, Clifford A. Pickover publicó Artificial Intelligence: Una historia ilustrada: De los robots medievales a las redes neuronales, un libro que ya está disponible a 8,99 dólares en formato Kindle y a 17,26 dólares en versión de bolsillo.

Fuente(s)

Sala de prensa de IBM

▶ ▼ Comunicado de prensa

IBM presenta Granite 3.0: Modelos de IA de alto rendimiento creados para las empresas

- Los nuevos modelos Granite 3.0 8B y 2B, publicados bajo la licencia permisiva Apache 2.0, muestran un fuerte rendimiento en muchos benchmarks académicos y empresariales, capaces de superar o igualar a modelos de tamaño similar

- Los nuevos modelos Granite Guardian 3.0 ofrecen las capacidades de protección más completas de IBM para avanzar en una IA segura y fiable

- Los nuevos modelos Granite 3.0 Mixture-of-Experts permiten una inferencia extremadamente eficiente y una baja latencia, adecuada para despliegues basados en CPU y edge computing

- El nuevo modelo de series temporales de Granite logra un rendimiento puntero en la previsión de cero o pocos disparos, superando a modelos 10 veces mayores

- IBM desvela la próxima generación de watsonx Code Assistant potenciado por Granite para la codificación de propósito general; Debuta nuevas herramientas en watsonx.ai para construir y desplegar aplicaciones y agentes de IA

- Anuncia que Granite se convertirá en el modelo por defecto de Consulting Advantage, una plataforma de entrega impulsada por IA utilizada por los 160.000 consultores de IBM para aportar nuevas soluciones a los clientes con mayor rapidez

ARMONK, Nueva York, 21 de octubre de 2024 /PRNewswire/ -- Hoy, en la conferencia de IBM (NYSE: IBM), la compañía ha anunciado el lanzamiento de su familia de modelos de IA más avanzada hasta la fecha, Granite 3.0. La tercera generación de modelos lingüísticos emblemáticos Granite de IBM puede superar o igualar a los modelos de tamaño similar de los principales proveedores de modelos en muchos puntos de referencia académicos e industriales, demostrando un gran rendimiento, transparencia y seguridad.

En consonancia con el compromiso de la empresa con la IA de código abierto, los modelos Granite se publican bajo la licencia permisiva Apache 2.0, lo que los hace únicos en la combinación de rendimiento, flexibilidad y autonomía que ofrecen a los clientes empresariales y a la comunidad en general.

La familia Granite 3.0 de IBM incluye:

Propósito general/idioma: Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Guardias y seguridad: Granito Guardián 3.0 8B, Granito Guardián 3.0 2B
Mezcla de expertos: Granito 3 . 0 3 B-A800M Instruct, Granito 3.0 1B-A400M Instruct, Granito 3.0 3B-A800M Base, Granito 3.0 1B-A400M Base

Los nuevos modelos lingüísticos Granite 3.0 8B y 2B están diseñados como modelos "caballo de batalla" para la IA empresarial, ya que ofrecen un gran rendimiento en tareas como la generación aumentada de recuperación (RAG), la clasificación, el resumen, la extracción de entidades y el uso de herramientas. Estos modelos compactos y versátiles están diseñados para ajustarse a los datos de la empresa e integrarse a la perfección en diversos entornos empresariales o flujos de trabajo.

Mientras que muchos modelos lingüísticos de gran tamaño (LLM) se entrenan con datos disponibles públicamente, una gran mayoría de los datos empresariales siguen sin aprovecharse. Combinando un pequeño modelo Granite con datos empresariales, especialmente mediante la revolucionaria técnica de alineación InstructLab - presentada por IBM y RedHat en mayo-, IBM cree que las empresas pueden lograr un rendimiento específico para cada tarea que rivalice con modelos más grandes a una fracción del coste (basado en un rango observado de 3x-23x menos coste que los grandes modelos de frontera en varias pruebas de concepto ^tempranas1).

El lanzamiento de Granite 3.0 reafirma el compromiso de IBM con la creación de transparencia, seguridad y confianza en los productos de IA. El Informe técnico de Granite 3.0 y guía de uso responsable proporcionan una descripción de los conjuntos de datos utilizados para entrenar estos modelos, detalles de los pasos de filtrado, limpieza y curación aplicados, junto con resultados exhaustivos del rendimiento de los modelos en los principales puntos de referencia académicos y empresariales.

Y lo que es más importante, IBM ofrece una garantía de propiedad intelectual para todos los modelos Granite en watsonx.ai, de modo que los clientes empresariales puedan estar más seguros a la hora de fusionar sus datos con los modelos.

Subiendo el listón: Puntos de referencia de Granite 3.0

Los modelos lingüísticos Granite 3.0 también muestran resultados prometedores en cuanto a rendimiento bruto.

En los puntos de referencia académicos estándar definidos por Hugging Face's OpenLLM Leaderboard, el rendimiento global del modelo Granite 3.0 8B Instruct se sitúa por término medio a la cabeza del rendimiento de los modelos de código abierto de tamaño similar de Meta y Mistral. En el punto de referencia de seguridad AttaQ de IBM, el modelo Granite 3.0 8B Instruct lidera todas las dimensiones de seguridad medidas en comparación con los modelos de Meta y Mistral^.2

En las principales tareas empresariales de GAR, uso de herramientas y tareas en el ámbito de la ciberseguridad, el modelo Granite 3.0 8B Instruct muestra un rendimiento líder de media en comparación con los modelos de código abierto de tamaño similar de Mistral y Meta^.3

Los modelos Granite 3.0 se entrenaron con más de 12 billones de tokens en datos tomados de 12 lenguajes naturales diferentes y 116 lenguajes de programación distintos, utilizando un novedoso método de entrenamiento en dos etapas, aprovechando los resultados de varios miles de experimentos diseñados para optimizar la calidad de los datos, la selección de datos y los parámetros de entrenamiento. Para finales de año, se espera que los modelos lingüísticos 3.0 8B y 2B incluyan soporte para una ventana contextual ampliada de 128K y capacidades de comprensión de documentos multimodales.

Demostrando un excelente equilibrio entre rendimiento y coste de inferencia, IBM ofrece sus modelos de arquitectura de mezcla de expertos (MoE) Granite, Granite 3.0 1B-A400M y Granite 3.0 3B-A800M, como modelos más pequeños y ligeros que podrían desplegarse para aplicaciones de baja latencia, así como para despliegues basados en CPU.

IBM también anuncia una versión actualizada de sus modelos preentrenados de series temporales Granite, cuyas primeras versiones se lanzaron a principios de este año. Estos nuevos modelos están entrenados con 3 veces más datos y ofrecen un gran rendimiento en las tres principales pruebas comparativas de series temporales, superando a modelos 10 veces mayores de Google, Alibaba y otros. Los modelos actualizados también proporcionan una mayor flexibilidad de modelado con soporte para variables externas y previsiones continuas^.4

Presentamos Granite Guardian 3.0: marcando el comienzo de la próxima era de la IA responsable

Como parte de este lanzamiento, IBM también presenta una nueva familia de modelos Granite Guardian que permiten a los desarrolladores de aplicaciones implantar barreras de seguridad mediante la comprobación de las indicaciones al usuario y las respuestas LLM para una variedad de riesgos. Los modelos Granite Guardian 3.0 8B y 2B proporcionan el conjunto más completo de capacidades de detección de riesgos y daños disponible actualmente en el mercado.

Además de dimensiones de daño como prejuicios sociales, odio, toxicidad, blasfemias, violencia, fugas de la cárcel y más, estos modelos también proporcionan una gama de comprobaciones únicas específicas de los GAR como el fundamento, la relevancia del contexto y la relevancia de la respuesta. En pruebas exhaustivas realizadas en 19 puntos de referencia de seguridad y RAG, el modelo Granite Guardian 3.0 8B obtuvo una precisión global en la detección de daños superior, por término medio, a la de las tres generaciones de modelos Llama Guard de Meta. También mostró un rendimiento global a la par en la detección de alucinaciones de media con los modelos especializados de detección de alucinaciones WeCheck y MiniCheck^.5

Aunque los modelos Granite Guardián se derivan de los modelos lingüísticos Granite correspondientes, pueden utilizarse para implementar guardianes junto a cualquier modelo de IA abierto o propietario.

Disponibilidad de los modelos Granite 3.0

Todo el conjunto de modelos Granite 3.0 y los modelos de series temporales actualizados están disponibles para su descarga en HuggingFace bajo la permisiva licencia Apache 2.0. Las variantes instructivas de los nuevos modelos lingüísticos Granite 3.0 8B y 2B y los modelos Granite Guardian 3.0 8B y 2B están disponibles desde hoy para su uso comercial en la plataforma watsonx de IBM. Una selección de los modelos Granite 3.0 también estará disponible como microservicios NVIDIA NIM y a través de las integraciones Vertex AI Model Garden de Google Cloud con HuggingFace.

Para ayudar a proporcionar opciones y facilidad de uso a los desarrolladores y apoyar los despliegues locales y de borde, un conjunto curado de los modelos Granite 3.0 también está disponible en Ollama y Replicate.

La última generación de modelos Granite amplía el robusto catálogo de código abierto de IBM de potentes LLM. IBM ha colaborado con socios del ecosistema como AWS, Docker, Domo, Qualcomm Technologies, Inc. a través de su Qualcomm® AI Huby Salesforce, SAPy otros, para integrar una variedad de modelos de Granite en las ofertas de estos socios o hacer que los modelos de Granite estén disponibles en sus plataformas, ofreciendo mayores posibilidades de elección a las empresas de todo el mundo.

De asistentes a agentes: haciendo realidad el futuro de la IA empresarial

IBM está haciendo avanzar la IA empresarial a través de un espectro de tecnologías: desde modelos y asistentes hasta las herramientas necesarias para ajustar y desplegar la IA específicamente para los datos y casos de uso únicos de las empresas. IBM también está allanando el camino para futuros agentes de IA que puedan autodirigirse, reflexionar y realizar tareas complejas en entornos empresariales dinámicos.

IBM sigue evolucionando su cartera de tecnologías de asistentes de IA: desde watsonx Orchestrate para ayudar a las empresas a crear sus propios asistentes mediante herramientas de bajo código y automatización, hasta un amplio conjunto de asistentes preconstruidos para tareas y dominios específicos como atención al cliente, recursos humanos, ventas y marketing. Organizaciones de todo el mundo han utilizado watsonx Assistant para ayudarles a crear asistentes de IA para tareas como responder a preguntas rutinarias de clientes o empleados, modernizar sus mainframes y aplicaciones informáticas heredadas, ayudar a los estudiantes a explorar posibles trayectorias profesionales o proporcionar asistencia hipotecaria digital a los compradores de viviendas.

IBM también ha desvelado hoy el próximo lanzamiento de la próxima generación de watsonx Code Assistant, impulsado por los modelos de código de Granite, para ofrecer asistencia de codificación de uso general en lenguajes como C, C++, Go, Java y Python, con capacidades avanzadas de modernización de aplicaciones para Enterprise Java Applications^.6 Las capacidades de código de Granite también son accesibles ahora a través de una extensión de Visual Studio Code, IBM Granite.Code.

IBM también tiene previsto lanzar nuevas herramientas para ayudar a los desarrolladores construir, personalizar y desplegar la IA de forma más eficiente a través de watsonx.ai - incluyendo marcos agénticos, integraciones con entornos existentes y automatizaciones de bajo código para casos de uso comunes como RAG y agentes^.7

IBM se centra en el desarrollo de tecnologías de agentes de IA capaces de una mayor autonomía, un razonamiento sofisticado y la resolución de problemas en varios pasos. La versión inicial del modelo Granite 3.0 8B ofrece soporte para capacidades agénticas clave, como el razonamiento avanzado y una plantilla de chat altamente estructurada y un estilo de indicaciones para implementar flujos de trabajo de uso de herramientas. IBM también tiene previsto introducir una nueva función de chat con agentes de IA en IBM watsonx Orchestrate, que utiliza capacidades agénticas para orquestar asistentes de IA, habilidades y automatizaciones que ayuden a los usuarios a aumentar la productividad en sus equipos^.8 IBM tiene previsto seguir creando capacidades de agentes en toda su cartera en 2025, incluidos agentes preconstruidos para dominios y casos de uso específicos.

Plataforma de entrega ampliada impulsada por IA para potenciar a los consultores de IBM con IA

IBM también está anunciando una importante ampliación de su plataforma de entrega impulsada por IA, IBM Consulting Advantage. La plataforma multimodelo contiene agentes de IA, aplicaciones y métodos como marcos repetibles que pueden capacitar a 160.000 consultores de IBM para ofrecer un valor al cliente mejor y más rápido a un coste menor.

Como parte de la ampliación, los modelos lingüísticos Granite 3.0 se convertirán en el modelo por defecto en Consulting Advantage. Aprovechando el rendimiento y la eficiencia de Granite, IBM Consulting podrá ayudar a maximizar el retorno de la inversión para los proyectos de IA generativa de los clientes de IBM.

Otra parte clave de la expansión es la introducción de IBM Consulting Advantage para la transformación y gestión de la nube e IBM Consulting Advantage para operaciones empresariales. Cada una de ellas incluye agentes, aplicaciones y métodos de IA específicos de cada dominio infundidos con las mejores prácticas de IBM para que los consultores de IBM puedan ayudar a acelerar las transformaciones de la nube y la IA de los clientes en tareas, como la modernización del código y la ingeniería de calidad, o transformar y ejecutar operaciones en distintos dominios, como las finanzas, los RRHH y las compras.

Para obtener más información sobre Granite y la estrategia AI for Business de IBM, visite www.ibm.com/granite.

¹ Los cálculos de costes se basan en el precio del coste de la API por millón de tokens de IBM watsonx para modelos abiertos y openAI para modelos GPT4 (suponiendo una mezcla de 80% de entrada y 20% de salida) para pruebas de concepto de clientes.
2 Documento técnico de IBM Research: Modelos lingüísticos Granite 3.0
³ Documento técnico de IBM Research: Modelos lingüísticos de Granite 3.0
⁴ El mezclador de tiempos Tiny: Modelos rápidos preentrenados para la previsión mejorada de cero o pocos disparos en series temporales multivariantes
⁵ Resultados de la evaluación publicados en Granite Guardian GitHub Repo
⁶ Disponibilidad prevista para el cuarto trimestre de 2024
7 Disponibilidad prevista para el cuarto trimestre de 2024
8 Disponibilidad prevista para el primer trimestre de 2025

Fuente(s)

IBM presenta Granite 3.0: Modelos de IA de alto rendimiento creados para las empresas

Artículos relacionados