Anuncios
IBM presenta Granite 3.0: modelos de IA de alto rendimiento diseñados para las empresas
ARMONK, NY - 21 de octubre de 2024 - IBM ha anuncadio hoy, en el TechXchange de IBM (NYSE: IBM), el lanzamiento de su familia de modelos de IA más avanzada hasta la fecha, Granite 3.0. La tercera generación de modelos de lenguaje Granite de IBM puede superar o igualar el rendimiento de modelos de tamaño similar de proveedores líderes en muchas pruebas de referencia académicas y del sector, demostrando un sólido rendimiento, transparencia y seguridad.
En línea con el compromiso de la compañía con la IA de código abierto, los modelos Granite se publican bajo la licencia permisiva Apache 2.0, lo que los hace únicos por la combinación de rendimiento, flexibilidad y autonomía para los clientes empresariales y la comunidad en general.
La familia Granite 3.0 de IBM incluye:
- Propósito general/Lenguaje: Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
- Barreras de protección y seguridad: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
- Mixture of Experts (MoE): Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base, Granite 3.0 1B A400M Base
Los nuevos modelos de lenguaje Granite 3.0 8B y 2B están diseñados como «caballos de batalla» para la IA empresarial, ofreciendo un gran rendimiento y rentabilidad en tareas como la regeneración aumentada de recuperación (RAG), clasificación, resumen, extracción de entidades y uso de herramientas. Estos modelos compactos y versátiles están diseñados para ajustarse con precisión a los datos empresariales e integrarse a la perfección en cualquier entorno empresarial o flujo de trabajo.
Mientras que muchos de los grandes modelos de lenguaje (LLM) se entrenan con datos públicos, gran parte de los datos empresariales siguen sin aprovecharse. Combinando un pequeño modelo Granite con datos empresariales, especialmente utilizando la revolucionaria técnica de alineación InstructLab, – presentada por IBM y RedHat en mayo - IBM cree que las empresas pueden alcanzar un rendimiento específico para tareas que rivaliza con los modelos más grandes a una fracción del coste (con una reducción observada de entre 3 y 23 veces el coste de los grandes modelos de última generación en varias pruebas de concepto[1] tempranas).
El lanzamiento de Granite 3.0 reafirma el compromiso de IBM con la creación de transparencia, la seguridad y la confianza en los productos de IA. El informe técnico de Granite 3.0v y la guía de uso responsable proporcionan una descripción de los conjuntos de datos utilizados para entrenar estos modelos, detalles de los pasos de filtrado, limpieza y curación aplicados, junto con unos resultados completos del rendimiento del modelo en importantes pruebas académicas y empresariales.
Como punto fundamental, IBM ofrece una indemnización de propiedad intelectual (IP) para todos los modelos Granite en watsonx.ai, lo que permite a los clientes empresariales tener mayor confianza al combinar sus datos con estos modelos.
Subiendo el listón: Pruebas de Granite 3.0
Los modelos de lenguaje Granite 3.0 también muestran resultados prometedores en cuanto a rendimiento bruto.
En tareas académicas estándar definidas por Hugging Face’s OpenLLM Leaderboard, el rendimiento global del modelo Granite 3.0 8B Instruct es, en promedio, superior al de los modelos de código abierto de tamaño abierto similar de Meta y Mistral. En la prueba de seguridad AttaQ de IBM, el modelo Granite 3.0 8B Instruct lidera todas las dimensiones de seguridad medidas en comparación con los modelos Meta y Mistral[2].
En las tareas empresariales básicas de RAG, uso de herramientas y tareas en el ámbito de la ciberseguridad, el modelo Granite 3.0 8B Instruct muestra un rendimiento superior de media en comparación con los modelos de código abierto de tamaño similar de Mistral y Meta[3].
Los modelos Granite 3.0 se han estrenado con más de 12 billones de tokens de datos a partir de 12 lenguajes naturales y 116 lenguajes de programación diferentes, utilizando un novedoso método de entrenamiento en dos fases, que aprovecha los resultados de varios miles de experimentos diseñados para optimizar la calidad y la selección de datos y los parámetros de entrenamiento. Para finales de año, se espera que los modelos lingüísticos 8B y 2B también incluyan soporte para una ventana de contexto extendida de 128K y capacidades de comprensión multimodal de documentos.
Demostrando un excelente equilibrio entre rendimiento y coste de inferencia, IBM ofrece sus modelos Granite Mixture of Experts (MoE) Architecture, Granite 3.0 1B A400M y Granite 3.0 3B A800M como modelos más pequeños y ligeros que pueden ser desplegadas en aplicaciones de baja latencia, así como para despliegues basados en CPU.
IBM también ha anunciado una versión actualizada de sus modelos Granite Time Series preentrenados, cuyas primeras versiones se lanzaron a principios de este año. Estos nuevos modelos están entrenados con tres veces más datos y ofrecen un gran rendimiento en las principales pruebas de series temporales, superando en promedio a modelos 10 veces más grandes de Google y Alibaba. Los modelos actualizados también proporcionan una mayor flexibilidad de modelización con soporte para variables externas y previsiones[4] continuas.
Presentando Granite Guardian 3.0: la nueva era de la IA responsable
Como parte de este lanzamiento, IBM también ha presentado una nueva familia de modelos Granite Guardian que permiten a los desarrolladores de aplicaciones implementar barreras de seguridad mediante la comprobación de los avisos al usuario y las respuestas LLM para detectar una variedad de riesgos. Los modelos Granite 3.0 8B y 2B ofrecen el conjunto más completo de capacidades de detección de riesgos y daños disponibles actualmente en el mercado.
Además de las dimensiones de daño, como prejuicios sociales, odio, toxicidad, blasfemia, violencia, técnicas de jailbreak etc., estos modelos también proporcionan una serie de comprobaciones únicas específicas de RAG, como el fundamento, la relevancia del contexto y la relevancia de la respuesta. En pruebas exhaustivas realizadas en más de 19 pruebas de referencia de seguridad y RAG, el modelo Granite Guardian 3.0 8B ha obtenido una precisión global superior en la detección de daños que las tres generaciones de modelos Llama Guard de Meta. En la detección de alucinaciones, su rendimiento global también es similar al de los modelos especializados WeCheck y MiniCheck[5].
Aunque los modelos Granite Guardian se derivan de los correspondientes modelos de lenguaje Granite, pueden utilizarse para implementar medidas de seguridad junto a cualquier modelo de IA, ya sea abierto o propietario.
Disponibilidad de los modelos Granite 3.0
Toda la suite de modelos Granite 3.0 y los modelos actualizados series temporales están disponibles para su descarga en HuggingFace bajo la licencia permisiva Apache 2.0. Las variantes instructivas de los nuevos modelos lingüísticos Granite 3.0 8B y 2B y los modelos Granite Guardian 3.0 estarán disponibles desde hoy para uso comercial en la plataforma watsonx de IBM. A su vez, estará disponible una selección de modelos Granite 3.0 como microservicios NVIDIA NIM y a través de las integraciones Vertex AI Model Garden de Google Cloud con HuggingFace.
Para facilitar la elección y el uso por parte de los desarrolladores, así como las implantaciones locales, un conjunto seleccionado de modelos Granite 3.0 también está disponible en Ollama y Replicate.
La última generación de modelos Granite amplía el robusto catálogo de código abierto de IBM de potentes LLMs. IBM ha colaborado con socios del ecosistema como AWS, Docker, Domo, Qualcomm Technologies, Inc. a través de su AI Hub, Salesforce y SAP, entre otros, para integrar una variedad de modelos Granite en las ofertas de estos partners o hacer que los modelos Granite estén disponibles en sus plataformas, ofreciendo una mayor variedad a las empresas de todo el mundo.
De asistentes a agentes: haciendo realidad el futuro de la IA empresarial
IBM está impulsando la IA empresarial a través de una amplia gama de tecnologías, desde modelos y asistentes hasta las herramientas necesarias para ajustar y desplegar la IA específicamente para los datos y casos de uso únicos de las empresas. IBM también está allanando el camino para que los futuros agentes de IA puedan autodirigirse, reflexionar y realizar tareas complejas en entornos empresariales dinámicos.
IBM sigue desarrollando su cartera de tecnologías de asistentes de IA: desde watsonx Orchestrate, que ayuda a las empresas a crear sus propios asistentes mediante herramientas de bajo código y automatización, hasta un amplio conjunto de asistentes preconstruidos para tareas y áreas específicos, como atención al cliente, recursos humanos, ventas y marketing. Organizaciones de todo el mundo han utilizado watsonx Assistant para ayudarles a crear asistentes de IA para tareas como responder a preguntas rutinarias de clientes o empleados, modernizar sus mainframes y aplicaciones de IT heredadas, ayudar a los estudiantes explorar posibles trayectorias profesionales o proporcionar asistencia hipotecaria digital a los compradores de viviendas.
Asimismo, IBM ha presentado hoy la próxima versión de watsonx Code Assistant, basada en los modelos de código Granite, para ofrecer asistencia de programación de uso general en lenguajes como C, C++, Go, Java y Python, con capacidades avanzadas de modernización de aplicaciones para Enterprise Java Applications[6]. Ahora también se puede acceder a las funciones de código de Granite a través de una extensión de Visual Studio Code, IBM Granite.Code.
Además, la compañía tiene previsto lanzar nuevas herramientas para ayudar a los desarrolladores a crear, personalizar y desplegar la IA de manera más eficiente a través de watsonx.ai, incluyendo Agentic AI Frameworks, integraciones con entornos existentes y automatizaciones de bajo código para casos de uso comunes como RAG y agentes[7].
IBM se centra en el desarrollo de tecnologías de agentes de IA capaces de una mayor autonomía, razonamiento sofisticado y resolución de problemas en varios pasos. El lanzamiento inicial del modelo Granite 3.0 8B ofrece soporte para las principales capacidades de los agentes, como el razonamiento avanzado, y un estilo de plantillas y prompts altamente estructurados para implementar flujos de trabajo de uso de herramientas. IBM también tiene previsto introducir una nueva función de chat con agentes de IA en IBM watsonx Orchestrate, que utiliza capacidades de IA orientada a agentes para orquestar asistentes de IA, habilidades y automatizaciones que ayudan a los usuarios a aumentar la productividad en sus equipos[8]. IBM tiene previsto seguir creando capacidades para agentes en toda su cartera en 2025, incluidos aquellos preconstruidos para varios ámbitos y casos de uso específicos.
Ampliación de la plataforma impulsada por IA para impulsar a los consultores de IBM con IA
IBM también ha anunciado una importante expansión de su plataforma de prestación de servicios impulsada por IA, IBM Consulting Advantage. La plataforma multimodal cuenta con agentes de IA, aplicaciones y métodos como marcos replicables que pueden capacitar a 160.000 consultores de IBM ofrecer un valor al cliente mejor y más rápido a un coste menor.
Como parte de la expansión, los modelos de lenguaje Granite 3.0 se convertirán en el modelo por defecto en Consulting Advantage. Aprovechando el rendimiento y la eficiencia de Granite, IBM Consulting podrá ayudar a maximizar el retorno de la inversión para los proyectos de GenAI de los clientes de IBM.
Otra parte clave de la expansión es la introducción de IBM Consulting Advantage for Cloud Transformation and Management e IBM Consulting Advantage for Business Operations. Cada una incluye agentes de IA específicos para varios campos, aplicaciones y métodos infusionados con las mejores prácticas de IBM, para que los consultores de IBM puedan acelerar las transformaciones de nube e IA de los clientes en tareas como la modernización de código y la ingeniería de calidad, o transformar y ejecutar operaciones a través de diversos dominios, como finanzas, recursos humanos y adquisiciones.
Para obtener más información sobre Granite y la estrategia AI for Business de IBM, visite https://www.ibm.com/granite.
[1] Los cálculos de costes se basan en los precios de coste de API por millón de tokens de IBM watsonx para modelos abiertos y openAI para modelos GPT4 (suponiendo una mezcla de 80% de entrada y 20% de salida) para pruebas de concepto de clientes.
[4] The tiny Time Mixer: Modelos rápidos preentrenados para la predicción mejorada de cero o pocos impactos en series temporales multivariantes
[6] Disponibilidad prevista para el cuarto trimestre de 2024
[7] Disponibilidad prevista para el cuarto trimestre de 2024
[8] Disponibilidad prevista para el primer trimestre de 2025