A IBM (NYSE: IBM) anunciou hoje, durante sua conferência TechXchange, o lançamento da família de modelos de IA mais avançada até o momento, o Granite 3.0. A terceira geração de modelos de linguagem Granite da IBM pode superar ou igualar o desempenho de modelos de tamanho semelhante dos principais fornecedores em muitos benchmarks acadêmicos e do setor, demonstrando sólido desempenho, transparência e segurança.
Seguindo o compromisso da IBM com a IA de código aberto, os modelos Granite são lançados sob uma licença Apache 2.0 totalmente permissiva, tornando-os únicos na combinação de desempenho, flexibilidade e direitos que oferece aos clientes corporativos e à comunidade em geral.
A família Granite 3.0 da IBM inclui:
• Uso Geral/Linguagem: Granite 3.0 8B-Instruct, Granite 3.0 2B-Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
• Segurança: Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
• Combinação de especialistas: Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base, Granite 3.0 1B A400M Base
Os novos modelos de linguagem Granite 3.0, 8B e 2B são projetados para suportar grandes volumes de trabalho e facilitar a adoção da IA corporativa, oferecendo excelente desempenho e economia em tarefas como regeneração aumentada (RAG), classificação, resumo, extração de entidade e uso de ferramentas. Esses modelos compactos e versáteis são projetados para se encaixar com precisão nos dados de negócios e se integrar perfeitamente a qualquer ambiente de negócios ou fluxo de trabalho.
O lançamento do Granite 3.0 reafirma o compromisso da IBM com a transparência, segurança e confiança.
A IBM oferece indenização de propriedade intelectual (IP) para todos os modelos Granite em watsonx.ai, permitindo que os clientes corporativos tenham maior confiança na combinação de seus dados com esses modelos.
Subindo a régua: benchmarks Granite 8B e 2B
Em tarefas básicas de negócios RAG, com o uso de ferramentas e tarefas na área de segurança cibernética, o modelo Granite 3.0 8B Instruct mostra desempenho médio superior na comparação com modelos de código aberto de tamanho semelhante da Mistral e Meta[1].
Os modelos foram treinados em mais de 12 trilhões de tokens em dados retirados de 12 linguagens naturais e 116 linguagens de programação diferentes, usando um novo método de treinamento em duas fases, aproveitando os resultados de vários milhares de experimentos projetados para otimizar a qualidade dos dados, a seleção de dados e os parâmetros de treinamento. Até o final do ano, os modelos 8B e 2B também incluirão suporte para comprimento de contexto estendido de 128K e recursos de compreensão de documentos multimodais.
Apresentando o Granite Guardian 3.0: inaugurando a próxima era de IA responsável
Como parte desta versão, a IBM também está introduzindo uma nova família de modelos Granite Guardian que permitem que os desenvolvedores de aplicativos implementem proteções de segurança verificando os prompts do usuário e as respostas do LLM para uma variedade de riscos. Os modelos Granite Guardian 8B e 2B fornecem o conjunto mais abrangente de recursos de detecção de riscos e danos disponíveis no mercado atualmente.
Além das dimensões de dano, como preconceito social, ódio, toxicidade, palavrões, violência, jailbreak e muito mais, esses modelos também fornecem uma variedade de verificações exclusivas específicas do RAG, como fundamentação, relevância do contexto e relevância da resposta.
Embora os modelos Granite Guardian sejam derivados dos modelos de linguagem Granite correspondentes, eles podem ser usados para implementar medidas de segurança junto a qualquer modelo de IA, seja aberto ou proprietário.
Disponibilidade dos modelos Granite 3.0
Todo o conjunto de modelos Granite 3.0 e os modelos de séries temporais atualizados estão disponíveis para download no Hugging Face sob a licença permissiva Apache 2.0. As variantes instrucionais dos novos modelos de linguagem Granite 3.0, 8B e 2B e os modelos Granite Guardian 3.0 estarão disponíveis para uso comercial na plataforma watsonx da IBM. Uma seleção de modelos do Granite 3.0 estará disponível como microsserviços NVIDIA NIM e por meio das integrações do Vertex AI Model Garden do Google Cloud com o HuggingFace.
De assistentes a agentes: tornando o futuro da IA corporativa uma realidade
A IBM está avançando na IA corporativa por meio de um espectro de tecnologias – desde modelos e assistentes até as ferramentas necessárias para ajustar e implantar IA especificamente para dados e casos de uso exclusivos das empresas. A IBM também está abrindo caminho para futuros agentes de IA que podem se autodirigir, refletir e executar tarefas complexas em ambientes de negócios dinâmicos.
Além disso, a IBM apresentou hoje a próxima versão do watsonx Code Assistant, baseada em modelos de código Granite, para fornecer assistência de programação de uso geral em linguagens como C, C++, Go, Java e Python, com recursos avançados de modernização de aplicativos para aplicativos Java corporativos. As funções de código do Granite agora também podem ser acessadas por meio de uma extensão do Visual Studio Code, o IBM Granite.Code.
A IBM continuará desenvolvendo recursos de agentes em todo o seu portfólio em 2025, incluindo agentes pré-construídos para domínios e casos de usos específicos.
Estendendo a plataforma de IA para capacitar os consultores da IBM com IA
A IBM também está anunciando uma grande expansão de sua plataforma de entrega baseada em IA, o IBM Consulting Advantage. A plataforma multimodelo contém agentes, aplicativos e métodos de IA, como estruturas repetíveis, que capacitam 160 mil consultores IBM a fornecer valor melhorado e mais rápido ao cliente, a um custo menor.
Outra parte importante da expansão é a introdução do IBM Consulting Advantage for Cloud Transformation and Management e do IBM Consulting Advantage for Business Operations. Cada um inclui agentes, aplicativos e métodos de IA específicos do domínio infundidos com o IP e as melhores práticas da IBM para que os consultores possam acelerar as transformações de nuvem e IA dos clientes em tarefas como modernização de código, engenharia de qualidade ou ainda transformar e executar operações em domínios como finanças, RH e compras.
- Gartner prevê que receita mundial de semicondutores crescerá 14% em 2025
- IBM avança em segurança de IA e em tecnologia Quantum Safe
- Curitiba se prepara para sediar Data Science Summit 2024
- Terceira revolução da agricultura: smart farming tem avanços consideráveis no Brasil
- A contribuição dos data centers no combate à crise climática e energética