La dernière génération de LLM de Big Blue intègre notamment un modèle de langage visuel (VLM), capable d’analyser et de comprendre des documents complexes, ainsi que des fonctionnalités de raisonnement par “chaîne de pensée”.
IBM continue de montrer les muscles sur l’IA. Alors que la firme vient d’annoncer sa volonté de racheter DataStax, elle annonce l’arrivée de Granite 3.2, une nouvelle génération de modèles d’IA. L’un des principaux ajouts de cette itération est l’intégration d’un modèle de langage visuel (VLM), capable d’analyser et de comprendre des documents complexes avec une précision annoncée “équivalente, voire supérieure, à des modèles plus volumineux comme Llama 3.2 11B et Pixtral 12B”. IBM a développé ce modèle à partir d’un corpus de 85 millions de documents PDF, enrichi par 26 millions de paires de questions-réponses générées automatiquement, optimisant ainsi les capacités d’analyse documentaire.
Les nouveaux modèles de la gamme bénéficient également d’une fonctionnalité de raisonnement par "chaîne de pensée", permettant d’améliorer les performances dans les tâches nécessitant une analyse complexe, tout en offrant la possibilité de désactiver cette fonctionnalité lorsque la charge de calcul doit être optimisée. La firme d’Armonk introduit également une version allégée de Granite Guardian, son modèle spécialisé dans la détection des risques et des biais, avec une taille réduite de 30% sans compromettre son efficacité. Cette version intègre une nouvelle approche appelée "confiance verbalisée", qui nuance davantage l’évaluation des risques et des incertitudes dans les flux de travail de sécurité.
Souhaitant coller à son image d'ouverture, IBM propose Granite 3.2 sous licence Apache 2.0 sur la plateforme Hugging Face, avec une intégration immédiate à watsonx.ai, Ollama, Replicate et LM Studio, et une disponibilité prochaine sur RHEL AI 1.5.

