IA

Un modèle Mistral pour l’arabe et les langues indiennes

Mistral Saba de a été entraîné sur des données spécifiques afin de mieux prendre en charge les subtilités linguistiques des langues arabes et indiennes et de mieux répondre à des besoins régionaux.

Modèle de 24 milliards de paramètres, Mistral Saba de Mistral AI a été entraîné sur des données du Moyen-Orient et d’Asie du Sud. Il prend en charge l’arabe ainsi que plusieurs langues d’origine indienne, en particulier les langues du sud de l’Inde comme le tamoul.

Son mode d’entraînement lui permet de fournir des réponses plus précises que de grands modèles de langage cinq fois plus volumineux, tout en étant plus nuancé et nourri du contexte culturel et des connaissances spécifiques aux régions concernées.

Devant GPT-4o Mini et Llama 3.3 70B

« Rendre l'IA omniprésente implique de prendre en compte chaque culture et chaque langue. À mesure que l'IA se répand à l’échelle mondiale, de nombreux clients expriment le besoin de modèles qui ne soient pas seulement fluides, mais véritablement natifs des usages régionaux. »

L’outil est disponible via une API et peut être déployé en local. Il fonctionne sur un seul GPU et ses performances dépassent 150 tokens par seconde.

Côté cas d’usage, Mistral Saba peut être utilisé à la fois comme support conversationnel, pour l’expertise sectorielle dans des domaines spécifiques tels que l’énergie, les marchés financiers et la santé, ainsi que pour la création de contenus culturels « adaptés à la culture locale, y compris de ressources éducatives », adaptées « pour les audiences du Moyen-Orient ».

Mistral assure faire mieux que GPT-4o Mini (OpenAI) ou encore Llama 3.3 70B pour traiter du contenu dans ces langues.

Nos derniers livres blancs