Mistral AI a présenté, mercredi 29 mai, Codestral, un modèle d’IA générative spécialement conçu pour la génération de code et qui prend en charge plus de 80 langages de programmation.
Destiné aux développeurs, Codestral permet d’écrire et d’interagir avec le code via un point de terminaison d’API d’instruction et d’achèvement partagé. Le modèle a été formé sur un ensemble de données comprenant plus de 80 langages de programmation, de Python, Java, C, C++, JavaScript et Bash, en passant par d’autres plus spécialisés, comme Swift et Fortran.
« Cette large base linguistique garantit que Codestral peut aider les développeurs dans divers environnements et projets de codage », écrit la startup française dans son communiqué.
Comme il est de coutume, Mistral AI a comparé les performances de son nouvel outil de 22 milliards de paramètres et d'une fenêtre contextuelle de 32k avec les modèles concurrents tel que Code Llama 70B, Llama 3 70B et DeepSeek Coder 33B. Il les surpasse tous, déjà, sur la fenêtre contextuelle.
Disponible sur HuggingFace
« Avec sa fenêtre contextuelle plus grande de 32 Ko (contre 4 Ko, 8 Ko ou 16 Ko pour les concurrents), Codestral surpasse tous les autres modèles de RepoBench, une évaluation à longue portée pour la génération de code », écrit l’entreprise.
Les performances SQL de Codestral ont été évaluées à l’aide du benchmark Spider. Sur ce point, le modèle français fait moins bien que Llama 3 70B. Codestral l’emporte toutefois sur les tests HumanEval dans six langages différents en plus de Python : C++, Bash, Java, PHP, TypeScript et C#.
Codestral est en mesure d’écrire du code, mais aussi de produire des tests et de compléter des codes partiels, via un mécanisme de remplissage. Le modèle, disponible sur HuggingFace, est sous licence de non-production Mistral AI, et peut ainsi être utilisé à des fins de recherche et de test. Il est en outre disponible sur l'API - api.mistral.ai. Une version Instruct de Codestral est accessible depuis l’interface conversationnelle de Mistral AI.