Amazon intensifie la course à l’IA générative avec Nova, sa famille de modèles d’IA générative optimisée pour les entreprises et qui, selon Amazon, rivalisent avec la concurrence, voire les surpassent tout simplement.
Entrée tardivement dans l’IA générative, Amazon a frappé fort. Mardi 3 décembre, la firme a présenté Nova, une nouvelle famille de modèles d’IA disponible sur Amazon Bedrock. La marque à la flèche affirme que sa technologie offre des rapports prix/efficacité « inégalés » et des capacités de création d’agents d’IA optimisés pour les charges de travail d’entreprise.
Des modèles qui font mieux que la concurrence ?
Deux grandes familles de modèles ont été présentées. La première regroupe trois modèles dédiés à la compréhension intelligente des textes et des visuels.
Amazon Nova Micro est un modèle texte performant dans la synthèse, la traduction, la classification de contenu, le chat interactif, ainsi que le raisonnement mathématique ou de codage simple, assure Amazon. Comme il est de coutume, Amazon a effectué un benchmark pour comparer les capacités de ses modèles à ceux de la concurrence. Toutes catégories confondues, Nova Micro surpasse Gemini 1.5 Flash 8B (Google) et LLaMa 3.1 8B (Meta).
Amazon Nova Lite est un modèle multimodal capable de traiter des entrées texte, image et vidéo pour générer des réponses textuelles. Il peut être utilisé pour des interactions clients en temps réel, l’analyse documentaire et le questionnement visuel. Il rivalise avec Claude 3.5 Haiku, GPT4o, Gemini 1.5 Flash et LLaMa 3.2.
Amazon Nova Pro, également multimodal, est qualifié de « hautement performant » par Amazon. Il excelle dans l’analyse documentaire complexe, le traitement de code ou les workflows nécessitant des appels API. Ses performances se comparent avantageusement à celles de Claude 3.5 Sonnet V2, GPT4o, Gemini 1.5 et LLama 3.2 90B.
La seconde famille de modèles se concentre sur la génération de contenus créatifs :
Amazon Nova Canvas génère des images « de qualité studio » avec des contrôles précis sur le style et le contenu. Il inclut des outils d’édition comme le remplissage ou l’extension d’image et le retrait de fond. Amazon affirme que Nova Canvas dépasse DALL-E 3 (OpenAI) et Stable Diffusion (Stability).
Amazon Nova Reel, quant à lui, se spécialise dans la génération de vidéos professionnelles à partir de textes et d’images pour des usages en marketing et en publicité. Il surclasserait Gen-3 Alpha (Runway), selon Amazon.
D’autres modèles prévus pour 2025
Amazon prévoit de lancer d’autres modèles courant 2025. Toujours en entraînement, Amazon Nova Premier est présenté comme le modèle multimodal « le plus avancé », conçu pour les tâches de raisonnement complexe et la création de modèles personnalisés. Un autre modèle, également attendu en 2025, sera capable de prendre en entrée du texte, de l’audio, des images et des vidéos, et de générer des sorties sous ces mêmes formats.