Le nouveau modèle de fondation développé conjointement par IBM et l'Agence spatiale européenne (ESA) combine des informations provenant de neuf types de données d'observation de la Terre pour offrir une compréhension intuitive et approfondie de notre planète.
Les deux entités publient Terramind un nouveau modèle d'observation de la Terre qui a été rendu disponible en open-source sur la plateforme d'HuggingFace. Ce modèle a été pré-entraîné sur TerraMesh, le plus grand ensemble de données géospatiales existant, construit par les chercheurs dans le cadre du projet TerraMind. Ce projet se distingue par son architecture unique de codeur-décodeur à base de transformateurs symétriques, conçue pour fonctionner avec des entrées de type pixel, jeton et séquence, et pour apprendre les corrélations entre les différentes modalités. Bien qu'il ait été entraîné sur 500 milliards de tokens, TerraMind est un modèle compact et léger, qui utilise 10 fois moins de calcul que les modèles standards pour chaque modalité. Cela signifie que les utilisateurs peuvent le déployer à grande échelle à moindre coût, tout en réduisant la consommation d'énergie globale lors de l'inférence.
Lors de la création de l'ensemble de données, les chercheurs ont inclus des données provenant de tous les biomes, types d'utilisation et d'occupation des sols, et régions du monde, ce qui permet d'appliquer le modèle de manière égale à n'importe quelle application, avec des biais limités. Le jeu de données comprend 9 millions d'échantillons de données spatio-temporelles réparties à l'échelle mondiale et réparties selon neuf modalités de données principales, notamment les observations effectuées par les capteurs des satellites, la géomorphologie de la surface de la Terre, les caractéristiques de surface importantes pour la vie sur Terre (végétation et utilisation des sols) et les bases de la description des lieux et des caractéristiques (latitude, longitude et descriptions textuelles simples).
Les modèles existants traitent des données provenant de sources qui ne peuvent pas toujours appréhender la complexité des conditions réelles de notre planète. Par exemple, les satellites qui orbitent autour de la Terre fournissent des données temporelles sur les événements naturels, mais ils ne reviennent au même endroit que tous les cinq jours. Cela peut être suffisant pour analyser les tendances climatiques à long terme, mais cela peut rendre difficile le suivi des événements climatiques à court terme, tels que les incendies de forêt ou les inondations. Lorsque chaque jour compte, les chercheurs ont besoin de données récentes et précises pour faire des prévisions ou évaluer les risques à l'aide de modèles d'intelligence artificielle.
Pour relever ce défi, les chercheurs d'IBM ont uni leurs forces avec l'Agence spatiale européenne (ESA) pour développer un nouveau modèle de fondation d'IA multimodale. Ce modèle a été créé en combinant les compétences techniques d'IBM en matière de préparation des données et de construction de modèles de fondation avec les données précieuses d'observation de la Terre de l'ESA et leur expertise en matière d'évaluation de modèles. Le modèle a été formé en utilisant l'infrastructure et l'expertise du Centre de supercalcul de Jülich et d'autres partenaires ont contribué au processus de développement en menant des expériences de mise à l'échelle et en préparant des applications de réduction d'échelle.

