L'open data désigne la mise à disposition libre et gratuite de données publiques ou privées, dans des formats ouverts et réutilisables, y compris pour l'entraînement de modèles d'IA.
L'open data (données ouvertes) correspond à la publication de données accessibles à tous, sans restriction de droits d'usage, dans un format standardisé et interopérable. Initié par des politiques publiques de transparence et d'innovation, l'open data est devenu un levier majeur pour l'intelligence artificielle. Les jeux de données ouverts permettent aux chercheurs, entreprises et citoyens de développer des modèles d'IA, de tester des algorithmes et de favoriser l'innovation. Des plateformes comme data.gouv.fr ou le portail européen des données centralisent des milliers de jeux (mobilité, santé, énergie). Cependant, l'open data doit respecter la législation sur les données personnelles et sensibles : certaines informations doivent être anonymisées ou agrégées avant publication. En IA, l'open data est utilisé pour entraîner des modèles de prédiction, développer des outils de visualisation ou créer des services numériques à impact sociétal. Il constitue une ressource essentielle pour la démocratisation de l'IA.
Découvrez tous nos termes et concepts dans le lexique complet