En intelligence artificielle, une caractéristique est une variable ou un attribut mesurable d'un jeu de données qui sert à entraîner un modèle et à effectuer des prédictions.
Une caractéristique (ou feature en anglais) désigne une propriété mesurable extraite d'un jeu de données et utilisée par un algorithme d'apprentissage automatique. Dans un dataset tabulaire, il peut s'agir d'une colonne numérique ou catégorielle (âge, revenu, localisation). En vision par ordinateur, ce sont des pixels, textures ou contours ; en NLP, des mots, n‑grammes ou vecteurs de plongement (embeddings). Le choix et la qualité des caractéristiques influencent directement les performances d'un modèle. On distingue : **features brutes** (directement extraites des données), **features dérivées** (transformées via ingénierie de caractéristiques), et **features apprises automatiquement** (dans le deep learning). Une étape clé de nombreux projets est la *sélection de caractéristiques*, consistant à retenir celles qui apportent le plus d'information et à éliminer celles qui sont redondantes ou bruitées. Une mauvaise gestion des caractéristiques peut introduire des biais, du surapprentissage ou une perte de performance.
Découvrez tous nos termes et concepts dans le lexique complet