Données & Vie privée

Caractéristique (IA)

En intelligence artificielle, une caractéristique est une variable ou un attribut mesurable d'un jeu de données qui sert à entraîner un modèle et à effectuer des prédictions.

Définition officielle

Une caractéristique (ou feature en anglais) désigne une propriété mesurable extraite d'un jeu de données et utilisée par un algorithme d'apprentissage automatique. Dans un dataset tabulaire, il peut s'agir d'une colonne numérique ou catégorielle (âge, revenu, localisation). En vision par ordinateur, ce sont des pixels, textures ou contours ; en NLP, des mots, n‑grammes ou vecteurs de plongement (embeddings). Le choix et la qualité des caractéristiques influencent directement les performances d'un modèle. On distingue : **features brutes** (directement extraites des données), **features dérivées** (transformées via ingénierie de caractéristiques), et **features apprises automatiquement** (dans le deep learning). Une étape clé de nombreux projets est la *sélection de caractéristiques*, consistant à retenir celles qui apportent le plus d'information et à éliminer celles qui sont redondantes ou bruitées. Une mauvaise gestion des caractéristiques peut introduire des biais, du surapprentissage ou une perte de performance.

Catégorie

Données & Vie privée

Synonymes

feature, attribut, variable explicative

Avantages

  • Permet de représenter l'information de manière exploitable par un modèle
  • Un bon choix de caractéristiques améliore la précision et réduit les biais
  • Peut être optimisée automatiquement dans le deep learning

Limites

  • Caractéristiques mal choisies = modèle peu performant
  • Risque de surapprentissage si trop nombreuses
  • Peut introduire ou renforcer des biais discriminatoires

Envie d'approfondir vos connaissances en IA ?

Découvrez tous nos termes et concepts dans le lexique complet