Apprendre avec très peu de données : le Few-Shot Learning

Accélérez vos projets de vision et d’inspection en tirant parti de modèles pré-entraînés capables de généraliser à partir de quelques exemples — idéal lorsque les défauts sont rares ou coûteux à annoter.

  • Utilise des modèles pré-entraînés (ex. ViT, ResNet) pour extraire des représentations.
  • Classe via des prototypes (moyenne par classe) ou k-NN/LogReg à partir d’un petit support set.
  • Idéal pour démarrer vite, compléter ensuite par un affinement ciblé.
  • 10x moins de données nécessaires*
  • Semaines au lieu de mois pour un PDC

*Ordre de grandeur indicatif selon la complexité des défauts et la variabilité des lots.

Le Few-Shot Learning (FSL) est une approche d’apprentissage automatique qui vise à généraliser à partir de très peu d’exemples étiquetés. Contrairement aux méthodes classiques qui nécessitent des milliers d’images pour atteindre des performances stables, le FSL permet d’apprendre efficacement à partir de quelques dizaines, voire de quelques unités seulement.

L’idée s’inspire de la capacité humaine : un enfant peut reconnaître un nouvel objet après en avoir vu un ou deux exemples. En FSL, on s’appuie sur un encodeur pré-entraîné (ex. ViT, ResNet) qui transforme les images en embeddings. Ensuite, un petit ensemble d’images de référence (le support set) sert à définir une règle de décision qui pourra être appliquée sur de nouvelles données (les requêtes).

Trois familles dominent :

  • Prototypes : moyenne des embeddings par classe, puis attribution par proximité (distance cosinus ou euclidienne).
  • k-plus-proches voisins (k-NN) : comparaison directe des requêtes avec les exemples support, décision par vote majoritaire ou pondéré.
  • Perceptron multicouche (MLP) : une petite tête de réseau de neurones entraînée rapidement sur les embeddings pour capturer des frontières non linéaires.

Le résultat : des systèmes qui démarrent vite, s’adaptent aux évolutions (nouvelles classes, nouveaux produits) et réduisent drastiquement les coûts de collecte et d’annotation. Ces approches sont particulièrement adaptées à l’industrie, où les défauts sont rares, mais où leur détection rapide est critique.

  • Équilibrer le support set (même nombre d’exemples « bon » et « défectueux »).
  • Normaliser les embeddings (L2) pour plus de stabilité numérique.
  • Mettre à jour les prototypes par lot, saison ou changement de matière.
  • Suivre plusieurs métriques (AUROC, F1, précision) pour un diagnostic complet.
  • Compléter le FSL par un fine-tuning ciblé si nécessaire.
  • Moins de données, démarrage rapide.
  • Ajout de nouvelles classes sans ré-entraînement complet.
  • Peu coûteux en calcul, bon pour l’edge.
  • Excellent time-to-value pour des défauts rares.
  • Dépendance à la qualité des exemples de support.
  • Moins robuste si la variabilité est extrême.
  • Nécessite une bonne stratégie d’échantillonnage.
  • Peut nécessiter un affinement (fine-tuning) sur des cas difficiles.
  • Moins adapté si les classes changent radicalement sur le terrain.

Détection de défauts (cuir, textile, carreaux, pièces usinées). Quelques images « bon » / « défectueux » suffisent pour lancer une PDC et mesurer AUROC/F1.

Aiguillage des non-conformités vers l’opérateur avec carte de chaleur ou patchs à risque. Réduction du faux rejet en amont.

Surveillance de surfaces (rouleaux, convoyeurs, soudures) avec apprentissage incrémental quand un nouveau type d’usure apparaît.

Déploiement léger sur caméra industrielle embarquée ; décision en quelques millisecondes avec embeddings normalisés.

Au CRVI, nous appliquons le Few-Shot Learning sur des cas industriels où les défauts sont rares mais critiques à détecter. Ces projets couvrent l’inspection visuelle, la robotique et le tri qualité, avec des contraintes fortes de rapidité et de fiabilité.

Sur cuir et textile : en combinant Prototypes et MLP (embeddings ViT), nos PDC internes ont atteint un F1-score > 85 % sur des défauts rares avec moins de 30 images par classe.

Guidage et inspection de pièces usinées : AUROC > 0,90 avec un support set réduit (5-10 images par classe) grâce aux Prototypes et au MLP.

Aiguillage opérateur en bord de ligne avec k-NN pour le diagnostic rapide ; baisse des faux rejets grâce à des seuils adaptés par famille de produits.

ModèleNombre d’images supportAUROCF1-score
Prototypes5–10> 0,90~ 80 %
MLP10–30> 0,92> 85 %
k-NNVariable~ 0,88~ 78 %

Contexte : dans l’industrie, un défaut manqué peut générer des coûts élevés, mais trop de faux rejets augmentent aussi les pertes. Les métriques choisies reflètent cet équilibre.

  • AUROC (Area Under ROC Curve) : mesure la capacité globale du modèle à séparer les classes. Utile quand il existe un fort déséquilibre entre bons et défectueux.
  • F1-score : moyenne harmonique entre précision et rappel, pertinente quand les classes minoritaires (défauts) sont critiques.
  • Précision / rappel : suivis en interne pour ajuster les seuils selon la tolérance aux faux positifs ou faux négatifs.

Notes : les valeurs exactes varient selon la famille de produits et la qualité des images. Les résultats ci-dessus sont issus d’expérimentations internes CRVI avec embeddings ViT et jeux réduits de données.

Détection de défauts (cuir, textile, carreaux, pièces usinées). Quelques images « bon » / « défectueux » suffisent pour lancer une PDC et mesurer AUROC/F1.

  • Atelier cadrage (2-3 h) : définir pièces, défauts, contraintes, KPI (AUROC/F1, faux rejet, cadence).
  • PDC Few-Shot (1-3 semaines) : collecte ciblée (20-50 images/étiquette), prototypes vs k-NN, rapport de risques.
  • Pilote en ligne : intégration caméra/PLC, seuils adaptatifs, supervision opérateur.
  • Transfert & formation : documentation, MLOps léger, gouvernance des données.
  • Notebook reproductible (traçabilité des embeddings).
  • Tableau de bord AUROC/F1 & matrice de confusion.
  • Procédure d’échantillonnage du support set.
  • Guide d’exploitation & plan d’amélioration continue.

À surveiller : qualité des images (éclairage, focalisation), représentativité par lot, et mise à jour des prototypes lors des changements de matière ou d’outillage.

Nous montons un PDC rapide sur vos échantillons pour démontrer la valeur sans immobiliser votre production.