Outils Matrox Imaging Library (MIL)

Classification

MIL X comprend des outils de classification pour catégoriser automatiquement le contenu des images ou les caractéristiques extraites précédemment en utilisant l’apprentissage automatique. La classification orientée image utilise la technologie de l’apprentissage profond, en particulier les réseaux de neurones convolutifs (CNN), dans trois approches distinctes.
 
L’approche globale attribue des images ou des régions d’images à des classes préétablies. Il se prête à des tâches d'identification où l'objectif est de distinguer des objets d'apparence similaire, y compris ceux présentant de légères imperfections. Les résultats pour chaque image ou région d’image consistent en la classe la plus probable et un score pour chaque classe.
 
La segmentation grossière génère des cartes indiquant la classe et le score préétablis pour tous les voisinages de l’image. Il convient aux tâches de détection dont l'objectif est de déterminer l'incidence, l'emplacement et l'étendue des défauts ou des caractéristiques. Ces fonctionnalités peuvent ensuite être analysées et mesurées plus en détail à l'aide d'outils traditionnels tels que l'Analyse Blob.
 
L'approche de détection d'objet localise des instances de classes préétablies. Il convient aux tâches d'inspection dont le but est de trouver, dimensionner et compter des objets ou des caractéristiques. Le résultat pour chaque instance localisée est la classe la plus probable, le score et une boîte englobante comprenant les coordonnées du coin, le centre, la hauteur et la largeur. La classification orientée image est particulièrement bien adaptée à l’inspection d’images de produits hautement texturés, variant naturellement et présentant des déformations acceptables.
 
Les utilisateurs peuvent choisir de former un CNN eux-mêmes ou demander à Matrox Imaging de le faire en utilisant des images collectées au préalable ; ces images doivent être à la fois en nombre suffisant et représentatives des conditions d’application prévues. Différents types d’entraînement sont possibles, tels que l’apprentissage par transfert et le réglage fin, le tout à partir de l’une des architectures CNN prédéfinies fournies. MIL X fournit l’infrastructure et l’environnement interactif nécessaires pour construire l’ensemble de données de formation requis, y compris l’étiquetage des images et l’augmentation de l’ensemble de données avec des images synthétisées, ainsi que le suivi et l’analyse du processus d’entraînement. MIL X peut masquer les complexités associées en subdivisant automatiquement l'ensemble de données de formation, en offrant des augmentations prédéfinies et en proposant un modèle de réseau neuronal pour commencer. L’apprentissage est réalisé à l’aide d’un GPU NVIDIA3 ou d’un CPU x64. L’inférence est effectuée sur un CPU, GPU intégré Intel3 et GPU NVIDIA3, prenant en charge de différentes exigences de vitesse et de budget. Alternativement, les utilisateurs peuvent importer un modèle de réseau neuronal formé et compatible stocké dans le format populaire ONNX.
 
La classification orientée caractéristique utilise une technique d’ensemble d’arbres pour catégoriser les objets d’intérêt à partir de leurs caractéristiques, exprimées sous forme numérique, obtenues par une analyse préalable à l’aide d’outils tels que l’Analyse Blob. La catégorisation est effectuée par un vote majoritaire des arbres de décision des caractéristiques individuelles. Comme pour la classification orientée image, les utilisateurs peuvent former eux-mêmes un ensemble d’arbres en utilisant les fonctions fournies dans MIL X ou faire appel à Matrox Imaging pour cette tâche.