Séparer n’importe quoi, récemment publié par Facebook Research, fait quelque chose que la plupart des gens immergés dans la vision par ordinateur ont trouvé intimidant : savoir de manière fiable quels pixels d’une image appartiennent à un objet. Faciliter cela est l’objectif du Segment Anything Model (SAM), qui a récemment été publié sous la licence Apache 2.0.
Les résultats sont superbes et sont là Présentation interactive disponible Vous pouvez jouer avec les différentes façons dont SAM fonctionne. On peut ramasser des choses en pointant et en cliquant sur une image, ou les images peuvent être divisées automatiquement. Honnêtement, c’est impressionnant de voir SAM faire en sorte que le masquage de divers objets dans une image semble si facile. Ce qui rend cela possible, c’est l’apprentissage automatique, et une partie de cela est le fait que le modèle derrière le système a été formé sur un énorme ensemble de données d’images et de masques de haute qualité, ce qui le rend extrêmement efficace dans ce qu’il fait.
Une fois l’image segmentée, ces masques peuvent être utilisés pour interagir avec d’autres systèmes tels que la détection d’objet (qui identifie et étiquette ce qu’est l’objet) et d’autres applications de vision par ordinateur. Ce système fonctionne plus puissamment s’ils savent réellement où chercher, après tout. ce Article de blog de Meta AI Il entre dans quelques détails supplémentaires sur ce qui est possible avec SAM, tous les détails dans document de recherche.
De tels systèmes reposent sur des ensembles de données de haute qualité. Bien sûr, rien ne vaut un tas de données du monde réel, mais nous avons également vu qu’il est possible de générer des données automatisées qui n’existent pas réellement et d’obtenir des résultats utiles.