Contexte :
Pour lancer notre série d'articles du Lixo Journal Club, nous avons choisi de vous présenter l'article ZeroWaste : Toward Automated Waste Recycling de Bashkirova et al. qui a été présenté à la “2022 Conference on Computer Vision and Pattern recognition” !
Il s'agit d'un type d'article particulier puisqu'il n'améliore pas une nouvelle architecture ou un calcul de perte, mais publie un nouveau jeu de données pour la détection et la segmentation d'objets sur des images d'installations de gestion des déchets.
Pourquoi avons-nous choisi cet article ?
Le jeu de données ZeroWaste est le premier jeu de données en libre accès fournissant des images d'installations de tri, en particulier un convoyeur (tapis roulant) contenant du papier (”fibreux” dans le vocabulaire de l’industrie). Ces images sont différentes des jeux de données bien connus tels que COCO ou PASCAL VOC.
En effet, les objets présents à l’image sont très déformés, déchiquetés, superposés et imbriqués. Ils sont aussi d’une immense variété de couleurs et de formes ; cette variété est d’ailleurs en constante augmentation, à mesure de que nouveaux produits et emballages sont mis sur le marché tous les jours.
Par conséquent, ce type de jeu de données présente un gros problème de sous représentations de certaines classes. Il est également extrêmement chronophage et technique à annoter, au point qu’il nécessite la supervision d’experts de l’industrie des déchets.
Pour toutes ces raisons, ces images labellisées sont très précieuses, soit pour améliorer un modèle existant, soit pour tester de nouvelles idées ciblées.
En quoi est-ce innovant ?
L'objectif principal de cet article est de fournir un ensemble de données aux chercheurs afin qu'ils puissent s'attaquer aux problèmes des centres de tris et développer de nouveaux algorithmes pour surmonter ces défis.
Dans leur article, ils publient :
- un jeu de données entièrement labellisé ;
- un jeu de données non labellisé pour l'apprentissage semi-supervisé ;
- un jeu de données augmenté d'objets provenant de TACO (Trash Annotation in COntext) pour lutter contre le “class imbalance”.
L’article fournit également une base de référence pour la segmentation d'instances à l'aide de Mask-RCNN, TridentNet et DeepLabV3+.
Quelles sont ses limites ?
La capture d'images
Leurs modèles peinent à atteindre les performances que nous voyons dans les articles habituels sur la détection d'objets ou la segmentation d'instances. Ils sont également inférieurs aux performances que nous avons sur un convoyeur similaire. Une explication possible est le protocole de capture d'image qu'ils utilisent.
Chez Lixo, nous utilisons une caméra plus proche du convoyeur avec une lumière plus vive pour réduire le flou et améliorer la qualité de l'image. Nous pensons que l'algorithme de suppression du flou (SRN-Deblur) et la suppression de l'œil de poisson qu'ils ont dû mettre en œuvre pour avoir leurs images finales diminuent la qualité de l'image. Ces transformations sont la raison pour laquelle il y a une diminution de la performance du modèle sur les petits objets.
Taxonomie
La deuxième limite majeure est la taxonomie de classe utilisée. Du point de vue d'un professionnel de la gestion des déchets, elle serait beaucoup trop limitée : il n'y a pas assez de classes pour classer précisément un flux de déchets. Chez Lixo, nous avons une taxonomie de classe beaucoup plus détaillée. Par exemple, nous distinguons chaque plastique en fonction de sa résine (PET clair, PET coloré, HDPE, etc.) pour avoir une idée réelle de la qualité des déchets et de leur valeur de récupération.
Conclusion
En conclusion, nous trouvons formidable que des chercheurs universitaires s'intéressent à la gestion des déchets, et nous sommes très enthousiastes à l'idée de voir ce qu'ils peuvent apporter au domaine.
Mais leur approche montre également combien il est important de rester en phase avec les besoins des clients. En effet, les clients du secteur de la gestion des déchets ne souhaitent pas seulement identifier les "contaminants", mais aussi comprendre la part des contaminants dans un certain flux. Cette part, qu'elle soit donnée en % du total des objets ou en % de la masse, nécessite de détecter 100% des objets sur l'image.
Lixo brille en fournissant les deux (identification des contaminants + matériel cible) à ses clients, et nous croyons que cela fait une énorme différence dans l'analyse des flux de déchets !
Pour en savoir plus :
- ZeroWaste dataset: Towards Deformable Object Segmentation in Cluttered Scenes, Dina Bashkirova, Mohamed Abdelfattah, Ziliang Zhu, James Akl, Fadi Alladkani, Ping HuVitaly Ablavsky, Berk Calli, Sarah Adel Bargal and Kate Saenko (2021)