Bonjour,
Je ne connais en rien la programmation et encore moins python, mais un collègue m'a dit que ma demande serait facilement faisable.
J'ai un Dataset de plus de 100 000 images de microscopie. Les noms du dataset sont écrits selon cette forme :
A01_s01_w1
A01_s01_w2
A01_s01_w3
A01_s02_w1
A01_s02_w2
A01_s02_w3
(...)
A01_s25_w1
A01_s25_w2
A01_s25_w3
(...)
A02_s01_w1
A02_s01_w2
A02_s01_w3
(...)
A02_s25_w1
A02_s25_w2
A02_s25_w3
Ainsi la syntaxe A** correspond au puits d'acquisition (A01 à A12; B01 à B12; C01 à C12 etc). La syntaxe S** correspond au site d'acquisition. La syntaxe W1, W2, ou W3 correspond aux couleurs d'acquisition.
Pour chaque puits, le microscope acquiert au total 25 sites différents (S01 a S25) et chacun d'eux en 3 couleurs.
Cependant dans ce dataset j'ai des images manquantes. Toutes les images qui me manquent sont celles dans la couleur w1.
Donc je me retrouve parfois avec des images W2 et W3 orpheline de W1.
Je voudrais pouvoir supprimer toutes les images W2 et W3 qui n'ont pas d'images W1. Ou plus largement tous les sites d'acquisition qui n'ont pas les trois couleurs W1, W2, W3.
Faire cela à la main est quasi impossible sans parler d'erreur possible.
Je vous remercie de votre aide
Jonathan
Partager