Bonjour à tous!
Je me présente rapidement: je suis élève Ingénieur dans une grande École d'Ingénieurs bien connue et je mène actuellement un projet de recherche sur la catégorisation automatique d'images.
Dans un premier temps, nous cherchons à extraire des descripteurs d'une base d'images pour pouvoir les classer selon qu'elles soient des photographies de scènes réelles ou des peintures (dans un second temps nous chercherons à trier les photos en sous-genres comme artistique amateur et reportage).
Nous n'utilisons pour le tri que des descripteurs intrinsèques aux images (contraste, textures, homogénéité pour les plus connus..) et aucune méta données ou tags associés. Nous développons à la fois un algorithme d'extraction mais aussi un algorithme de tri et d'apprentissage pour la classification!
Voila pour la présentation de mon projet!
Le forum MATLAB m'a beaucoup aidé pour avoir quelques précisions, donc merci à tous ses contributeurs!
Bref, venons on à ce qui m’amène ici.
Après avoir extrait les 14 descripteurs d'Haralick, je cherche maintenant à quantifier le flou (ou la netteté d'une image) avec un scalaire (ou un ensemble de scalaires triés dans un vecteur).
J'ai commencé plusieurs pistes qui s’avèrent peu discriminantes.
Compter le nombre de blocs de "grande" taille d'une décomposition en quadtree (problème: un ciel bleu homogène et net donnerait la même réponse qu'un fond flou sur un portrait).
A l'aide d'une DCT ou d'une FFT, déterminer le nombre de hautes fréquences au dessus d'un seuil (problème: quel seuil?).
Malgré mes recherches, peu d'autres pistes ont été soulevés sur le forum et sur le net en général (J'ai lu la thèse de Said Ladjal et les articles proposés sur des précédents topics).
Auriez vous quelques bases pour une émulation sur le sujet?
En espérant avoir été le plus clair possible!
Merci à tous.
Partager