Bonjour à Tous,
Je travaille dans un projet ou j'ai besoin de déterminer les catégories (ou Topics) d'intérêts des utilisateurs.
Pour cela, je suis entrain de chercher une base de connaissance générique (de préférence une taxonomie) qui peut me déterminer les centres d'intérêts des utilisateurs en reposant sur leurs activités.
Je connais une taxonomie générique (DMOZ) qui permet de déterminer la catégorie (ou Topics) des activités des utilisateur en reposant sur une fonction de similarité entre des vecteurs définissant les contenus vus par l'utilisateur et des vecteurs des catégories de la taxonomie (sachant que chaque catégorie dans la taxonomie est définie par un ensemble des mots clés). En d'autres termes, si je le donne comme entrée un document ou un ensemble des mots clés, elle me renvoie la catégorie la plus proche de ce contenu. Le souci que cette taxonomie est en anglais et la version française est très limitée. Pour cela, je suis entrain d'investiguer et vérifier si avec DBpedia je peux faire ce que j'ai déjà expliqué.
Dans DBpedia, j'ai vu le mot catégories mais savez vous s'ils ont tous le même niveau ou bien des niveaux différent selon une hiérarchie déjà clair. Également, les catégories dans DBpedia sont ils définie en reposant sur un vocabulaire des mots qu'ont peut les utiliser après pour identifier la distance entre les catégories de Dbpedia et les mots clés définissant chacun des contenus ?
Merci d'avance !
Partager