Bonjour,
J'aimerais trouver un algorithme, programmer ou trouver un utilitaire qui puisse m'aider à créer des statistiques à partir d'une liste de fichiers.
Pour exemple, je peux disposer de plusieurs milliers de fichiers dans un dossier sous l'explorateur Windows - des noms de fichiers longs et précis: des listes bibliographiques. Je souhaiterais identifier les mots clés de cette liste et d'en dresser des statistiques ; au moins pour les plus redondants. Si possible, pour des raisons pratiques et selon la faisabilité bien sûr, exclure certains mots, à partir d'une liste d'exclusion à définir, ou plus simplement/généralement ignorer chiffres et mots inférieurs à x caractère.
Je ne suis pas un programmeur et je n'ai pas vraiment d'expérience dans la résolution de ce genre de problème. Je connais quelques langages mais qui ne me seront probablement pas utiles pour ce projet (HTML/CSS/R/Markdown...).
Mes questions peuvent être les suivantes: vers quel langage devrais-je me tourner pour esquisser des solutions ? Existe t-il déjà à votre connaissance des solutions concrètes ?
En espérant écrire dans la bonne sous-section du forum et vous remerciant par avance pour le temps que vous pourrez bien m'accorder.
Cordialement,
Nœud Gordien.
Partager