Salut,
J'ai pour but de développer un logiciel Java qui me trouverait tous les doublons d'un Système de fichier ou d'un répertoire ( on rentrerait le répertoire racine de la recherche en ligne de commande...)...
Me facteurs de qualité qui m'intéresse étant la rapidité de l'execution, car parcourir déja toute la hierarchie d'un disque dur c'est déjà assez long ...
Comment peux t'on comparer deux fichiers ? :
- méthode de hashage ?
- methode hash() sur l'objet File ?
- checksum ?
- comparaison du nom fichier concaténé a la taille ? (exemple : test.gif-3457)...
La derniere solution dans un premier temps est suffisante, car il y a peu de chance que l'on est des fichiers de même nom et de même taille qui soient identique ...
Bref je cherche dans un premier temps, une méthode rapide, qui pourrait ne pas être exacte...
C'est à dire qui puisse traiter un grand nombre de fichier dans une grande hierarchie rapidement et me donne à la fin une liste des fichiers susceptiblement identique...
Dans un deuxième temps, une méthode peut être plus lente mais vraiment carré, basé sur le checksum ou autre chose, qui ne nécessiterait pas de vérification manuelle pour vérifier si les fichiers sont vraiment identiques ...
3eme point : trouvér deux fichiers identiques, ayant un contenu identique, mais pas le même nom ?
Pour finir, la methode length() de File sur un directory, je crois me rends une taille multiple de 4096...
ET je cherche la taille du fichier réelle et non celle qu'elle prends sur le disque ...
Y a t'il une methode ou des apis qui font cela ?
Merci à vous, pour vos idées conseils et idées!
Partager