Suppression de doublons

**Nico_stras** · 02/03/2021, 13h43

Bonjour à tous,

J'ai un disque dur de sauvegarde, sur lequel je cherche à supprimer les doublons.
Par contre, par peur de perdre des informations, je souhaite le faire de façon progressive.

Je cherchais un outil de détection de doublons mais je n'ai pas trouvé d’utilitaire avec les options qui me conviennent

:

1) Supprimer les doublons par inode:
J'ai des sauvegardes récursives, avec plusieurs fichiers ayant le même inode.
Comment supprimer tous ces doublons ?

2) Supprimer les fichiers qui ont le même contenu ET le mème nom ET la même date.

3) Avoir la liste des fichiers qui ont le même contenu, avec leur date et leur nom, pour faire de dernier ménage manuellement.

Merci à vous pour vos conseils

Nicolas

Invité · 02/03/2021, 16h45

Bonjour,

plusieurs fichiers ayant le même inode.

normalement, ce n'est pas possible sur un même système de fichiers.
Et s'ils ne sont pas sur le même système de fichiers, rien ne dit que ce sont les mêmes fichiers.

**Nico_stras** · 02/03/2021, 20h19

Envoyé par N_BaH

normalement, ce n'est pas possible sur un même système de fichiers.

Je me suis mal exprimé.
Mon objectif est de supprimer les "pointeurs" dans arborescence.

J'ai un peu avance

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

find -type f -printf "%i\t%n\t%s\t%A@\t%f\t%A+\t\"%p\"\t%i\n" | sort -n

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
23494491        30      2223    1608750411.0961266100   koi-win 2020-12-23+21:06:51.0961266100  "./n2/nginx/koi-win"    23494491
23494491        30      2223    1608750411.0961266100   koi-win 2020-12-23+21:06:51.0961266100  "./n3/n2/nginx/koi-win" 23494491
23494491        30      2223    1608750411.0961266100   koi-win 2020-12-23+21:06:51.0961266100  "./nginx/koi-win"       23494491
23494492        30      2837    1608750411.2961160330   koi-utf 2020-12-23+21:06:51.2961160330  "./n2/nginx/koi-utf"    23494492
23494492        30      2837    1608750411.2961160330   koi-utf 2020-12-23+21:06:51.2961160330  "./n3/n2/nginx/koi-utf" 23494492
23494492        30      2837    1608750411.2961160330   koi-utf 2020-12-23+21:06:51.2961160330  "./nginx/koi-utf"       23494492
23494507        30      60      1612309671.5057070760   50-mod-http-xslt-filter.conf    2021-02-03+01:47:51.5057070760  "./n2/nginx/modules-enabled/50-mod-http-xslt-filter.conf"       23494507
23494507        30      60      1612309671.5057070760   50-mod-http-xslt-filter.conf    2021-02-03+01:47:51.5057070760  "./n3/n2/nginx/modules-enabled/50-mod-http-xslt-filter.conf"    23494507
23494507        30      60      1612309671.5057070760   50-mod-http-xslt-filter.conf    2021-02-03+01:47:51.5057070760  "./nginx/modules-enabled/50-mod-http-xslt-filter.conf"  23494507
23494508        30      53      1612309671.5057070760   50-mod-http-echo.conf   2021-02-03+01:47:51.5057070760  "./n2/nginx/modules-enabled/50-mod-http-echo.conf"      23494508
23494508        30      53      1612309671.5057070760   50-mod-http-echo.conf   2021-02-03+01:47:51.5057070760  "./n3/n2/nginx/modules-enabled/50-mod-http-echo.conf"   23494508
23494508        30      53      1612309671.5057070760   50-mod-http-echo.conf   2021-02-03+01:47:51.5057070760  "./nginx/modules-enabled/50-mod-http-echo.conf" 23494508

Reste à garder les lignes "doublons" pour pouvoir les supprimer (et non pas le premier de chaque groupe comme avec | uniq -f7 -d) .

Merci

**disedorgue** · 02/03/2021, 20h40

Envoyé par N_BaH

Bonjour,

normalement, ce n'est pas possible sur un même système de fichiers.
Et s'ils ne sont pas sur le même système de fichiers, rien ne dit que ce sont les mêmes fichiers.

Et les lien hard ?

Invité · 02/03/2021, 20h53

je suis trop jeune. je n'y ai pas droit.

**disedorgue** · 02/03/2021, 21h58

Peut-être:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

find . -type f -not -links 1 -printf "%i %p\n" | awk 'Tab[$1] == 1 {print}{Tab[$1]=1}'

Ceci t'affichera tout les fichiers doublons d'inode sauf 1 à chaque fois.
Exemple:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
$ find . -type f -not -links 1 -printf "%i %p\n"
2890846 ./fic_test_ln3
2890846 ./fic_test_ln2
2890846 ./fic_test_ln1
$ find . -type f -not -links 1 -printf "%i %p\n" | awk 'Tab[$1] == 1 {print}{Tab[$1]=1}'
2890846 ./fic_test_ln2
2890846 ./fic_test_ln1