Recherche de doublons

<< Click to Display Table of Contents >>

Recherche de doublons

Recherche les fichiers en double sur les lecteurs ou les partages sélectionnés.
Dans ce contexte, les fichiers en double sont des fichiers qui semblent exister plus d'une fois. Ces fichiers redondants augmentent inutilement l'espace alloué à vos disques.

Un exemple détaillé, étape par étape, de l'utilisation de la recherche de doublons est disponible ici.

TreeSize-FileSearch_DuplicateFiles

 

Onglet Contexte : Recherche de doublons

 

Mode de recherche :

Sélectionnez l'un des trois modes de recherche de doublons. Vous pouvez rechercher des fichiers en double, des dossiers en double ou des fichiers qui n'ont pas de doublons.

Fichiers en double

Recherche les fichiers qui sont des doublons les uns des autres, en utilisant la méthode de comparaison sélectionnée.

Dossiers en double

Recherche les dossiers qui sont des doubles l'un de l'autre. Deux dossiers sont considérés comme des doublons s'ils contiennent le même nombre de sous-dossiers et de fichiers. Ces sous-dossiers et fichiers doivent également être équivalents l'un à l'autre, selon la méthode de comparaison sélectionnée.

Fichiers uniques

Ce paramètre permet de rechercher les fichiers qui n' ont pas de doublons dans les chemins de recherche sélectionnés.

 

Méthode de comparaison :

Définit les critères à utiliser pour identifier les fichiers en double. Voici une liste des stratégies disponibles :

Contenu du fichier

Cette option utilise par défaut les sommes de contrôle MD5 pour la comparaison.

Lors de l'utilisation de cette méthode, une valeur de hachage est calculée sur la base du contenu de chaque fichier. Les fichiers ayant le même contenu auront la même valeur de hachage, tandis que les fichiers ayant un contenu différent auront presque certainement des valeurs différentes. Les fichiers vides sont ignorés, car il n'y a pas de contenu à comparer.

Cette méthode est plus précise que la comparaison des fichiers en fonction de leur nom, de leur taille et de leur date, mais elle est aussi beaucoup plus lente.

 

Dans les options de recherche de fichiers, il est possible d'ajuster cette méthode pour utiliser des hachages SHA256 à la place. L'algorithme SHA256 réduit davantage le risque statistique de collisions de hachage par rapport à l'algorithme MD5, mais il est également beaucoup plus lent. Cette option n'est visible qu'en mode expert.

Taille, nom et date

Sélectionnez cette option pour identifier les fichiers en double en recherchant des noms, des tailles et des dates de dernière modification identiques.

Cette méthode est beaucoup plus rapide que l'utilisation de sommes de contrôle pour indiquer les doublons, mais elle est également moins précise.

Nom et taille

Sélectionnez cette option pour identifier les fichiers en double en recherchant des noms et des tailles identiques.

C'est la même chose que pour le tout premier critère de comparaison, mais sans tenir compte de l'horodatage de la "dernière modification" des fichiers.
Cette option est utile dans le cas où les fichiers ont été déplacés d'un emplacement à un autre, ce qui pourrait modifier l'horodatage.

Nom

Sélectionnez cette option pour trouver tous les fichiers dont les noms sont identiques.

Ce type de comparaison peut s'avérer utile lorsque vous recherchez des copies indésirables (par exemple, des documents qui ont été copiés et modifiés localement).

Nom sans extension

Sélectionnez cette option pour détecter les fichiers dont les noms sont identiques, sans tenir compte de l'extension du fichier.

Cela peut être intéressant si vous recherchez des fichiers de sauvegarde dupliqués ou, par exemple, des fichiers de données en ligne et des fichiers image ou vidéo compacts ("MyPhoto.bmp" - "MyPhoto.png").

Taille et date

Compare les fichiers en fonction de leur taille et de leur date. Cela permet une recherche plus rapide, mais donc moins précise, des fichiers en double portant des noms différents. Les copies accidentelles portant des noms tels que "Copie de ..." peuvent être identifiées rapidement à l'aide de cette méthode.

Taille uniquement

Sélectionnez cette option pour rechercher tous les fichiers de même taille.

 

Filtres de recherche :

Options supplémentaires pour personnaliser la recherche de fichiers en double :

Filtre d'exclusion

Permet d'activer, de désactiver ou de personnaliser les filtres d'exclusion globaux pour cette recherche.

En limitant la recherche de doublons à une présélection spécifique de fichiers, vous pouvez éviter de répertorier les fichiers de certains répertoires (par exemple, les répertoires de votre système local) en tant que doublons. En outre, cette option réduit le nombre de fichiers à comparer, ce qui accélère la recherche.

Ignorer les liens durs NTFS

Si cette option est activée, les hardlinks ne sont pas considérés comme des doublons de fichiers. Remarque : les liens durs NTFS n'allouent pas de mémoire. Par conséquent, leur suppression ne libère pas de mémoire supplémentaire. De plus, TreeSize utilise les liens durs pour la déduplication.

Dédupliquer :

Utilisez le bouton "Opérations > dédupliquer" pour remplacer tous les fichiers en double vérifiés, sauf un, par des liens durs NTFS. Vous trouverez plus de détails sur la déduplication des fichiers dans ce chapitre.

Dans la fenêtre de configuration, vous pouvez sélectionner un fichier journal dans lequel enregistrer les remplacements effectués. Vous pouvez également définir la manière dont TreeSize traitera les fichiers situés sur différents disques durs. Vous pouvez soit remplacer séparément les fichiers situés sur le même disque dur par des liens symboliques, soit simplement sélectionner un lecteur de référence et remplacer tous les fichiers situés sur d'autres disques durs par des liens symboliques. Veuillez noter que si l'autorisation de créer des liens symboliques ne peut être accordée, un raccourci Windows (fichier .LNK) sera créé à la place comme solution de rechange.

Le menu contextuel de la liste des fichiers en double offre une fonction appelée "Remplacer les doublons par des liens symboliques". Cette fonction fonctionne comme la fonction "Dédupliquer", mais elle traite tous les fichiers sélectionnés au lieu des fichiers cochés.

TreeSize-FileSearch_Duplicates_Deduplicate