Comment fonctionne la déduplication ?¶
Le processus de suppression des fichiers redondants et de leur remplacement par des liens durs NTFS avec TreeSize est appelé déduplication. Cela réduira l’espace disque bloqué par vos fichiers en double.
Au lieu de faire en sorte que chacun des fichiers occupe un espace individuel sur votre disque dur, TreeSize supprime tous les fichiers en double et ne conserve qu’un seul d’entre eux.
Les fichiers qui ont été supprimés seront remplacés par des liens durs, qui pointeront ensuite vers les données restantes (voir : Remarques sur NTFS).
Les données sont maintenant partagées par tous les liens durs pour ce fichier, comme le montre l’image ci-dessous.
Ces liens durs peuvent être utilisés comme n’importe quel fichier normal. Vous ne remarquerez aucune différence, sauf que les données sont maintenant partagées entre les autres liens. En fait, ils ne diffèrent pas d’un fichier normal, sauf qu’ils n’occupent pas leur propre espace.
Comprendre les liens durs¶
Un lien en dur est un nom supplémentaire pour un fichier existant. Chaque fichier que vous voyez dans l’Explorateur Windows a déjà un nom - ce nom est lui-même un lien en dur. Lorsque vous créez un deuxième lien dur, vous donnez au même fichier un deuxième nom, qui peut même se trouver dans un autre dossier. En coulisses, le système NTFS conserve un index central de tous les fichiers appelé Master File Table (MFT). Considérez la MFT comme un annuaire téléphonique : chaque lien dur est comme une inscription différente qui compose le même numéro.
Les liens en dur ne sont pas des copies¶
Un lien en dur ne pas crée une copie du fichier. Il n’y a toujours qu’un seul ensemble de données stockées sur le disque. Tous les liens matériels qui pointent vers le même fichier partagent tout : le contenu du fichier, ses horodatages, ses attributs et ses autorisations d’accès. Si vous ouvrez le fichier via l’un de ses liens matériels et que vous y apportez des modifications, vous modifiez les mêmes données - tous les autres liens matériels refléteront immédiatement ces modifications.
Comment fonctionne la déduplication ?¶
NTFS garde la trace du nombre de liens en dur qui pointent vers chaque fichier. La suppression d’un lien dur n’enlève que le nom en question. Elle n’efface pas les données sous-jacentes. Les données réelles du fichier ne sont libérées que lorsque le tout dernier lien dur est supprimé et qu’il ne reste plus aucun nom.
Notifications¶
Note
Les liens durs ne fonctionnent qu’à l’intérieur du même lecteur ou de la même partition. Vous ne pouvez pas créer un lien dur qui s’étend sur deux volumes différents.
Les liens durs ne peuvent pointer que vers fichiers, pas vers des dossiers.
Un seul fichier peut avoir au maximum 1023 liens en dur.
Tous les liens matériels pointant vers le même fichier partagent le même descripteur de sécurité (permissions d’accès). Modifier les permissions d’un lien matériel les modifie pour tous.
Pour créer un lien dur, l’utilisateur doit avoir des permissions d’écriture pour les attributs de fichier sur la branche de dossier respective et sur le partage, si le lecteur n’est pas un lecteur local.
Liens directs, liens symboliques et raccourcis¶
Les liens en dur sont souvent confondus avec les liens symboliques (symlinks) et les raccourcis Windows. Voici en quoi ils diffèrent :
Un lien direct est une référence directe aux données du file. Il est indiscernable du nom de file « original » — les deux sont des entrées égales pointant vers les mêmes données. Les liens physiques subsistent si le nom original est renommé ou déplacé (dans le même volume), car ils ne dépendent pas d’un chemin file .
Un lien symbolique (symlink) est un fichier spécial qui contient un chemin pointant vers un autre fichier ou dossier. Si la cible est déplacée, renommée ou supprimée, le symlink devient cassé (« dangling »). Contrairement aux liens physiques, les symlinks peuvent pointer à travers différents disques et peuvent également pointer vers des dossiers. Les symlinks sont résolus de manière transparente par le système d’exploitation, donc la plupart des applications les traitent comme des fichiers ou dossiers normaux.
Un raccourci Windows (.lnk file) est un file ordinaire que le shell Windows interprète comme un pointeur vers une cible. Les raccourcis ne sont pas résolus au niveau du système file— ils ne fonctionnent que dans l’Explorateur et les applications qui comprennent le format .lnk. Un raccourci a toujours sa propre taille de file (généralement quelques centaines d’octets) et son propre descripteur de sécurité, indépendant de la cible.
Lequel des fichiers en double sera remplacé ?¶
Si vous cochez tous les fichiers d’un groupe de doublons, TreeSize choisira le fichier avec la date « Dernière modification » la plus récente et l’utilisera comme « maître » pour ce groupe. Tous les autres fichiers seront supprimés et remplacés par des liens durs, qui pointeront vers le fichier maître.
Si vous souhaitez sélectionner manuellement un fichier maître, vous pouvez laisser un des fichiers dans un groupe de doublons non coché. Ce fichier ne sera alors pas remplacé, mais utilisé comme maître à la place.
Note
Malheureusement, l’Explorateur Windows ne montre pas la différence de taille pour un fichier dédupliqué, ni pour le dossier dans lequel il se trouve. Lisez notre base de connaissances pour plus d’informations.
Note
Vous ne pouvez pas utiliser de liens durs pour remplacer des fichiers situés sur des disques durs différents.
Note
Tous les liens durs pointant vers le même fichier partagent la même « Description de sécurité » (permissions d’accès). La déduplication appliquera un ensemble unifié de permissions au fichier physique restant.