Заметки на тему NTFS

Файловая система NTFS может использоваться с операционной системой Windows NT или более поздней. Она обладает некоторыми специальными возможностями, которые также влияют на TreeSize.

В следующих параграфах мы опишем некоторые из этих функций и их влияние на эту программу.

Списки контроля доступа

Доступ пользователей к файлам и папкам может быть ограничен. Можно предоставить или запретить другим пользователям или группам определенные права, такие как чтение, запись, выполнение или удаление. Таким образом можно даже запретить администраторам доступ к файлам и папкам.

Если администратор попытается получить доступ к папке в проводнике Windows, к которой владелец запрещен другим пользователям, будет выведено сообщение об ошибке «Доступ запрещен».

Однако TreeSize может сканировать такие папки, если вы вошли в систему с правами администратора или пользователя, имеющего право на выполнение резервного копирования (этот параметр можно изменить в разделе «Панель управления > Средства администрирования > Локальная политика безопасности» и в редакторе пользователей Windows).

Сжатие на основе файлов

NTFS поддерживает сжатие на основе отдельных файлов. Файлы, сжатые на томе NTFS, могут быть прочитаны и записаны без предварительной декомпрессии другой программой. Распаковка происходит автоматически и прозрачно во время чтения файла. При сохранении файл снова сжимается.

Пространство, занимаемое сжатым файлом, обычно намного меньше его обычного размера. Как следствие, для папок, которые частично или полностью сжаты, выделенное место, о котором сообщает TreeSize, может быть меньше размера, указанного для этой папки.

TreeSize может показывать степень сжатия в дополнительном столбце на вкладке «Подробности». Кроме того, он может показывать сжатые файлы и папки другим цветом. Эти функции можно включить или отключить в диалоге настроек.

TreeSize позволяет сжимать и распаковывать целые ветви файловой системы с помощью контекстного меню.

В Windows 10 Microsoft представила новые прозрачные функции сжатия в NTFS, предназначенные для уплотнения файлов операционной системы, в основном DLL- и EXE-файлов. В отличие от старого сжатия на основе файлов, эти файлы не помечаются как сжатые в атрибутах файлов.

Разреженные файлы

Файлы большого размера, которые используются лишь частично, называются Разреженными файлами.

Поскольку операционная система не выделяет дисковое пространство для неиспользуемых частей разреженного файла, он занимает меньше места на диске, чем его реальный размер.

TreeSize Рассматривает разреженные файлы как сжатые, а также вычисляет степень сжатия для них.

Альтернативные потоки данных (ADS)

В NTFS файл состоит из различных потоков данных. Один поток содержит информацию о безопасности (права доступа и т. п.), другой - «реальные данные», которые вы ожидаете увидеть в файле.

Могут существовать альтернативные потоки данных, в которых данные хранятся так же, как и в стандартном потоке данных. Эти альтернативные потоки данных скрыты. Это означает, что вы можете иметь файл, содержащий 1 байт в официальном основном потоке данных и несколько сотен МБ в одном или нескольких альтернативных потоках данных.

Команда dir, файловые менеджеры или проводник windows покажут 1 байт в качестве размера этого файла, но на самом деле он занимает гораздо больше места на жестком диске.

_images/TreeSize-MainWindow_AlternateDataStreams.png

TreeSize может обнаружить альтернативные потоки данных и добавить их размеры к размеру выделенного файла.

Примечание

ADS могут хранить информацию в том же кластере, что и основной поток данных, поэтому если в файле есть один или несколько ADS, этот файл не обязательно будет занимать больше места на диске.

В диалоговом окне TreeSize Настройки можно выбрать обнаружение альтернативных потоков данных, чтобы получить более точные данные о занято месте в ветвях каталогов.

По умолчанию эта опция отключена, поскольку запрос ADS занимает некоторое время и увеличивает общее время сканирования. Настраиваемый поиск файлов, содержащих альтернативные потоки данных, можно выполнять с помощью функции Настраиваемый поиск файлов TreeSize.

Автоматически удалить дубликаты данных

В Windows Server 2012 и более поздних версиях есть функция дедупликации данных: Удаление дубликатов разделяет файлы с примерно одинаковым контентом на так называемые «куски», которые перемещаются в подпапку «Системный том Informaton\Dedup\ChunkStore\", расположенную на соответствующем разделе NTFS.

После того как Windows применит дедубликацию, исходные данные будут заменены указателем на соответствующий чанк в каталоге ChunkStore. После удаления дубликатов с помощью дедупликации NTFS два одинаковых файла будут занимать лишь половину дискового пространства, которое они занимали раньше.

Поскольку оригинальные файлы теперь содержат только небольшой указатель вместо данных, выделенное дисковое пространство будет отображаться Windows с гораздо меньшим значением, чем раньше (для двух одинаковых файлов занятое дисковое пространство будет отображаться как «0 байт»).

Чтобы TreeSize показывал оригинальные размеры файлов и папок, просто переключите режим просмотра с «Занято место» на «Размер». «Занято место», показанное на TreeSize, - это дисковое пространство, которое вы получите, удалив соответствующий файл.

Автономные файлы

Windows Server и некоторые сторонние инструменты и устройства предлагают функцию, называемую «автономные файлы»: Файлы, которые не использовались в течение длительного времени, будут автоматически перемещены в более дешевое и медленное хранилище, а небольшой файл-заглушка останется на прежнем месте.

Обычно TreeSize корректно сообщает о выделенном месте такого файла-заглушки, которое зачастую составляет лишь размер одного кластера файловой системы.

Однако есть одна ситуация, когда отчёт о выделенном месте для файлов-заглушек может оказаться неверным. Если TreeSize сталкивается с ошибками «Доступ запрещен», он использует функции Windows API, предназначенные для программ резервного копирования, чтобы иметь возможность просканировать эти части файловой системы и предоставить значения их размера и выделенного места.

Мы встречали устройства, которые сообщали полный размер файла в качестве выделенного места в данном случае для файлов-заглушек, скорее всего, потому, что именно такой размер будет занят при резервном копировании.

Чтобы избежать этого, убедитесь, что пользователь, запускающий сканирование, имеет полный доступ на чтение к сканируемой файловой системе.