Теоретические положения использования архиваторов

 

Программы архивации являются обязательным инструментом в работе с компьютером. Хранение и передача данных немыслимы без их использования.

Основным преимуществом архиваторов является значительное уменьшение требуемого для хранения информации места на диске. В некоторых случаях экономия дискового пространства может достигать 90%. Это достигается путем использования специальных алгоритмов сжатия данных. Как следствие уменьшается количество сетевого трафика, необходимого для передачи заархивированных файлов. Как правило, программы архивации предоставляют возможность настраивать алгоритм сжатия, выбирая компромисс между степенью сжатия и скоростью архивации. Чем сильнее сжатие, тем медленнее происходит процесс архивации.

Жесткие диски хранят данные секторами по 512 байт, файловая система хранит данные «кусочками» – кластерами размером от 512 байт и до 64 Кбайт (размер всегда кратен 512 байтам). Чем больше размер кластера – тем больше производительность файловой системы, но возрастают и потери места на диске.

Потеря происходит из-за того, что маленькие файлы в любом случае занимают не менее 1 кластера. Например, файл в 2 Кбайта при размере кластера в 32 Кбайта приведет к потере 30 Кбайт места на диске. [1]

Файловый архив может содержать сколько угодно много различных файлов. Если маленькие файлы помещают в архив, эти потери от округления занимаемого файлом места на диске до кластера исчезают.

Кроме того, архиваторы предоставляют средства проверки целостности архива. Благодаря этому всегда можно удостовериться, не нарушен ли архив при хранении или передаче по сети.

Архив может быть самораспаковывающимся. Самораспаковывающийся (SFX, от англ. SelF-eXtracting) архив – это архив, к которому присоединен исполняемый модуль. Этот модуль позволяет извлекать файлы простым запуском архива как обычной программы. Таким образом, для извлечения содержимого SFX-архива не требуется дополнительных внешних программ. SFX-архивы, как и любые другие исполняемые файлы, обычно имеют расширение .EXE.

SFX-архивы удобны в тех случаях, когда нужно передать кому-то архив, но вы не уверены, что у адресата есть соответствующий архиватор для его распаковки. Возможно также использовать SFX-архивы для распространения своих собственных программ. [3]

Архив может быть многотомным – состоять из нескольких файлов (томов), размер которых не превышает заданного количества байт (например емкости дискеты). Для того чтобы работать с таким архивом, нужно открыть в архиваторе первый файл многотомного архива, и программа-архиватор будет обращаться к другим томам по мере необходимости.

Непрерывный архив – это архив RAR, упакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных. Непрерывная архивация поддерживается только в формате RAR, для формата ZIP такого типа архива не существует.

Непрерывная архивация значительно увеличивает степень сжатия, особенно при добавлении в архив значительного количества небольших файлов с похожим содержимым. Однако следует иметь в виду, что у непрерывной архивации есть и некоторые недостатки:

· обновление непрерывных архивов (т.е. добавление файлов в уже существующий архив или их удаление) происходит медленнее, чем обычных;

· чтобы извлечь один файл из непрерывного архива, приходится анализировать все предыдущие заархивированные файлы, поэтому извлечение отдельных файлов из середины непрерывного архива происходит медленнее, чем извлечение из обычного архива. Однако если из непрерывного архива извлекаются все или несколько первых файлов, то в этом случае скорость распаковки практически равна скорости распаковки обычного архива;

· если в непрерывном архиве какой-либо файл окажется поврежденным, то не удастся извлечь и все файлы, следующие после него. Поэтому при сохранении непрерывного архива на ненадежном носителе (например, на дискете) рекомендуется добавлять информацию для восстановления.

Непрерывные архивы предпочтительнее использовать в тех случаях, когда:

· архив предполагается редко обновлять;

· планируется чаще распаковывать весь архив, нежели извлекать из него один или несколько файлов;

· нужно достичь более плотной степени сжатия, даже в ущерб скорости упаковки.

Многотомные и самораспаковывающиеся архивы также могут быть непрерывными. [3]

Еще одной важной функцией архивирования является возможность защиты паролем помещенных в архив файлов. Если архив защищен паролем, то извлечь из него файлы можно только указав пароль, использованный при создании архива. Современные архивы обладают высокой криптостойкостью, но это не дает 100% гарантий, если используются слабые пароли. Необходимо использовать длинные не распространенные пароли. Журнал «Хакер» по поводу паролей пишет: «И самое главное, не забывайте их, а то вам никто не поможет. Предположим, что ваш пароль состоит из 5 символов и каждым символ может быть английской заглавной или строчной буквой, или цифрой. Тогда каждый символ может быть любым из 64. Следовательно, количество всех возможных комбинаций равно 64 в степени 5, то есть 1073741824. Программа FCrackZip имеет скорость перебора 400000 паролей в секунду. Значит, все пароли из нашего примера можно перебрать с ее помощью приблизительно за 45 минут. А если пароль состоит из 6 символов, то все комбинации можно перебрать за 47 часов. Страшно даже подумать сколько займет перебор пароля из 15 символов. А если при этом еще увеличить количество возможных значений, например, до 255, то вообще сложно вообразить себе цифру, выражающую количество лет нужных для перебора. Выбирайте пароли как можно длиннее и как можно не логичней. И не забывайте их!» [2]