рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Программы-архиваторы

Работа сделанна в 2004 году

Программы-архиваторы - Курсовая Работа, раздел Связь, - 2004 год - Высшая Административная Школа При Администрации С-Пб Курсовая Работа По Дисци...

ВЫСШАЯ АДМИНИСТРАТИВНАЯ ШКОЛА ПРИ АДМИНИСТРАЦИИ С-ПБ Курсовая работа По дисциплине ИНФОРМАТИКА Тема ПРОГРАММЫ-АРХИВАТОРЫ Выполнила студентка 1 курса гр.215 Бунчак В.В. Проверил Воронов А.И. Санкт-Петербург 2004 г. ПЛАН 1. ВВЕДЕНИЕ -2. ИСТОРИЯ РАЗВИТИЯ ТЕОРИИ СЖАТИЯ ИНФОРМАЦИИ -3. ТЕРМИНЫ, ИСПОЛЬЗУЕМЫЕ В АРХИВАЦИИ -4. АРХИВАТОРЫ MS DOS 5. INDOWS 6. АРХИВИРОВАНИЕ И РАЗАРХИВИРОВАНИЕ 7. СРАВНЕНИЕ ВЕРСИЙ АРХИВАТОРОВ MS DOS И Windows. 8. ЗАКЛЮЧЕНИЕ 9. СПИСОК ЛИТЕРАТУРЫ ВВЕДЕНИЕ Эта курсовая работа посвящена программам архиватором. Я выбрала эту тему в связи с тем, что часто пользуюсь Интернетом и сталкиваюсь с информацией заархивированной различными программами архиваторами.

По этому я решила разобраться в том, что из себя представляет такие программы и как ими пользоваться. Существует много различных программ архиваторов и данный курсовой проект посвящен особенностям использования наиболее популярных из них. При эксплуатации компьютера по самым разным причинам возможны порча или потеря информации на магнитных дисках.

Это может произойти из-за физической порчи магнитного диска, неправильной корректировки или случайного уничтожения файлов, разрушения информации компьютерным вирусом и т.д. Для того чтобы уменьшить потери в таких ситуациях, следует иметь архивные копии используемых файлов и систематически обновлять копии изменяемых файлов.

Для копирования файлов можно, разуметься, использовать команды COPY или XCOPY. Но, например, для копирования файлов с жесткого диска емкостью 28 Мбайт необходимо 20 дискет стандартного формата по 1.46 Мбайт. В таком большом количестве дискет даже разобраться довольно трудно, поэтому трудоемкость создания и обновления архива будет весьма значительной. Поэтому для создания архивов употребляются специализированные программы.

Архиваторы - это программы, позволяющие уменьшить размер файла для экономии места на диске. Работа их заключается в следующем найти повторяющиеся фрагменты в файлах и записать вместо них информацию о количестве повторяющихся кусков. Их можно разделить на два класса программы упаковщики архиваторы и программы резервного копирования. Работа их заключается в следующем найти повторяющиеся фрагменты в файлах и записать вместо них информацию о количестве повторяющихся кусков. ИСТОРИЯ РАЗВИТИЯ ТЕОРИИ СЖАТИЯ ИНФОРМАЦИИ История развития MS DOS весьма похожа на историю развития всех информационных технологий.

Более того, концепция MS DOS непосредственно заимствована из операционной системы UNIX. UNIX, в свою очередь, базируется на самых первых операционных системах типа OS360 и даже IBM704. Основные алгоритмы архивации данных вначале были опробованы на UNIX, а затем иногда процесс развития тех или иных алгоритмов осуществлялся параллельно в MS DOS. В принципе, большинство используемых в настоящее время утилит для архивации начали свою жизнь, начиная с MS DOS 0. Итак, в сороковых годах ученые, работающие в области информационных технологий, ясно поняли, что можно разработать такой способ хранения данных, при котором пространство будет расходоваться более экономно.

Клод Шеннон, изучая нюансы различий между семантикой semantics что значит некая сущность и синтаксисом syntax выражается как некая сущность, разработал большинство базовых понятий этой теории. Понимание того, что одно и то же значение семантика может быть реализовано различными способами, синтаксис, приводит к закономерному вопросу Какой способ выражения чего-либо является наиболее экономичным Поиск ответа на этот вопрос привел Шеннона к мысли об энтропии, которая, проще говоря, соотносится с количеством, содержащейся в файле полезной информации.

Методы сжатия пытаются увеличивать энтропию файла, то есть уменьшать длину файла, сохраняя при этом всю информацию.

Однако Шеннон не был первым, кто задумывался о сущности информации и определении ее количества. Первый шаг на этом пути сделал в 1928 г. Хартли. Основной полученный им результат можно сформулировать примерно так если в заданном множестве, содержащем N элементов, выделен некоторый элемент x, о котором известно лишь, что он принадлежит этому множеству, то, чтобы найти x, необходимо получить количество информации, равное log2 N. Эту формулу обычно называют формулой Хартли.

Формула Хартли является частным случаем более общей формулы Шеннона, позволяющей найти количество информации в случайном сообщении фиксированного алфавита. Пусть X1, Xn - символы этого алфавита, P1, Pn - вероятности их появления в тексте сообщения, тогда формула Шеннона принимает вид H P1log2 1 P1 Pnlog2 1 Pn, где H - количество бит информации в одном символе сообщения, или энтропия символа сообщения. Это число показывает минимальное среднее число бит, необходимых для представления одного символа алфавита данного сообщения.

В некоторых случаях алфавит сообщения может быть неизвестен, тогда выдвигаются гипотезы об алфавите сообщения. Имея разные алфавиты, можно достичь разных коэффициентов сжатия. Например, текстовый файл, если его рассматривать как последовательность битов, имеет энтропию порядка 0.7 - 0.9, если как последовательность байтов 0.5 - 0.7, хотя популярные программы сжатия уменьшают размеры текстовых файлов до 0.3 - 0.4 от исходного размера.

Доказательство Шеннона не было конструктивным, т.е. не содержало способа построения этих оптимальных кодов, а лишь показывало их существование. До появления работы Шеннона, кодирование символов алфавита при передаче сообщения по каналам связи осуществлялось одинаковым количеством бит, получаемым по формуле Хартли. С появлением этой работы начали появляться способы, кодирующие символы разным числом бит в зависимости от вероятности появления их в тексте. Например, часто в файлах некоторые значения байта встречаются чаще других.

Таким образом, за счет использования для каждого значения байта кода различной длины можно значительно уменьшить общий размер данных. Эта базовая идея лежит в основе алгоритмов сжатия Шеннона-Фано Shannon-Fano и Хаффмана Huffman. Подобные алгоритмы выбирают более короткие коды для часто встречающихся и более длинные для редко встречающихся значений байта. Обычно текстовые файлы в которых одни значения байтов повторяются гораздо чаще других они сжимают довольно хорошо.

Более тридцати лет алгоритм сжатия Хаффмана и его варианты оставались наиболее популярными методами. Однако в 1977 два исследователя из Израиля предложили совершенно другой подход к этой проблеме. Абрахам Лемпел и Якоб Зив выдвинули идею формирования словаря общих последовательностей данных. При этом сжатие данных осуществляется за счет замены записей соответствующими кодами из словаря. Существуют два алгоритма, в настоящее время известные как LZ77 и LZ78. Они уже не требуют включения словаря данных в архив, так как если вы формируете ваш словарь определенным способом, программа декодирования может его восстанавливать непосредственно из ваших данных. К сожалению, LZ77 и LZ78 тратят много времени на создание эффективного словаря.

В фирме Sperry, Терри Велч Terry Welch расширил алгоритм LZ78, создав новый вариант, широко известный, как LZW. На работу Велча обратила внимание группа программистов Unix и использовала его алгоритм в их приложении LZW, получившем вполне естественное название compress. Они добавили несколько усовершенствований и опубликовали общедоступную версию этой программы в телеконференции Internet, благодаря чему многие пользователи смогли начать с ней работать.

Популярность алгоритма LZW в значительной степени связана с успехом программы compress. Исходный текст последней версии программы, осуществляющей как сжатие, так и декомпрессию, занимает всего 1200 строк. Ядро кода сжатия занимает не более сотни строк, а код декомпрессии не намного больше. Программисты считают, что это облегчает чтение и понимание алгоритма, а также позволяет адаптировать его для самых разных целей.

Алгоритмы LZ-стиля включая LZW, LZ77, LZ78 и многие другие варианты очень популярны везде, где требуется универсальное сжатие. LZW используется в стандарте модема V.42bis, протоколе передачи данных ZModem, форматах GIF, TIFF, ARC и других прикладных программах. Другие алгоритмы LZ используются в дисковых утилитах сжатия типа DoubleSpace и Stacker, графических форматах типа PNG, а также в универсальных утилитах архивирования и сжатия, включая ZIP, GZIP и LHA.Помимо пользующихся большим вниманием алгоритмов, базирующихся на словаре, существуют и другие подходы.

Алгоритм сжатия Хаффмана Huffman, основанный на статистических колебаниях распределения некоторых значений байтов, лег в основу нескольких очень эффективных методов сжатия, известных, как арифметическое кодирование arithmetic coding, энтропийное кодирование entropy coding или Q-кодирование Q-coding.

Арифметическое кодирование улучшает сжатие Хаффмана двумя путями. Первое усовершенствование заключается в том, что оно не требует, чтобы выбранные коды были целым числом бит. В то время как сжатие Хаффмана могло выбирать двух- и четырехбитовые коды, программа арифметического кодирования может использовать код длиной 6,23 бит. Второе усовершенствование которое может также использоваться в сжатии Хаффмана заключается в том, что арифметическое кодирование использует более сложную статистику.

Она не просто следит за частотой появления байта в файле, а оценивает частоту его появления в определенном контексте. Например, при использовании исходного алгоритма сжатия Хаффмана символ u, встречающийся не слишком часто, мог бы получать довольно длинный код. Но в сложной программе арифметического кодирования символ u, следующий за q, будет закодирован очень компактно, так как высока вероятность того, что u следует сразу за q. Комбинация этих двух усовершенствований приводит очень к эффективному сжатию.

Другие методы сжатия предназначены для данных определенного типа, а потому они плохо подходят для архивирования. Многие усовершенствованные методы, появлявшиеся в последнее время, основывались на синтезе этих трех методов например, использование кодов Хаффмана для записей словаря или выполнения сложной предварительной обработки данных, увеличивающей эффективность сжатия одним из этих методов. Возможно, одним из наиболее существенных событий за последние несколько десятилетий в области алгоритмов сжатия стало появление патентов на программное обеспечение. С 1981 United States Patent and Trademark Office USPTO начал принимать заявки на патентование алгоритмов программного обеспечения.

Многие из представленных патентов были по методам сжатия. Наиболее известные из них - патенты фирмы Unisys на алгоритм сжатия LZW и патенты фирмы IBM на арифметическое кодирование. К сожалению, первоначально работа по обработке заявок в USPTO была поставлена неважно.

В результате чего разным людям предоставлялись различные патенты на один и тот же алгоритм причем иногда с почти идентичной формулировкой. Некоторые из этих патентов оспаривались в судебном порядке, но высокая стоимость судебного разбирательства исков резко снижает количество таких претендентов. Один положительный результат введения патентования вряд ли приходится оспаривать. Патентование программного обеспечения спровоцировало появление огромного количества работ по разработке новых алгоритмов сжатия большая часть которых быстро патентуется их изобретателями.

Однако другой эффект был абсолютно отрицательный. Многие из алгоритмов сжатия использовались специфическим образом, например, как часть международных стандартов V.42bis и JPEG. Кроме того, отдельные компании и пользователи скопировали общедоступный код так, реализация compress LZW широко копировалась для самых разных целей. Финансовые штрафы за использование этих алгоритмов в форме авторских отчислений к владельцам патента отвращали от поддержки этих стандартов авторов условно-бесплатного и бесплатного программного обеспечения или бесплатных библиотек.

Некоторые компании публично объявили о том, что они не будут требовать авторских отчислений за использование их запатентованных алгоритмов в бесплатном программном обеспечении. Однако так поступили далеко не все. Пока неясно, как этот конфликт отразится на индустрии бесплатного программного обеспечения и на патентном законодательстве.

По крайней мере, одна организация, League for Programming Freedom, борется с патентами программного обеспечения и предпринимает активные шаги по их отмене. Термины, используемые в архивации. Add file Добавление копирование файла в архив. Если архив не существует, то он создается. CRC Код циклического контроля. Специальная функция от всего содержимого файла. Составляется таким образом, что изменить файл так, чтобы его CRC остался неизменным, практически невозможно.

Exclude selected files При архивации НЕ добавлять в архив определенные файлы. Extract files Извлечение файлов из архива без сохранения структуры подкаталогов. Extract files with pathnames Извлечение файлов из архива с сохранением структуры подкаталогов. Fresh files Добавление в архив новых версий уже имеющихся там файлов. Garble или scramble files with password Архивация файлов с паролем. Извлечь файлы из такого архива можно, лишь правильно указав пароль. Move files Перемещение файлов в архив.

Multiple volumes Многотомные архивы - состоящие из нескольких файлов томов. Удобны при архивации больших комплексов файлов, когда тома архива можно помещать на отдельные дискеты. Ratio Степень сжатия файла. Определяется по-разному в различных архиваторах отношение исходного к сжатому либо наоборот. Recurse subdirectories Архивация файлов из заданного каталога и всех его подкаталогов. В архиве сохраняется информация о пути к файлам, и при извлечении их можно выводить не в один каталог, а в соответствующие подкаталоги.

Self-extract sfxarchive Самораспаковывающийся архив. Архивный файл имеет расширение .exe .или com, и после его запуска происходит автоматическое извлечение файлов из архива. Test integrity Проверка целостности архива, т.е. проверка CRC файлов архива. Update files Добавление в архив новых файлов.

АРХИВАТОРЫ MS DOS

В отличие от таких современных средств архивирования, как RAR и UC2, A... BAT файлов, которые вы могли создать за время пользования ARJем. Другие тесты тоже, вроде, подтверждают, что этот архиватор лучше WinRA... Недостатки невозможность прибавления файлов к существующим архивам. От... Едва ли не единственным ее достоинством является бесплатность, поэтому...

АРХИВИРОВАНИЕ И РАЗАРХИВИРОВАНИЕ

ZIP для программ PKZIPPKUNZIP и. По умолчанию программы PKZIP и ARJ обеспечивают достаточно большую ско... Извлечение файлов из архива Как упоминалось ранее, для извлечения файл... А программа ARJ сама умеет извлекать файлы из своих архивов. В имени архива можно употреблять символы и в этом случае обрабатываетс...

СРАВНЕНИЕ ВЕРСИЙ АРХИВАТОРОВ MS DOS И Windows

СРАВНЕНИЕ ВЕРСИЙ АРХИВАТОРОВ MS DOS И Windows. Грубо говоря, в 1.5 раза быстрее. . 3. Для небольших архивов до 40-100MB это не является существенным.

ЗАКЛЮЧЕНИЕ

ЗАКЛЮЧЕНИЕ В заключении хотелось бы отметить несколько интересных фактов.

Например, таких как при архивации зараженного вирусом файла это не избавляет ни компьютер, ни файл от вируса, а даже способствует его распространению.

И порой бывают случаи, что при успешном удалении вируса из системы, она вновь заражается из-за использования зараженной архивной версии какой либо программы. И конечно нельзя архиватором ZIP разархивировать архивные файлы другой программы-архиватора. При выборе инструмента для работы с упакованными файлами и архивами следует учитывать два фактора эффективность, т. е. оптимальный баланс между экономией дисковой памяти и производительностью работы, и совместимость, т. е. возможность обмена данными с другими пользователями.

Совместимость, пожалуй, сегодня более важна, так как по достигаемой степени сжатия, конкурирующие форматы и инструменты различаются на проценты но не в разы, а вычислительная мощность современных компьютеров делает время обработки архивов не столь существенным показателем, как, скажем, десять лет назад. Поэтому при выборе инструмента для работы с архивами важнейшим критерием для большинства пользователей во всяком случае тех, для кого обмен большими массивами данных насущная проблема, вероятно, является способность программы понимать наиболее распространенные архивные форматы, даже если эти форматы не самые эффективные.

В наш век особо актуально стоит проблема архивации данных, потому как, компьютер является, неотъемлемой частью любого предприятия, а на многих предприятиях обрабатываются огромные базы данных и если их копировать не в сжатом виде, то они занимали бы целые склады дискет, даже учитывая что, существуют носители больших объемов информации CD ROM-650 Мбайт. В настоящее время появилось много модификаций архиваторов, таких как Winrar, Winzip и.т.д которые работают в среде Windows, имеют лучший интерфейс и больше функций, чем их DOS отцы, у них выше степень защиты данных.

СПИСОК ЛИТЕРАТУРЫ 1. Фигурнов В.Э. IBM PC для пользователя. Краткий курс - М. ИНФРА-М, 1998. 2. PCMagazine, 1997-1999 гг. 3. IBM PC для пользователя Фигурнов В.Э Москва ИНФРА-М 1995г.

– Конец работы –

Используемые теги: Программы-архиваторы0.041

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Программы-архиваторы

Что будем делать с полученным материалом:

Если этот материал оказался полезным для Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Еще рефераты, курсовые, дипломные работы на эту тему:

0.025
Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • По категориям
  • По работам