Анализ методов решения

Анализ методов решения. Преобразование формата текстового файла из кодировки СР-866 в формат HTML в кодировке СР-1251 с проверкой и исправлением букв с идентичным написанием на русском и английском языках может осуществляться следующими способами 1 Частично автоматизированным сама перекодировка осуществляется вручную, а компьютер используется для набора и редактирования текстов в стандартных редакторах - пользователь ищет на диске нужные текстовые файлы, формат которых необходимо преобразовать, создаёт их копии, а затем поочерёдно открывает в текстовом редакторе копию каждого найденного файла и расставляет HTML-теги, выделяя в тексте встречающиеся элементы форматирования.

Затем пользователь проверяет написание и исправляет слова, в которых символы кириллицы, схожие по начертанию с латинскими символами, ошибочно заменены на латинские символы, и слова, в которых латинские символы, схожие по начертанию с символами кириллицы, ошибочно заменены на символы кириллицы.

Такую проверку и исправление можно осуществить, открыв файл, уже находящийся в формате HTML, например, в окне редактирования среды программирования Borland C, в котором символы кириллицы выделяются подсветкой, как недопустимые.

Затем пользователь должен осуществить перекодировку полученного файла в формате HTML из кодовой страницы СР-866 в кодовую страницу СР-1251, открыв этот файл в редакторе Лексикон.

Каждый символ кириллицы и символ необходимо будет заменить на такой символ из таблицы ASCII, который в кодировке Windows будет выглядеть также, как исходный символ до его замены.

Замену большинства символов таким образом придётся выполнять при помощи сочетаний управляющих клавиш. Так как на диске может содержаться большое количество текстовых файлов, в тексте каждого из этих файлов содержится много элементов форматирования, а в каждом элементе форматирования содержится большое количество символов, поэтому преобразование формата текстового файла этим способом требует больших затрат времени и усилий. 2 Автоматизированным - в этом случае пользователь задаёт имя каталога, в котором находятся текстовые файлы, и имя каталога, в который нужно поместить создаваемые HTML-файлы.

При этом преобразование формата текстовых файлов в формат HTML, проверку написания и исправление слов, в которых символы кириллицы, схожие по начертанию с латинскими символами, ошибочно заменены на латинские символы, и слов, в которых латинские символы, схожие по начертанию с символами кириллицы, ошибочно заменены на символы кириллицы, а также перевод текста из кодировки СР-866 в кодировку СР-1251 выполняет программа.

Для решения постановленной задачи частично автоматизированный способ не подходит, потому что он требует больших затрат времени и усилий пользователя. Для реализации постановленной задачи подходит автоматизированный метод, но для этого нужно написать программу, работа которой основывается на использовании следующих приёмов 1 Программа выполняет поиск текстовых файлов в кодировке СР-866 в каталоге, указанном пользователем и сохраняет на диске список имён найденных файлов. Затем программа последовательно считывает имя каждого файла из списка и выполняет для него ряд ниже перечисленных действий до тех пор, пока не будет достигнут конец списка 2 Программа создаёт копию align.dat для считанного текстового файла.

В этой копии устраняется возможный отступ текста с левой стороны 3 Программа копирует файл align.dat в файл frame.dat. В файле frame.dat программа размечает таблицы без разметки символами и 4 Файл frame.dat копируется в файл table.dat. В файле table.dat таблицы с разметкой размеченные с помощью символов и и таблицы без разметки размеченные с помощью символов и преобразуются в таблицы в формате HTML 5 Файл table.dat копируется в файл error.dat. В файле error.dat выполняется проверка и исправление слов, в которых символы кириллицы, схожие по начертанию с латинскими символами, ошибочно заменены на латинские символы, и слов, в которых латинские символы, схожие по начертанию с символами кириллицы, ошибочно заменены на символы кириллицы 6 Из файла error.dat программа формирует файл в формате HTML с расширением htm, выделяя из текста элементы форматирования и сохраняя их в виде элементов HTML. Этот htm-файл помещается в каталог, указанный пользователем. 7 После того, как программа создала HTML-файл для каждого файла из списка, создаётся конфигурационный файл style.css для HTML-тегов для созданной группы htm-файлов. 1.3.