Информационно-логическая модель предметной области

Одним из способов логического проектирования базы данных является построение информационно-логической модели предметной области (ИЛМ ПО). ИЛМ обеспечивает интегрированное, не зависящее от средств реализации представление данных предметной области и состоит из информационных объектов и структурных связей объектов.

Информационные объекты (ИО) являются описанием сущностей (процессов, событий, предметов и т.п.) и представляют собой логически связанные реквизиты.

Сущность – это реальный объект, процесс, явление или событие, информация о котором должна быть представлена в БД. Сущность – понятие семантическое. Это то, что является источником информации, например, цех, поставка товара, сотрудник, документ или его часть и т.д. На основе ИО проектируются реляционные таблицы. В теории реляционные таблицы называются отношениями.

Структура ИО соответствует, по крайней мере, третьей нормальной форме реляционной модели данных (3НФ). Структурные связи ИО отражают взаимосвязи ИО, определяются на уровне экземпляров объектов.

В процессе информационного анализа производится изучение входной информации задачи, сформулированной в индивидуальном задании курсовой работы.

Главной задачей информационного анализа является представление информации, содержащейся во входных документах, в виде множества взаимосвязанных реляционных таблиц.

Входная информация задачи разделяется на условно-постоянную и оперативную информацию. Она отображается в виде реквизитов в документах, используемых в процессе функционирования объекта предметной области. Перечень необходимых документов, используемых при выполнении курсовой работы, и их описание приведены в каждом индивидуальном задании.

Информационный анализ начинается с определения функциональных зависимостей, т.е. связи (отношения, по-английски relation) реквизитов входных документов между собой. В результате этого анализа выявляются информационные объекты. Функциональные зависимости (ФЗ) определяются на основе семантического (смыслового) анализа предметной области. В курсовой работе информация о предметной области представляется в виде документов, циркулирующих в ней, и ограничений ПО. В результате анализа ПО должен быть выявлен состав форм документов и их реквизитов, подлежащих хранению в базе данных. Для минимизации возможных ошибок целесообразно семантический анализ производить по каждой из форм документов в отдельности. Это связано с тем, что форма документа уже отображает структуру данных, т.к. любой документ содержит логически связанные реквизиты. Как правило, в качестве аргументов ФЗ выступают ключевые реквизиты.

Ключом в документе является подмножество, состоящее из одного или нескольких реквизитов документа, предназначенное для однозначной идентификации документа в целом или группы реквизитов в нем. Ключ документа в целом позволяет выделить документ из множества других документов, а ключ строки документа – строку из множества строк в его табличной части. Очевидно, что ключевым называется реквизит, входящий в состав ключа. Ключ, состоящий из одного реквизита, называется простым, а из нескольких – составным. В ряде случаев ключом может быть несколько подмножеств ключевых реквизитов документа. Такие подмножества называются возможными, потенциальными или альтернативными. Ключ, выбранный из множества альтернативных в качестве ключа ИО, называется выделенным ключом. Совокупность всех ИО одного типа в конкретной ПО образует множество ИО, элементы которого называются экземплярами ИО.

При выборе выделенного ключа из альтернативных следует руководствоваться:

· ограничениями ПО;

· минимизацией объема внешней памяти, занимаемой базой данных;

· использованием ключа в СУБД при решении задач пользователей.

Для выявления ИО необходимо во входных документах выявить первичные ключи. Роль первичных ключей играют реквизиты, однозначно определяющие другие реквизиты документа. Зависимые реквизиты часто называют описательными реквизитами.

В качестве ключевых реквизитов можно использовать код товара, номер документа, номер цеха, номер склада, ИНН покупателя, номер месяца и т.п. Все эти реквизиты являются, по существу, кодами (кодовыми обозначениями) объектов. Применение кодов имеет следующие достоинства:

· коды обеспечивают уникальную (однозначную) идентификацию объектов;

· размер кода в символах, как правило, меньше наименования объекта;

· названия объектов могут меняться, а коды практически постоянны;

· применение классификационного метода кодирования позволяет выделять (группировать) подмножества объектов, обладающих одинаковыми признаками, или упорядочивать объекты в соответствии со значениями признаков.

Если в документах коды отсутствуют, то в силу указанных выше причин следует их добавить в информационные объекты, что позволит использовать коды в качестве первичных ключей для формирования информационных объектов на основе этих документов.

Задача проектировщика на этапе информационного анализа – спроектировать такое множество ИО, которое позволило бы получить множество взаимосвязанных реляционных таблиц, обладающее минимальной избыточностью хранимых в БД данных. Такое множество можно получить, используя нормализованные таблицы.

Связь между реляционными таблицами производится при помощи общих реквизитов, имеющихся в связываемых таблицах. Такие реквизиты в реляционных СУБД называются внешними ключами.

Реляционная таблица может находиться в одной из шести нормальных форм: первой (1НФ), второй (2НФ), третьей (3НФ), в нормальной форме Бойса-Кодда (НФБК), четвертой (4НФ) и пятой (5НФ). Представление таблицы в одной из нормальных форм называется нормализацией отношений. Нормализация отношений, помимо минимизации избыточности хранимых в БД данных, позволяет устранить аномалии (неправильности) данных при их изменении, удалении и добавлении.


Для загрузки данных в реляционную базу данных достаточно, чтобы они были представлены в 1-й нормальной форме (1НФ), к которой предъявляются следующие требования.

1. Все данные должны быть простыми, т.е. не множественными. Это означает, что в одной ячейке таблицы может находиться только одно значение.

2. Все данные в таблице должны иметь один и тот же тип: числовой одного и того же формата, текстовый, дата и т.п.

Практически любой документ может быть представлен в виде реляционной таблицы в 1НФ. Однако в большинстве случаев такая таблица будет сильно избыточна (многократное повторение значений одних и тех же данных). Это помимо проблем чисто технического характера (увеличение затрат внешней памяти и, как следствие, замедление обработки данных) приводит к так называемым аномалиям – трудностям ведения баз данных (изменение, удаление, добавление). Поэтому таблицы нормализуют, т.е. приводят к более старшим формам, как правило, к 3НФ. В некоторых (достаточно редких) случаях возникает необходимость приводить таблицы к старшим формам НФБК, 4НФ, 5НФ.