Модели данных

 

В экономике существуют объекты, предметы, информацию о которых необходимо хранить, и эти объекты связаны между собой самыми разными способами. Чтобы область хранения данных рассматривалась в качестве базы данных, в ней должны содержаться не только данные, но и сведения о взаимоотношениях между этими данными.

База данных (БД) — это поименованный набор организованных дан­ных, отражающий состояние объектов и их отношений в рассматриваемой предметной области.

Система управления базой данных (СУБД) позволяет получить доступ к данным, обеспечивает корректировку, пополнение, сохранение БД.

 

 

Различают логический и физический уровни организации данных. Физический уровень отражает организацию хранения БД на машинных носи­телях, а логический уровень — внешнее представление данных пользователю.

Логическая организация данных па машинном носителе зависит от используемых программных средств организации и ведения данных. Метод логической организации данных определяется используемыми типом структур данных и видом модели., которая поддерживается программным средством.

Модель данных — это совокупность взаимосвязанных структур данных и операций над этими структурами. Вид модели и используемые в ней типы структур данных отражают концепцию организации и обработки данных, используемую в СУБД, поддерживающей модель, или в языке системы программирования, на котором создается прикладная программа обработки данных.

Важно отметить, что для размещения одной и той же информации во внутримашинной сфере могут быть использованы различные структуры и модели данных. Их вы6op возлагается на пользователя, создающего ин­формационную базу, и зависит от многих факторов, в том числе от имею­щегося технического и программного обеспечения, определяется сложно­стью автоматизируемых задач и объемом информации.

По способу организации БД разделяют на базы с плоскими файлами, иерархические, сетевые, реляционные, объектно-реляционные и объектно-ориентированные базы данных.

Файловая модель. На ранней стадии использования информационных систем в экономике применялась файловая модель данных. В файловых системах реализуется модель типа плоский файл.

Плоский файл — это файл, состоящий из записей одного типа и не со­держащий указателей на другие записи, двумерный массив элементов данных. Файлы, которые создаются в прикладных программах пользователя, написанных на алгоритмическом языке, также относятся к этому виду ор­ганизации данных. Описание логической структуры файлов и параметры размещения на машинных носителях содержатся в каждой прикладной программе обработки файлов. В этих же программах предусмотрено их создание и корректировка. При файловой организации массивов трудно обеспечить актуальное состояние данных, их достоверность и непротиво­речивость.

Сетевые и иерархические модели.Более сложными моделями данных по сравнению с файловой являются сетевые и иерархические модели, ко­торые поддерживаются в системе управления базами данных соответствующего типа. Тип модели данных, поддерживаемой СУБД на машинном носителе, является одним из важнейших признаков классификации СУБД.

Сетевая или иерархическая модель данных представляет соответствующий метод логической организации базы данных в СУБД.

Иерархическая модель представляет собой древовидную структуру с корневыми сегментами, имеющими физический указатель на другие сегменты. Одно из неудобств этой модели заключается в том, что реальный мир не может быть представлен в виде древовидной структуры с единственным корневым сегментом. Иерархические БД обеспечивали указатели между различными деревьями баз данных, но обработка данных с использованием таких связей была не всегда удобной.

В иерархических моделях непосредственный доступ, как правило, воз­можен только к объекту самого высокого уровня, который не подчинен другим объектам. К другим объектам доступ осуществляется по связям от объекта на вершине модели. В сетевых моделях непосредственный доступ может обеспечиваться к любому объекту независимо от уровня, на кото­ром oн находится в модели. Возможен также доступ по связям от любой точки доступа.

В отличие от иерархической БД в сетевой БД нет необходимости в корневой записи. Однако, как и в иерархических БД, связи поддерживаются с помощью физических указателей.

Сетевые модели данных по сравнению с иерархическими являются бо­лее универсальным средством отображения структуры информации для разных предметных областей. Взаимосвязи данных большинства пред­метных областей имеют сетевой характер, что ограничивает использование СУБД с иерархической моделью данных. Сетевые модели позволяют ото­бражать также иерархические взаимосвязи данных. Достоинством сетевых моделей является отсутствие дублирования данных в различных элементах модели. Кроме того, технология работы с сетевыми моделями является удобной для пользователя, так как доступ к данным практически не имеет ограничений и возможен непосредственно к объекту любого уровня. До­пустимы всевозможные запросы.

Реляционная модель данных. Концепция реляционной модели баз данных была предложена Э.Ф. Коддом в 1970 г. Как отмечал доктор Кодд, реляционная модель данных обеспечивает ряд возможностей, которые де­лают управление и использование базы данных относительно легким, предсказуемым и устойчивым по отношению к ошибкам. Наиболее важные характеристики реляционной модели заключены в следующем:

- Модель описывает данные с их естественной структурой, не добавляя каких-либо дополнительных структур, необходимых для машинного представления или для целей реализации.

- Модель обеспечивает математическую основу для интерпретации выводимости, избыточности и непротиворечивости отношений.

- Модель обеспечивает независимость данных от их физическо­го представления, от связей между данными и от соображений реализации, связанных с эффективностью и подобными проблемами.

Реляционные модели данных отличаются от рассмотренных выше се­тевых и иерархических простотой структур данных, удобным для пользо­вателя табличным представлением и доступом к данным. Реляционная мо­дель данных является совокупностью простейших двумерных таблиц-отношений (объектов модели). Связи между двумя логически связанными таблицами в реляционной модели устанавливаются по равенству значений одинаковых атрибутов таблиц-отношений.

Таблица-отношение является универсальным объектом реляционных моделей. Это обеспечивает возможность унификации обработки данных в различных СУБД, поддерживающих реляционную модель. Операции обработки реляционных моделей основаны на использовании универсально­го аппарата алгебры отношений и реляционного исчисления.

Структуры данных реляционной модели.Таблица является основным типом структуры данных (объектом) реляционной модели. Структура таб­лицы определяется совокупностью столбцов. Данные в пределах одного столбца однородны. В таблице не может быть двух одинаковых строк. Общее число строк не ограничено.

Столбец соответствует некоторому элементу данных — атрибуту, ко­торый является простейшей структурой данных. В таблице не могут быть определены множественные элементы, группа или повторяющаяся группа, как в рассмотренных выше сетевых и иерархических моделях. Каждый столбец таблицы должен иметь имя соответствующего элемента данных (атрибута). Один или несколько атрибутов, значения которых однозначно идентифицируют строку таблицы, являются ключом таблицы.

В реляционном подходе к построению баз данных используется тер­минология теории отношений. Простейшая двумерная таблица определя­ется как отношение. Столбец таблицы со значениями соответствующего атрибута называется доменом, а строки со значениями разных атрибутов — кортежем.

Совокупность нормализованных отношений (реляционных таблиц), логически взаимосвязанных и отражающих некоторую предметную область, образует реляционною базу данных (РБД). В ходе разработки БД должен быть определен состав логически взаимосвязанных реляционных таблиц и определен состав aтрибутов каждого отношения. Состав атрибутов должен отвечать требованиям нормализации.

 

Реляционная модель данных зарекомендовала себя как модель, на ос­нове которой могут разрабатываться реальные жизнеспособные приложе­ния. В настоящее время эта модель данных является наиболее популярной.

Объектно-ориентированная модель данных. Реляционная модель данных оказалась эффективной не для всех приложений. Главными среди типов приложений, для которых трудно использовать реляционные базы данных, являются автоматизированное проектирование (Computer Aided design, CAD) и автоматизированная разработка программного обеспечения (Computer Aided Software Engineering, CASE). Разработчики коммерческих продуктов в таких областях, в которых для управления хранением данных используется реляционная СУБД, должны пойти на некоторые изменения данных для того, чтобы подогнать их к структуре строк и столбцов. Как показывает практика, в таких областях, как CAD и CASE более подходит объектно-ориентированная модель данных. В объектно-ориентированных базах данных (ООБД) важнейшее место отводится объектам, на основе ко­торых могут определяться другие объекты благодаря использованию концепции, называемой наследованием. При этом некоторые или все атрибуты (либо свойства) определяющего объекта наследуются каким-то другим объектом, одни атрибуты и свойства добавляются, а другие могут удаляться.