ЛЕКЦИЯ 1 Основные понятия

ЛЕКЦИЯ 1

Основные понятия

Банк данных(БнД) - это система

· специально организованных данных;

· программных, языковых, организационных и технических средств, предназначенных для централизованного накопления и коллективного многоцелевого использования данных.

База данных. Ядром БнД является база данных (БД). Базой данных называется поименованная структурированная совокупность взаимосвязанных данных, относящихся к конкретной предметной области и находящихся под централизованным программным управлением [1].

Система управления базами данных (СУБД) - это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.

В базу данных не входят файлы входной и выходной информации, архивные файлы, вводимые запросы, временные файлы.

В технической документации некоторых систем управления базами данных в состав БД включаются не только данные, относящиеся к предметной области, но и описания базы данных. Более правильно описания базы данных считать самостоятельными компонентами БнД, которые вместе с хранимой информацией об объекте представляют информационную модель предметной области.

Языковые средства банка данных.Языковые средства предназначены для общения пользователей разных классов с БнД.

Языковые средства служат для описания различных компонентов банка данных, а иногда - и внешних по отношению к банку элементов, находящихся с ним в непосредственном взаимодействии, а также для обращения к нужным частям БнД (рис. 1).

Рис. 1. Классификация языковых средств БнД

Языки описания данных (ЯОД) классифицируются в зависимости от своего назначения.

Описание состава и логической организации БД на языке описания данных называется схемой, а соответствующий язык - языком описания данных схем. Описание части БД, представляющей интерес для определенного пользователя (приложения), называется подсхемой. Для описания подсхемы предназначен соответствующий язык. Среда хранения базы данных и соответствующее отображение схемы в память описываются на языке описания хранимых данных (ЯОХД). Иногда этот язык называют языком описания схемы хранения.

Кроме языковых средств, предназначенных для описания БД, и состав некоторых банков данных входят специальные языковые средства для описания внешних по отношению к БнД информационных совокупностей. Сюда относятся языки описания входной информации, языки описания выходных сообщений.

Центральное место среди языковых средств БнД занимают языки общения с базой данных. В зависимости от особенностей конкретного банка данных языковые средства, их синтаксические и семантические свойства, способы реализации, круг лиц, на которых они ориентированы, могут изменяться в широком диапазоне: от языков программирования до языков, ориентированных на конечного пользователя.

Системы управления базами данных, требующие написания прикладных программ на универсальных языках программирования, включают в свой состав язык манипулирования данными (ЯМД), которым программист пользуется для организации передачи данных между его процессом и базой данных. ЯМД не является полным языком. Он опирается на включающий язык (базовый язык программирования). ЯМД - это средство, позволяющее обращаться к базе данных из программ, написанных на процедурных языках программирования. Употребление языка манипулирования, включенного в базовый язык программирования, сужает круг лиц, которые могут непосредственно общаться с БД, поэтому пользователям большинство систем предоставляют языки запросов. С их помощью к банку данных могут обращаться специалисты-непрограммисты.

Банки данных обеспечивают различные режимы работы с информационной системой. При общении с базой данных широко используется режим диалога, для поддержания которого предназначены языки ведения диалога. Кроме указанных выше языков, в БнД используются и другие языковые средства, такие, как языки описания транзакций, описания пользователей, языки управления распределением ресурсов и выполнением работ и др. Особым языком можно считать управляющие операторы утилит системы.

В последнее время наблюдается совмещение языковых средств различного назначения в единый язык, в котором каждый из вышеназванных языков представлен одним или несколькими операторами.

Характерной чертой баз данных является постоянство, данные постоянно накапливаются и используются; состав и структура данных, необходимых для решения тех или иных прикладных задач, обычно постоянны и стабильны во времени; отдельные или даже все элементы данных могут меняться - но и это есть проявление постоянства - постоянная актуальность.

Информационная база

Информационная база состоит из двух компонент: 1. коллекции записей собственно данных;

Структуры данных

Абстрактное понятие структуры ближе всего к так называемой концептуальной модели предметной области. Это понятие используется на всех уровнях отображения предметной области и… 1. структура информации - схематичная форма представления сложных композиционных объектов и связей реальной…

Линейные структуры

Порядок следования (и, соответственно, выборки) элементов таких структур имеет линейный характер и соответствует порядку расположения элементов в… Особенностью линейной структуры является то, что при последовательной… Массив представляет собой совокупность однотипных элементов, причем число элементов массива известно до его…

Нелинейные структуры

1. списки; 2. деревья; 3. сети.

Сетевые структуры

В результате получаются обычно более сложные структуры по сравнению с древовидными. Например, генеалогическое дерево может быть представлено в виде… В сетевой структуре любой элемент может быть связан с любым другим… Рис. 5. Примеры сетевых структур

Часть 2. Реляционная модель данных

Основные понятия реляционной модели данных

Реляционная модель является удобной и наиболее привычной формой представления данных в виде таблицы.

В отличие от иерархической и сетевой моделей, такой способ представления:

1. понятен пользователю-непрограммисту;

2. позволяет легко изменять схему - присоединять новые элементы данных и записи без изменения соответствующих подсхем;

3. обеспечивает необходимую гибкость при обработке непредвиденных запросов. К тому же любая сетевая или иерархическая схема может быть представлена двумерными отношениями.

Одним из основных преимуществ реляционной модели является ее однородность. Все данные рассматриваются как хранимые в таблицах, в которых каждая строка имеет один и тот же формат. Каждая строка в таблице представляет некоторый объект реального мира или соотношение между объектами.

Пользователь модели сам должен для себя решить вопрос, обладают ли соответствующие сущности реального мира однородностью. Этим самым решается проблема пригодности модели для предполагаемого применения.

Основными понятиями, с помощью которых определяется реляционная модель, являются следующие:

1. домен,

2. отношение,

3. кортеж,

4. кардинальность,

5. атрибуты,

6. степень,

7. первичный ключ.

Соотношение этих понятий иллюстрируется рисунок 7.

Рис. 7. Основные понятия реляционной модели

Таблица 7.

Эти понятия представляют специальную терминологию, введенную авторами теоретических основ, однако они имеют и более привычные аналоги (но не во всем эквиваленты), соответствие которых приведено в следующей таблице 1.

Домен - это совокупность значений, из которой берутся значения соответствующих атрибутов определенного отношения. С точки зрения программирования, домен - это тип данных, определяемый системой (стандартный) или пользователем и совокупность дополнительных ограничений, накладываемых на эти данные.

В математических дисциплинах понятию «таблица» соответствует понятие «отношение» (relation). Отсюда и произошло название модели - реляционная. То есть, применительно к базам данных понятия «реляционная БД» и «табличная БД» по существу являются синонимами.

Первичный ключ - это столбец или некоторое подмножество столбцов, которые уникально, т. е. единственным образом определяют строки. Первичный ключ, который включает более одного столбца, называется множественным, или комбинированным, или составным. Правило целостности объектов утверждает, что первичный ключ не может быть полностью или частично пустым, т. е. иметь значениеnull.

Остальные ключи, которые можно также использовать в качестве первичных, называются потенциальными или альтернативными ключами.

Внешний ключ - это столбец или подмножество одной таблицы, который может служить в качестве первичного ключа для другой таблицы. Внешний ключ таблицы является ссылкой на первичный ключ другой таблицы. Правило ссылочной целостности гласит, что внешний ключ может быть либо пустым, либо соответствовать значению первичного ключа, на который он ссылается. Внешние ключи являются неотъемлемой частью реляционной модели, поскольку реализуют связи между таблицами базы данных.

Внешний ключ, как и первичный ключ, тоже может представлять собой комбинацию столбцов. На практике внешний ключ всегда будет составным (состоящим из нескольких столбцов), если он ссылается на составной первичный ключ в другой таблице. Очевидно, что количество столбцов и их типы данных в первичном и внешнем ключах совпадают.

Если таблица связана с несколькими другими таблицами, она может иметь несколько внешних ключей.

Модель предъявляет к таблицам следующие требования:

1. данные в ячейках таблицы должны быть структурно неделимыми¹;

2. данные в одном столбце должны быть одного типа;

3. каждый столбец должен быть уникальным (недопустимо дублирование столбцов);

4. столбцы размещаются в произвольном порядке;

5. строки размещаются в таблице также в произвольном порядке;

6. столбцы имеют уникальные наименования.

В целом концепция реляционной модели определяется следующими двенадцатью правилами Кодда (в лекции правила приводятся по [1]).

1. Правило информации. Вся информация в базе данных должна быть предоставлена исключительно на логическом уровне и только одним способом - в виде значений, содержащихся в таблицах.

2. Правило гарантированного доступа. Логический доступ ко всем и каждому элементу данных (атомарному значению) в реляционной базе данных должен обеспечиваться путем использования комбинации имени таблицы, первичного ключа и имени столбца.

3. Правило поддержки недействительных значений. В реляционной базе данных должна быть реализована поддержка недействительных значений, которые отличаются от строки символов нулевой длины, строки пробельных символов, от нуля или любого другого числа и используются для представления отсутствующих данных независимо от типа этих данных.

4. Правило динамического каталога, основанного на реляционной модели. Описание базы данных на логическом уровне должно быть представлено в том же виде, что и основные данные, чтобы пользователи, обладающие соответствующими правами, могли работать с ним с помощью того же реляционного языка, который они применяют для работы с основными данными.

5. Правило исчерпывающего подъязыка данных. Реляционная система может поддерживать различные языки и режимы взаимодействия с пользователем (например, режим вопросов и ответов). Однако должен существовать, по крайней мере, один язык, операторы которого можно представить в виде строк символов в соответствии с некоторым четко определенным синтаксисом и который в полной мере поддерживает следующие элементы:

• определение данных;

• определение представлений;

• обработку данных (интерактивную и программную);

• условия целостности;

• идентификацию прав доступа;

• границы транзакций (начало, завершение и отмена).

6. Правило обновления представлений. Все представления, которые теоретически можно обновить, должны быть доступны для обновления.

7. Правило добавления, обновления и удаления. Возможность работать с отношением как с одним операндом должна существовать не только при чтении данных, но и при добавлении, обновлении и удалении данных.

8. Правило независимости физических данных. Прикладные программы и утилиты для работы с данными должны на логическом уровне оставаться нетронутыми при любых изменениях способов хранения данных или методов доступа к ним.

9. Правило независимости логических данных. Прикладные программы и утилиты для работы с данными должны на логическом уровне оставаться нетронутыми при внесении в базовые таблицы любых изменений, которые теоретически позволяют сохранить нетронутыми содержащиеся в этих таблицах данные.

10. Правило независимости условий целостности. Должна существовать возможность определять условия целостности, специфические для конкретной реляционной базы данных, на подъязыке реляционной базы данных и хранить их в каталоге, а не в прикладной программе.

11. Правило независимости распространения. Реляционная СУБД не должна зависеть от потребностей конкретного клиента.

12. Правило единственности. Если в реляционной системе есть низкоуровневый язык (обрабатывающий одну запись за один раз), то должна отсутствовать возможность использования его для того, чтобы обойти правила и условия целостности, выраженные на реляционном языке высокого уровня (обрабатывающем несколько записей за один раз).

Правило 2 указывает на роль первичных ключей при поиске информации в базе данных. Имя таблицы позволяет найти требуемую таблицу, имя столбца позволяет найти требуемый столбец, а первичный ключ позволяет найти строку, содержащую искомый элемент данных.

Правило 3 требует, чтобы отсутствующие данные можно было представить с помощью недействительных значений (NULL).

Правило 4 гласит, что реляционная база данных должна сама себя описывать. Другими словами, база данных должна содержать набор системных таблиц, описывающих структуру самой базы данных.

Правило 5 требует, чтобы СУБД использовала язык реляционной базы данных, например SQL. Такой язык должен поддерживать все основные функции СУБД - создание базы данных, чтение и ввод данных, реализацию защиты базы данных и т. д.

Правило 6 касается представлений, которые являются виртуальными таблицами, позволяющими показывать различным пользователям различные фрагменты структуры базы данных. Это одно из правил, которые сложнее всего реализовать на практике.

Правило 7 акцентирует внимание на том, что базы данных по своей природе ориентированы на множества. Оно требует, чтобы операции добавления, удаления и обновления можно было выполнять над множествами строк. Это правило предназначено для того, чтобы запретить реализации, в которых поддерживаются только операции над одной строкой.

Правила 8 и 9 означают отделение пользователя и прикладной программы от низкоуровневой реализации базы данных. Они утверждают, что конкретные способы реализации хранения или доступа, используемые в СУБД, и даже изменения структуры таблиц базы данных не должны влиять на возможность пользователя работать с данными.

Правило 10 гласит, что язык базы данных должен поддерживать ограничительные условия, налагаемые на вводимые данные и действия, которые могут быть выполнены над данными.

Правило 11 гласит, что язык базы данных должен обеспечивать возможность работы с распределенными данными, расположенными на других компьютерных системах.

И, наконец, правило 12 предотвращает использование других возможностей для работы с базой данных, помимо языка базы данных, поскольку это может нарушить ее целостность.

Литература

1. Дейт К. Введение в системы баз данных: Пер. с англ. - М.: Наука, 1980.- 463 с.

2. Грофф Дж., Ваинберг П. SQL: полное руководство / Пер. с англ. 2-е изд. К.: BHV, 2001.