Распределенные базы данных

Распределённые базы данных (англ. "Distributed DataBase", DDB) представляют определённым образом связанные между собой БД, рассредоточенные на какой-либо территории (локально или регионально), обеспечивающие свободный обмен информацией и поиск данных в них.

Распределённая база данных предполагает хранение и выполнение функций управления данными в нескольких узлах и передачу данных между этими узлами в процессе выполнения запросов. Разбиение данных в распределённой базе данных может достигаться путём хранения различных таблиц на разных компьютерах или даже хранения разных частей и фрагментов одной таблицы на разных компьютерах. Для пользователя или прикладной программы не имеет значения, каким образом распределены данные между компьютерами. Работа с распределённой базой данных осуществляется так же, как и с централизованной, т. е. размещение БД должно быть прозрачно.

При распределённой обработке работа с базой (представление данных, их обработка и др.) ведётся на компьютере клиента, а поддержание базы в актуальном состоянии – на сервере. При этом такие БД обычно располагаться на нескольких серверах – различных узлах компьютерной сети, а некоторые данные могут дублироваться.

Размещение частей общей БД бывает избыточным или безызбыточным. При избыточном размещении определяют степень дублирования частей (фрагментов) единой БД. Чтобы поддерживать целостность БД необходимо постоянно корректировать все её копии. Преимущества дублирования уменьшаются, когда увеличивается стоимость хранения её частей, что связано с необходимостью обеспечивать устойчивость системы.

Создание распределённых баз данных (РБД) вызвано попыткой одновременного решения двух задач: интеграции и децентрализации.

Интеграция подразумевает централизованное управление и ведение баз данных.

Децентрализация обеспечивает хранение данных там, где они появились и обрабатываются. При этом снижается стоимость системы и увеличивается степень её надёжности, а также повышается скорость обработки данных.

Выделяют однородные и неоднородные РБД. В неоднородных РБД используются различные СУБД. Основная проблема при этом заключается в сложности их интеграции.

3.2. Система управления распределёнными базами данных
Доступ пользователей к РБД и администрирование ею осуществляются с помощью системы управления распределённой базой данных (СУРБД).

Система управления распределёнными базами данных (Distributed dataBase management system, DDBMS) - это система управления базами данных, расположенными в нескольких узлах информационной сети.

В СУРБД используется комбинация централизованного и локального способов хранения данных.

Для решения задач с распределёнными БД, во-первых, необходимо организовать между этими ЭВМ сеть передачи данных, то есть соединить их каналами связи. Затем обеспечивают техническую и программную поддержку обмена данными между ними, образуя тем самым сеть ЭВМ.

СУРБД создаются таким образом, чтобы максимально обеспечить соблюдение принципа независимости прикладных программ от локализации данных в сети. При этом логическое представление распределённой БД и манипулирование данными для прикладной программы ничем не отличаются от работы пользователя с локальной базой. Такие СУРБД оснащены каталогами, в которых хранятся структура сети, информация о локальных СУРБД и базах данных, а также программным обеспечением, которое на основе этой информации управляет взаимодействием прикладной программы и конкретной локальной базой данных сети.

Сложность управления распределёнными базами данных во многом зависит от того, поддерживаются ли они однотипными локальными СУРБД, взаимодействие между которыми осуществляется просто. В противном случае в такую сеть включают различные программные и технические устройства, обеспечивающие единый интерфейс, согласование и возможность выполнения информационных процессов, например, использовать промежуточную интерфейсную СУРБД и др.

 

3.3. Распределенные банки данных (РБнД).
Если накапливаемая в сетях машиночитаемая (электронная) информация не размещается на одной ЭВМ, то доступ к подобным базам и банкам данных осуществляется с помощью сетевых СУБД. Они дают возможность безадресно обращаться к любым данным (аналогично обычным БД, расположенным на одной ЭВМ) и порой предоставляют пользователям новые, ранее неизвестные, возможности работы с информацией. При этом возникают новые проблемы, решение которых осуществляется путём использования новых технологий.

 

Основные выводы

В процессе развития вычислительной техники и информационных технологий постоянно создаётся множество устройств и программ к ним. Обилие различных программно-аппаратных средств и систем привело к несовместимости многих из них.

Следует запомнить, что решение этой проблемы стало возможным после того, когда было предложено использовать принцип открытых систем. Основным назначением таких систем для пользователей аппаратных и программных компьютерных продуктов и технологий является независимость от поставщика, ориентированного на производство подобных продуктов и использование этой технологии. То есть потребители могут приобретать любой продукт такого поставщика (фирмы, компании), наращивая мощность своей системы. Это касается как аппаратных, так и программных средств.

Обязательными свойствами открытых систем являются:

1) переносимость;
2) интероперабильность;
3) масштабируемость;
4) доступность программного и аппаратного обеспечения для развития и модернизации.

В открытых системах широко используются объектно-ориентированные и функционально-распределённые информационные технологии. На различных этапах анализа и синтеза систем возникают проблемы разбиения (декомпозиции) их на подсистемы, задач на подзадачи, а программного обеспечения – на отдельные программы и подпрограммы.

В объектно-ориентированных открытых системах декомпозиция системы на объекты осуществляется с учётом удобства последующего детального анализа, разработки и внедрения системы. Одним из наиболее важных критериев выделения компонентов открытой системы является минимизация числа аппаратно-зависимых её компонент. Объектно-ориентированный подход позволяет свести проектирование открытой системы к оптимальному синтезу функционально независимых компонент (объектов), совместно выполняющих заданные функции системы с требуемой эффективностью, и позволяет адаптировать систему к вновь появляющимся задачам за счёт набора специфических свойств (наследование и проч.). Таким образом, значительно снижаются затраты на разработку, внедрение и модификацию систем.

Объектно-ориентированный подход породил создание распределённой среды обработки данных, включающей системы обработки данных, информации и знаний.

Технология распределённой обработки данных представляет стандартный набор сетевых служб для выполнения прикладных процессов, рассредоточенных по группе абонентских систем (по гетерогенной сети). При этом создаются распределённые базы и банки данных. Обработка информации в базе ведётся на компьютере клиента, а поддержание базы в актуальном состоянии – на сервере. Доступ пользователей к БД и администрирование ею осуществляются с помощью системы управления распределённой базой данных (СУРБД).

Подобные системы дают возможность пользователям безадресно обращаться к любым хранящимся в них данным и порой предоставляют новые, ранее неизвестные, возможности работы с информацией. При этом возникают новые проблемы, решаемые путём использования новых технологий.

 

Контрольные вопросы

Ответьте на следующие вопросы:

1. Что представляет собой технология открытых систем?

2. Почему появилась потребность создания открытых систем?

3. Назовите обязательные свойства открытых систем.

4. Что означает термин “Масштабируемость”?

5. Как реализуется принципы интероперабильности и мобильности в открытых системах?

6. Назначение объектно-ориентированных и функционально-распределённых информационных технологий.

7. Дайте определение распределённой среде обработки данных.

8. Охарактеризуйте суть распределённых баз данных и СУРБД.