MS SQL Server 2000.

Цель работы –изучение логической структуры баз данных, которые создаются и используются в системах на основе сервера SQL Server 2000 и функционального назначения их объектов, а так же особенностей физической структуры этих баз, которая включает информационные и служебные файлы и группы файлов, использующих виртуальную страничную систему хранения данных и систему конфигурирования, обслуживания и администрирования на физическом уровне.

Данные в сервере SQL Server 2000 хранятся в базах данных. Структуру баз данных необходимо рассматривать на двух уровнях: логическом и физическом.

Логическая структура базы данных определяет структуру таблиц, взаимосвязи между ними,

список пользователей, хранимые процедуры, правила, умолчания и другие объекты базы данных.

Физическая структура базы данных включает в себя описание файлов и групп файлов базы данных, журнала транзакций, первоначальный размер файлов, шаг прироста базы данных, ее максимальный размер, параметры конфигурации и другие физические характеристики.

Все логические компоненты базы данных SQL Server 2000 называются объектами и подразделяются на 11 типов.

Для объектов можно устанавливать различные правила доступа со стороны пользователей.

Функциональное назначение объектов базы данных сервера SQL Server 2000 можно кратко определить следующим образом:

1.Table– таблица, представляющая собой матрицу из строк и столбцов. Каждая строка (или запись) состоит из значений атрибутов конкретного объекта. Столбец (или поле записи) содержит совокупность атрибутов рассматриваемых объектов некоторой предметной области. Некоторые столбцы таблицы могут быть вычисляемыми. В этих случаях для них задается расчетная формула. Таблицы создаются, изменяются и удаляются соответственно командами Transact-SQL CREATE TABLE, ALTER TABLE и DROP TABLE. При создании новой базы данных сервер автоматически создает 18 системных таблиц для хранения информации о ее структуре и организации, доступ к которым со стороны пользователя запрещен. Помимо основных и системных таблиц, которые, как правило, постоянно хранятся в базе данных, можно использовать временные таблицы для временного хранения информации, которые автоматически уничтожаются при закрытии соединения с базой данных. Временные таблицы создаются в системной базе данных tempdb как локальные или как глобальные. Имена локальных таблиц начинаются с символа # , а имена глобальных - с символов # #. Локальные таблицы видимы только для соединения, создавшего их. Глобальные таблицы видимы во всех соединениях, не зависимо от того в каком именно из них эта таблица была создана, и предназначены для обмена данными между приложениями. Временная глобальная таблица удаляется либо явно командой DROP TABLE, либо автоматически при закрытии того соединения, в котором она была создана. Имя глобальной таблицы должно быть уникально в пределах сервера. Временные таблицы уничтожаются также при остановке сервера. Вместо временных таблиц можно использовать переменные типа table. Когда сервер встречает имя таблицы начинающейся с символов # или # #, он обращается к базе данных tempdb для поиска указанной таблицы. При этом игнорируется имя владельца и имя базы данных. Указание имени сервера при обращении к временной таблице вообще не разрешается. При попытке указать имя сервера в команде создания временной таблицы будет выдано сообщение об ошибке. Для временных таблиц используются такие же команды создания, изменения и удаления, что и для основных таблиц. Во всех рассмотренных таблицах тип данных столбца может быть системным, т.е. встроенным в сервер или определен самим пользователем на основе системных. В языке Transact-SQL используются следующие системные чипы:

binary(n)–двоичные данные фиксированной длины до 8000 байт; для n байтов выделяется n+4 байта памяти; значения задаются с помощью 16-ичных чисел 0 x<шестнадцатеричные цифры>; функция DATALENGTH позволяет определить длину поля в байтах; дополнение нулевыми байтами производится справа.

image –двоичные данные длиной до 231 – 1; место выделяется в виде цепочки страниц.

char(n)–строковый тип данных фиксированной длины без поддержки Unicode длиной до 8000 байтов; данные зависят от установленной кодовой страницы; если для столбца не задана опция NULL, то строка при необходимости будет дополняться справа пробелами; если эта опция задана, то дополнение пробелами будет иметь место при условии ANSI_PADDING=ON, в противном случае пробелы добавляться не будут.

var char(n)–строковый тип, как и char(n),но не с фиксированной длиной; если ANSI_PADDING=OFF, то будет выполняться удаление конечных пробелов, если ANSI_PADDING=ON, то удаление пробелов производиться не будет.

Nchar(n)-строковый типкак и char(n), но с поддержкой Unicode, поэтому максимальное количество символов составляет 4000; в этом случае для строковых констант надо задавать впереди букву N: N’ABC’.

Nvarchar(n)–строковый тип, как varchar(n), но с поддержкой Unicode.

Text–строковый тип без поддержки Unicode длиной до 2 Гбайт; память выделяется страницами по

8 Кбайт, связываемыми в цепочку; можно использовать встроенные функции: DATALENGTH, PATINDEX, SUBSTRING, TEXTPTR, TEXTVALID, READTEXT, SET TEXTSIZE, UPDATETEXT, WRITETEXT.

Ntext–строковый тип как и text, но с поддержкой Unicode, поэтому длина строки не более 1

Гбайта.

Int–целый тип длиной в 4 байта и с диапазоном от –231 до 231-1. Smalling–целый тип длиной в 2 байта с диапазоном от –215 до 215-1. Tinyint–целый тип длиной в 1 байт и диапазоном от 0 до 255.

Bigint–целый тип длиной в 8 байт и с диапазоном от-263 до 263-1.

Decimal[(p[,s])]–десятичный двоично-кодированный тип с p десятичными разрядами, из которых s – дробных; максимальное значение p достигает 38, поэтому диапазон значений составляет от –(1038-1) до 1038-1.

Numeric[(p[,s])]–тип, аналогичныйтипуdecimal[(p[,s])].

Float[(n)]–плавающий (приблизительный) тип длиной в 4 байта и с диапазоном от –1.79x10308 до

1.79x10308; значение n определяет количество бит для хранения мантисы и может принимать значения от 1 до 53.

Real–плавающий тип, являющийся аналогом float(240).

Datetime–тип данных для хранения даты (4 первых байта) и времени (4 последних байта) в диапазоне от 1.1.1753 и до 31.12.9999 года; дата хранится в виде смещения относительно базовой даты 1.1.1753, а время является количеством миллисекунд после полуночи; формат для пользователя: MMM DD YYYY hh:…..

Smalldatetime–тип данных для хранения даты (первых 2 байта) и времени (последние 2 байта) в диапазоне от 1.1.1900г. до 6.6.2079г., время задается с точностью до минуты.

Money–тип данных для хранения больших денежных величин с точностью до 4 знаков после запятой в диапазоне от –922 337 203 685 477.5808 до +922 337 203 685 477.5807; для хранения данных отводится 8 байт.

Smallmoney–тип данных для хранения нормальных денежных величин с точностью до 4 знаков после запятой в диапазоне от –214 748.3648 до 214 748.3647; для хранения данных отводится 4 байта.

Bit–битовый (логический) тип со значениями 0 и 1; для хранения выделяется 1 разряд байта памяти.

Timestamp–тип данных временный штамп для учета числа изменений данных в записи (версий строки row version); значение timestamp уникально в пределах базы данных и позволяет идентифицировать конкретное значение записи; тип аналогичен binary(8), если хранение NULL не разрешено и varbinary(8), если разрешено.

Uniqueidentifier–тип данных для хранения глобальных уникальных идентификаторов длиной в 16 байт, генерируемых функций NEWID и используемых для идентификации строк (записей); при генерации используется номер сетевой карты компьютера и текущее время.

Sysname–тип данных для хранения имен объектов базы данных; аналог nvarchar (128).

Sql_variant–вариантный тип данных для хранения данных любого типа, кроме text, ntext,image,timestamp; для получения информации о природе хранимых данных используется функция SQL_VARIANT_PROPERTY().

Table–тип таблицы для временного хранения наборов данных с использованием переменных.

2. User-defined data type– пользовательский тип данных, создаваемый на основе системных. Имя нового типа должно быть уникальным в пределах владельца.

3.View– представление, являющееся виртуальной таблицей, содержимое которой определяется запросом. Эта таблица не содержит данных, а только их представляет возможно из нескольких таблиц. Данные из представления не сохраняются в базе данных. Физически представление реализуется в виде запроса SELECT. Представления используются в следующих случаях:

a) Для ограничения доступа пользователей к определенным строкам таблицы; b) Для ограничения доступа пользователей к определенным столбцам таблицы; c) Для представления данных столбцов разных таблиц в виде одного объекта;

d) Для просмотра информации, получающейся в результате преобразования данных столбцов.

4.Stored procedure– хранимая процедура, представляющая собой группу команд Transact- SQL, объединенных в один модуль. Каждая хранимая процедура имеет уникальное , в пределах базы данных, имя, по которому она вызывается. Хранимая процедура может вызывать другие хранимые процедуры. В состав SQL Server 2000 входит большое количество встроенных процедур, которые называются системными и имена которых начинаются с префикса sp_. Системные процедуры хранятся в базе master. Она может пополняться расширенными хранимыми процедурами, создаваемыми пользователями и включаемыми администратором сервера в виде DLL-библиотек при помощи Open Data Services APT. Любая хранимая процедура должна запускаться оператором EXECUTE. При первом вызове хранимой процедуры создается план ее исполнения, который сохраняется для всех последующих вызовов, в том числе и из других пакетов команд. В SQL Server 2000 сохранение плана осуществляется при выполнении любых команд Transact-SQL.

5.Trigger– триггер, представляющий собой специальную хранимую процедуру, автоматически запускаемую при добавлении, изменении или удалении данных из таблицы. Триггеры делятся на три категории:

UPDATE TRIGGER – триггеры изменения; INSEART TRIGGER – триггеры вставки; DELETE TRIGGER – триггеры удаления.

Действия, выполняемые в одном триггере, могут вызвать другие триггеры (вложенные триггеры).

6.Index– индекс, представляющий собой структуру, связанную с таблицей или представлением и предназначенную для ускорения поиска информации в этой таблице или представлении. Индекс определяется для одного или нескольких столбцов, называемых индексированными столбцами. Индекс содержит отсортированные значения индексированного столбца или столбцов со ссылкой на соответствующую строку исходной таблицы или представления. Алгоритмы поиска в отсортированных данных гораздо эффективнее, чем в неотсортированных.

7.Rule– правило, используемое для ограничения значений, хранимых в столбце таблицы или в пользовательском типе данных. Одно и тоже правило может связываться с множеством столбцов различных таблиц и пользовательских типов данных только в текущей базе данных. Правило создается командой CREATE RULE и связывается с объектом базы данных с помощью процедуры sp_bindrule. Правила оставлены в Transact-SQL для совместимости со старыми версиями сервера.

8.Constraint– ограничение целостности, представляющее собой механизм, обеспечивающий автоматический контроль соответствия данных установленным условиям, или ограничениям целостности. Ограничения целостности имеют приоритет над триггерами, правилами и значениями по умолчанию. Имеется пять ограничений целостности, различающихся по функциональности и области применения:

NULL – действует на уровне столбца и пользовательского типа данных и либо разрешает

(NULL), либо запрещает (NOT NULL) хранение значений NULL.

CHECK – действует на уровне столбца и ограничивает диапазон значений, которые могут быть сохранены в столбце, путем проверки логического условия для вводимых данных. При вводе или изменении данных вводимое значение подставляется в условие. Если полученный результат

TRUE, то изменения данных принимаются, иначе – отвергаются и генерируется сообщение об ошибке. Для одного столбца можно задать несколько ограничений типа CHECK (проверок):

CONSTRAINT human_avance

CHECK (human_ avance BEETWEEN 0 and 700)).

UNIQUE – действует на уровне столбца и гарантирует уникальность в столбце вводимых значений. В отличии от ограничения PRIMARY KEY, это ограничение допускает хранение значений NULL.

PRIMARY KEY – действует на уровне столбца или таблицы и гарантирует уникальность в пределах таблицы первичного ключа, состоящего из одного или нескольких столбцов. Ни для одного из столбцов ключа не должно быть установлено свойство NULL. Когда используется один столбец, то для него необходимо также задать и свойство UNIQUE. В таблице создается только один первичный ключ. При его выборе надо учитывать требования удобства и функциональности.

FOREIGN KEY – действует на уровне таблицы и связывается с одним из кандидатов на первичный ключ в другой таблице. Таблица, в которой определен внешний ключ с помощью этого ограничения, называется зависимой, а таблица с кандидатом на первичный ключ – главной. В зависимую таблицу нельзя вставить строку, если внешний ключ не имеет соответствующего значения в главной таблице. Из главной таблицы нельзя удалить строку, если с ней связана хотя бы одна строка в зависимой таблице. Формат задания ограничения таков:

FOREIGN KEY REFERENCES имя главной таблицы (кандидат на первичный ключ или ее

ключ).

9.Default– умолчание, представляющее собой значение, которое будет присвоено элементу

столбца таблицы при вставке строки (записи), если в команде вставки явно не указано значение для этого столбца. Умолчаниями могут быть константы, а также встроенные функции и математические выражения, возвращающие конкретные значения. Имя умолчания должно быть уникально для владельца. При связывании умолчания со столбцом таблицы, информация о связывании сохраняется в таблице syscolumns базы данных, при связывании с пользовательским типом данных - в таблице systypes. Рекомендуется задавать значения по умолчанию для столбцов таблицы с помощью команд CREATE TABLE и ALTER TABLE, а также проверять, не конфликтует ли созданное умолчание с правилом для соответствующего столбца. Если для столбца разрешено хранение значения NULL и определено значение по умолчанию, то при вставке строки будет использовано значение по умолчанию. Умолчание может быть создано только в текущей базе данных. Задание имени владельца не обязательно. Создание умолчания выполняется командой CREATE DEFAULT, а связывание со столбцами таблиц или пользовательскими типами производится процедурой sp_unbindefault, а удалить само умолчание командой DROP DEFAULT.

10.Function– функция, представляющая собой программный модуль, выполняющий некоторые часто используемые действия над данными и возвращающий значение какого-либо типа. Имя функции, осуществляющее ее вызов, может указываться в любом выражении языка Transact-SQL. Встроенные функции (built-in functions) являются составной частью среды программирования сервера, выполняют заранее предопределенную последовательность команд и не могут изменяться пользователем: COUNT, SUM, MIN, MAX и т. д. Функции пользователя (user_ defind function) создаются пользователем по правилам языка Transact-SQL для реализации разрабатываемых алгоритмов.

Каждая копия, или экземпляр сервера SQL Server 2000 имеет 4 системных базы данных с именами master, msdb, tempdb и model, а также несколько созданных администратором пользовательских баз данных. Набор системных баз постоянен и не может быть изменен. Обращаться к этим базам напрямую запрещено. Обращаться к ним можно только с помощью специально разработанных интерфейсов:

a) С помощью системных хранимых процедур;

b) С помощью интегрированной среды Enterprice Manager;

c) Используя программные интерфейсы Transact-SQL (API).

При соединении с экземпляром сервера организуется связь с конкретной базой данных на сервере. Эта база данных называется текущей.. Она определяется для каждого пользователя системным администратором. Пользователь может переключаться на другую базу, используя команду USE < имя базы данных> или функции API для изменения текущей базы данных.

SQL Server 2000 позволяет соединить базы данных от одной копии сервера и подсоединить к другой, а затем восстановить подсоединение к прежней копии.

Все базы данных SQL Server 2000, как системные, так и пользовательские, физически организованы одинаково. Каждая база данных хранится в отдельных файлах. В отдельном файле хранится журнал транзакций, создаваемому автоматически для каждой базы данных. Это повышает надежность системы. Если произойдет сбой и файлы базы данных будут повреждены, то можно восстановить базу данных из резервной копии, а затем восстановить сделанные изменения из журнала транзакций, который останется не поврежденным. Таким образом каждая база данных имеет, минимум, два файла: один для базы данных и один для журнала транзакций. Эти файлы имеют различную структуру и при работе с ними применяются разные правила.

Основная единица хранения данных на уровне файла базы данных – это страница, которая участвует в операциях ввода-вывода как единое целое даже тогда, когда требуется всего одна строка. Размер страницы равен 8 Кбайт.

Файл журнала транзакций не имеет страниц и экстентов. Он содержит только последовательность записей транзакций, выполняемых в базе данных.

Каждая страница файла базы данных имеет объем 8192 байт. Первые 96 байт страницы отводятся под заголовок, в котором хранится системная информация: тип страницы, объем свободного места на странице, идентификационный номер таблицы или индекса – владельца страниц:

Имеется шесть типов страниц:

1.Data. В страницах этого типа хранятся собственно данные, исключая данные типа text, ntext и image.

2.Index. Страницы этого типа используются для хранения информации об индексированных таблицах.

3.Text/Image. В страницах этого типа хранятся данные типа text, ntext и image.

4.Global Allocation Map (GAM). В страницах данного типа хранится информация об использовании экстентов ( групп страниц). Экстент состоит из 8 страниц (64 Кбайт).

5.Page Free Space. В страницах этого типа хранится информация о свободном пространстве на страницах.

6.Index Allocation Map (IAM). Страницы этого типа хранят информацию об экстентах,

используемых таблицами или индексами.

В страницах типа Data строки записываются последовательно сразу после заголовка страницы, а их смещения записываются в обратном порядке в конце страницы.

Каждый файл данных базы имеет приблизительно одинаковую структуру. Все страницы в файле нумеруются последовательно, начиная с 0. Каждый файл имеет уникальный идентификационный номер. Комбинация этого номера и номера страницы позволяетоднозначно идентифицировать любую страницу в базе данных. На нулевой странице располагается заголовок страницы, в которых хранятся атрибуты файла. Следующая страница содержит PFC, в которой хранится информация об использовании страниц экстента. Затем располагаются битовые поля GAM и дополнительной таблицы SGAM (Shared GAM). Остальные страницы заняты данными или являются свободными. Страницы IAM могут быть созданы в любом месте файла. Для многофайловой базы данных экстенты выделяются на всех файлах в равных пропорциях. Все это обеспечивает высокую скорость создания, поиска и удаления строк данных.

Более сложные базы данных имеют несколько файлов для данных и для транзакций. В этом случае они объединяются в группы для упрощения администрирования базы данных. Любой из таких файлов может располагаться на отдельном диске.

Многофайловая база данных имеет в своем составе файлы следующих типов:

Primary (*.mdf)– основной файл, который содержит системную информацию о самой базе данных и ее объектах. В этом файле размещаются системные таблицы и описание объектов базы данных. Здесь могут храниться и данные. В базе данных такой файл только один и его наличие в базе обязательно.

Secondary (*.ndf)– вторичный файл, который используется только для хранения данных и не содержит системной информации. Он может отсутствовать в базе данных. Если задано несколько файлов этого типа, то они могут быть организованны в группы и распределены по разным физическим дискам.

Transaction Log (*.ldf)– файл журнала транзакций. Можно использовать несколько таких файлов для ускорения операций ввода-вывода, так как транзакции записываются параллельно во все файлы.

Каждый файл, используемый в базе данных, имеет два имени:

Logical File Name– логическое имя файла, которое используется в командах Transact-SQL

при ссылке на конкретный файл;

OS File Name– имя файла в операционной системе, которое используется в операционной системе.

Для каждого файла базы данных можно задать свойство автоматического роста и шаг прироста в мегабайтах или в процентах от первоначального роста, а также максимальный размер, до которого возможен рост файла.

SQL-Server 2000 обеспечивает создание групп следующих трех типов:

Primary File Group– основная группа файлов, которая включает первичный файл и все файлы, не включенные в другие группы. База данных может иметь только одну основную группу файлов.