Таблицы баз данных внешне похожи на обычные таблицы, которые мы видим в книгах или можем создавать в программах-редакторах. Однако они имеют ряд особенностей и жестких ограничений, которые делают эти таблицы удобным инструментом хранения данных и последующей статистической обработки.
Отличие 1. Таблицы баз данных имеют строгую «сетчатую» структуру и не позволяют произвольно объединять или разделять ячейки.
Отличие 2. Таблица баз данных всегда имеет «шапку» - каждый столбец (поле) имеет свое имя (кстати, соответствующее исследуемому параметру). Имена полей в одной и той же таблице НЕ МОГУТ ПОВТОРЯТЬСЯ, т.е. должны быть уникальными! В разных таблицах имена столбцов полей можно делать одинаковыми. Шапка таблицы всегда занимает ТОЛЬКО ОДНУ самую верхнюю строку. В остальных строках (записях) хранятся сами данные.
Отличие 3. Никакая строка (запись) таблицы базы данных не может быть полностью пустой. Хотя бы одна ячейка в каждой записи должна быть заполнена!
Отличие 4. Данные в каждой ячейке должны быть атомарными, т.е. трактоваться однозначно.
Пример. Вы хотите хранить в таблице базы данных артериальное давление. Оно состоит из 2 чисел – верхнего и нижнего давления. Будет неправильно, если Вы поместите в ячейку столбца выражения типа «120/80»:
Фамилия | АД |
Иванов | 120/80 |
Петров | 130/85 |
Сидоров | 140/90 |
Вместо этого вы должны создать ДВА поля и каждый показатель хранить отдельно:
Фамилия | Верхнее АД | Нижнее АД |
Иванов | ||
Петров | ||
Сидоров |
Понятие «набор данных»
Набор данных – это вся таблица или ее часть, выделенная по заданным критериям.
Статистические операции всегда проводятся над одним или несколькими наборами данных, поэтому очень важно понимать, что такое набор данных и как его получить из таблицы. Уже сказано, что в простейшем случае набор данных – это и есть вся таблица целиком.