(Лекция 5)
Методы проектирования БД
Целью проектирования БД является адекватное отображение в базе данных сути предметной области, рассматриваемой с точки зрения решения задачи автоматизации.
В теории баз данных существует ряд методов разработки моделей БД, отображающих разные уровни её архитектуры. Распространены два основных подхода к проектированию систем баз данных: "нисходящий" и "восходящий".
Известен также подход "смешанной стратегии" — сначала «восходящий» и «нисходящий» методы используются для разных частей модели, после чего все подготовленные фрагменты собираются в единое целое.
Рассмотрим на рисунке отличие этих методов
Рисунок - Выбор метода проектирования
Метод восходящего проектирования БД
При «восходящем» подходе осуществляют структурное проектирование снизу—вверх. Этот процесс называют процессом синтеза, попыткой получения целого, адекватно отображающего описание предметной области, на основе описания составляющих его частей.
Этапы проектирования БД методом «восходящего» проектирования представлены на рисунке 2.
ДЛМ - даталогическая модель; НФ - нормальная форма; ИЛМ -информационно—логическая модель предметной области; МБД - модель БД.
Рисунок 2 — Этапы проектирования БД методом «восходящего» проектирования
Работа для реляционной БД начинается с определения свойств объектов (атрибутов сущностей) предметной области, которые на основе анализа существующих между ними связей группируются в реляционные отношения (таблицы), отображающие эти объекты (в том случае, если мы проектируем структуру реляционной БД).
Как правило, получают 2 — 3 реляционных отношения, связанных между собой.
Избыточность данных в ненормализованной схеме - повторение данных в БД.
Для того чтобы полученная структура БД (ДЛМ) не обладала различными аномалиями при добавлении, обновлении или удалении данных вследствие их избыточности, необходимо осуществить проверку каждой полученной схемы отношения, как минимум, на соответствие 3НФ. Если схемы отношений не соответствуют этому условию, а они, как правило, не соответствуют, необходимо проводить процесс нормализации.
Значительный объем мероприятий по нормализации схем реляционных отношений даже дал второе название методу «восходящего» проектирования. Этот метод часто называют методом «нормализации».
Основы теории нормализации создал Э. Кодд.
Нормализация - это процесс проектирования в терминах РМД методом последовательных приближений к удовлетворительному набору схем.
Совокупность схем отношений называется схемой реляционной БД.
Нормализация исключает избыточность и аномалии в БД.
Пример
Схема1 (Код автора, ФИО автора, Код книги, Название книги, Код издательства, Название издательства, Дата издания)
Аномалии в ненормализованной схеме отношения:
а) обновления - противоречивость данных, вызванная их избыточностью и частичным обновлением.
Пример: Схема2
(Код преподавателя, ФИО преподавателя, Код кафедры, Название кафедры, Краткое название кафедры, Код должности, Название должности)
б) аномалия удаления - непреднамеренная потеря данных, вызванная удалением других данных
Пример
Схема2 (Код преподавателя, ФИО преподавателя, Код кафедры, Название кафедры, Краткое название кафедры, Код должности, Название должности)
в) аномалия ввода - невозможность ввести данные в таблицу, вызванная отсутствием других данных.
Пример
Схема2 (Код преподавателя, ФИО преподавателя, Код кафедры, Название кафедры, Краткое название кафедры, Код должности, Название должности)
Этапы проектирования БД методом нормализации:
1. Определение всех атрибутов, сведения о которых будут включены в БД -сбор сырых данных на предприятии.
2. Составление списка сырых данных в виде схем реляционных отношений. Полученная в итоге схема отношений находятся в нулевой нормальной форме (0НФ).
3. Приведение схемы отношения к 1НФ
Опр. 1НФ: Схема отношения находится в 1НФ тогда и только тогда, если все атрибуты схемы имеют атомарное значение и в схеме отношений отсутствуют повторяющиеся группы.
Опр.: повторяющаяся группа - один или более элементов данных, которые имеют более одного значения для одного значения части ключа. Рассматривается, если первичный ключ составной.
Разбиение схемы отношения на атомарные атрибуты.
Удаление повторяющихся групп.
Пример 1
ПГ: ЗАКАЗ (Номер заказчика, Ф.,И.,О., тел., дата, Номер заказа)
Первичный ключ - Номер заказчика, Дата, Номер заказа (если в один день заказчик может оформить более чем один заказ)
Повторяющаяся группа: Ф,И,О, телефон - повторяются в каждой новой записи при формировании информации о новом заказе, хотя эта информация относится к части составного ключа - Номер заказчика.
Нужно вынести в отдельную схему отношений:
ЗАКАЗ (№ заказчика, дата, № заказа)
ФИЗИЧЕСКОЕ ЛИЦО (№ заказчика, Ф,И,О, телефон)
Связь 1:М между 2-мя новыми схемами отношений, «много» на стороне отношения ЗАКАЗ.
Каждое ФИЗИЧЕСКОЕ ЛИЦО может оформить много ЗАКАЗОВ.
Каждый конкретный ЗАКАЗ оформлен одним и только одним ФИЗИЧЕСКИМ ЛИЦОМ.
4. Изучение смысла (семантики) данных и определение набора атрибутов -потенциального (уникального) ключа отношения. М.б. несколько уникальных ключей.
Уникальный (потенциальный) ключ - атрибут или набор атрибутов, который полностью и однозначно определяет значения других атрибутов.
5. Если отношение обладает несколькими потенциальными ключами, то нужно выбрать среди них кандидата в первичный ключ.
6. Выявление функциональных зависимостей между атрибутами нормализуемой схемы отношения.
Опр.: функциональной зависимостью атрибута В (набора атрибутов) отношения R от атрибута (набора атрибутов) А отношения R, обозначаемой R.A -> R.B A->B
называется такая связь между атрибутами отношения, что в каждый момент времени каждому значению атрибута (набору атрибутов) В соответствует только одно значение атрибута (набора атрибутов) А.
Однако для заданного значения атрибута В может существовать несколько различных значений атрибута А.
Таким образом, если из семантики предметной области нам известно значение атрибута А, то мы в предметной области однозначно можем определить значение атрибута В.
ФЗ является смысловым свойством атрибутов отношения.
В отношении м.б. выявлено много функциональных зависимостей, т.е. в отношении м.б. выявлено много детерминантов.
Опр .: ключевой атрибут - атрибут, входящий в состав первичного ключа Опр.: не ключевой атрибут - атрибут, не входящий в состав первичного ключа.
Опр.: частичная ФЗ - это зависимость не ключевого атрибута от части составного первичного ключа.
Опр.: полная ФЗ - это зависимость не ключевого атрибута от всего составного первичного ключа.
Имеет смысл рассматривать полную и частичную ФЗ в том случае, если ПК - составной.
Пример:
Работа(Номер школы (ВК1); Номер инструктора (ПК); Фамилия инструктора; Имя инструктора; Отчество инструктор; Серия паспорта; Номер паспорта; Дата принятия на работу; Госномер автомобиля; Код вида занятий (ВК3))
Функциональные зависимости:
Номер инструктора -> Номер школы Номер инструктора -> Фамилия инструктора Номер инструктора -> Имя инструктора
Номер инструктора -> Отчество инструктора Номер инструктора - >Серия паспорта Номер инструктора -> Номер паспорта Номер инструктора - >Код образования Номер инструктора - >Дата принятия на работу Номер инструктора - >Госномер автомобиля
Функционально полно от первичного ключа Номер инструктора, Код вида занятий не зависит ни один не ключевой атрибут.
Для приведения к 2НФ необходимо выявит подмножество ФЗ не ключевых атрибутов от составного первичного ключа. Сколько не ключевых атрибутов -столько ФЗ!
Замечание: полное множество ФЗ определяется на основе аксиом и теорем теории множеств.
7. Приведение схемы отношения к 2НФ Технология приведения ко 2НФ:
1) В отдельную схему отношения выносится составной первичный ключ и те атрибуты, которые функционально полно зависят от него. Если таких атрибутов нет, то первичный ключ выносится один.
2) В отдельную схему выносится часть первичного ключа и те атрибуты, которые функционально полно зависят от этой части.
Сколько частей первичного ключа образовали частичные ФЗ, столько схем получаем
3) Исходная схема удаляется.
8. Определение транзитивных зависимостей в каждом нормализуемом отношении
Опр.: транзитивная зависимость - атрибут С отношения R транзитивно зависит от атрибута А отношения R, если для атрибутов А, В, С выполняется условие существования следующих ФЗ:
А -> B B -> C
при условии, что атрибут А функционально не зависит ни от атрибута В, ни от атрибута С.
9. Удаление транзитивных зависимостей путем декомпозиции схем отношений
10 Определение условий необходимости анализа схем отношений на соответствие НФБК (нормальной формы Бойса - Кодда - BCNF)
Эта нормальная форма вводит дополнительное ограничение по сравнению с
3НФ.
Опр.: Отношение находится в НФБК, если оно находится в 3НФ и каждый детерминант отношения является потенциальным ключом отношения.
Опр.: Детерминантом ФЗ называется атрибут (набор атрибутов),
расположенный в левой части ФЗ, т.е. от детерминанта функционально полно зависит некоторый другой атрибут (атрибуты)
В отношении м.б. несколько детерминантов
Ситуация, когда отношение будет находиться в 3НФ, но не в НФБК, возникает при условии, что отношение имеет два (или более) возможных (потенциальных) ключа, которые являются составными и имеют общий атрибут.
Таким образом, НФБК учитывает ФЗ, в которых участвуют все потенциальные ключи отношения, а не только ПК.
На практике такая ситуация встречается достаточно редко, и для всех прочих отношений 3NF и BCNF эквивалентны.
Для отношения с единственным потенциальным ключом его 3НФ эквивалентна и НФБК.
Таким образом, для успешного проведения нормализации (до 3НФ) необходимо на основе анализа предметной области (анализа документов
предметной области) для каждой схемы реляционного отношения:
— выявить потенциальные ключи;
— увидеть повторяющиеся группы и не атомарные атрибуты;
— привести схемы отношения к 1НФ;
— определить функциональные зависимости между не ключевыми атрибутами и первичным ключом;
— определить частичные функциональные зависимости;
— осуществить декомпозицию (деление) соответствующих схем отношений для удалений частичных функциональных зависимостей;
— увидеть транзитивные зависимости между не ключевыми атрибутами и первичным ключом;
— исключить транзитивные зависимости путем декомпозиции
соответствующих схем отношений.
Проведение этих мероприятий является достаточно трудоемким процессом. Так, например, выявление полного множества функциональных зависимостей потребует знаний теории множеств и предикатной логики.
Для приведения схем отношений к более высоким нормальным формам необходимо проведение дополнительного исследования предметной области для определения детерминантов отношений, выявления многозначных зависимостей между атрибутами отношения, зависимостей соединения.
Рассмотрим на рисунке схему процесса нормализации
Рисунок - Схема процесса нормализации
«Восходящее» проектирование - это достаточно сложная и устаревшая методика, которая подходит для проектирования только небольших баз данных.
Предметная область - автоматизация учета личных данных инструкторов сети школ авто вождения.
Возросло количество обучающихся, возрос и контингент инструкторов, появилась необходимость автоматизации.
На этапе общения с заказчиком были определены следующие атрибуты, которые необходимо хранить и обрабатывать:
- Номер школы;
- ФИО инструктора;
- Дата рождения;
- Номер, серию паспорта;
- Дата принятия на работу;
- Госномер автомашины, которая закреплена за инструктором (необходимо хранить
последнюю запись - желание заказчика, хотя по-хорошему надо хранить историю);
- вид занятий, которые проводит сотрудник (лекция, вождение), также хранить только последнюю информацию - фотография момента, история не нужна.
Выявленные ограничения предметной области:
Все данные должны быть обязательными.
За одним автомобилем м.б. закреплено несколько инструкторов.
Номер сотрудника уникальный в пределах всей ИС, охватывающей сеть школ.
Наполнение строк реальными данными позволило выявить кандидата в первичный ключ. Серия и номер документа удостоверяющего личность состоит из двух атрибутов, его можно заменить введение дополнительного номера - личный номер инструктора. Это выяснилось и в ходе дальнейшего обследования предметной области - сотрудник, ведущий личные дела инструкторов, присваивает каждому личный номер.
Поле "вид занятий" символьное, что нежелательно для атрибута, входящего в состав первичного ключа. В ходе дальнейшего анализа предметной области был выявлен документ, который перечислял существующие виды занятий автошколы, причем, записи были пронумерованы в шапке отчетного документа- 1 - руководство школой; 2- чтение теоретического курса; 3 - работа на тренажерах и т.д. и по каждому виду подводился итог. Появился атрибут, дополнительно описывающий вид занятий, причем числовой. Его необходимо добавить в схему отношения и сделать атрибутом первичного ключа, заменив, таким образом, длинное символьное поле.
Получили схему отношения:
ПК - первичный ключ - Номер инструктора; Код вида занятий
Необходимость нормализации: исходное отношение, находящееся в нулевой нормальной форме, содержит избыточные данные, что является причиной аномалий вставки - например, мы не можем внести данные о инструкторе, пока он не принесет сведения об образовании или не будет точно известен госномер и марка автомобиля, который за ним закрепляют. Аномалия обновления
- изменение госномера автомобиля (автомобиль списали) поведет за собой необходимость изменения этого поля во всех строках, где он упоминается (фиксируем только фотографию момента - за кем был последним закреплен автомобиль, но таких людей м.б. несколько и для их выявления необходимо проделать определенную работу, при чем работу администратора БД).
Явная избыточность - повторение названия вида занятий.
Неявная избыточность - изменение госномера автомобиля.
Дальнейшим, необходимым для нормализации, этапом работы является определение зависимостей между атрибутами на основе семантики предметной области.
Скачать лекцию:
Пароль на архив: privetstudent.com