(Лекция 7)
Проектирование и создание БД Анализ предметной области. Выявление классов объектов и связей Предметная область определена, если известны существующие в ней объекты, их свойства и отношения между ними)
Объект в концептуальном подходе - это то, о чем в информационной системе должна накапливаться информация.
Одним из важных этапов анализа предметной области является выявление и описание классов объектов (сущностей) и связей между ними. Описание может быть получено в произвольном виде, но для удобства процесса проектирования его формализуют в виде таблиц.
Классы объектов
Как выявить в предметной области классы объектов?
Класс объектов (тип сущности, сущность) - это значимая вещь, о которой предприятие должно хранить информацию.
Признаки класса объектов, существующего в предметной области:
а) нечто важное, о чем предприятию необходимо хранить информацию;
б) класс, категория, тип какой—то вещи;
в) именованное понятие;
г) существительное;
д) класс объектов есть, если есть реальный значимый объект;
Выявив класс объектов, необходимо дать ему имя. Оно должно быть уникальным.
В качестве имени выбираются термины, используемые на предприятии.
Имя изобретается, если все остальные возможности исчерпаны, так как придуманные имена могут привести к неправильному пониманию и дублированию.
Имя должно быть согласовано с заказчиком.
Имя может состоять из более чем одного слова (уточняющие имя слова -прилагательные и прочее). Часто одно и тоже называют одним именем, тогда необходимо выбрать одно главное имя, остальные описать как синонимы.
При выявлении класса объектов выявляется группа вещей, состоящих из отдельных элементов (объектов). Класс объектов - это класс или категория вещей. Например, класс объектов «ОТДЕЛ» состоит из конкретных объектов «Учебно— методический отдел», «Отдел главного механика».
Этапы выявления и моделирования класса объектов:
а) исследование каждого существительного, выявленного в ходе анализа предметной области на предприятии и выявление его значимости;
б) выявление, имеется ли информация об этом существительном, которую необходимо хранить для данного предприятия;
в) присвоение имени классу объектов в единственном числе;
г) проверка, можно ли отличить один объект класса объектов от другого;
д) описание класса объектов для проверки того, что все (разработчики, заказчики) вкладывают в этот термин одно и тоже значение;
Свойства классов объектов
Для каждого класса объектов определяют его свойства (атрибуты сущности). Свойство - это конкретный элемент информации.
Свойство описывает класс объектов. Это качественное или количественное описание класса объектов.
Свойство может выглядеть следующим образом:
- описательные слова, фразы;
- предложные конструкции (сумма зарплаты для каждого сотрудника);
- притяжательные существительные и местоимения (прочие, дата окончания, признак устаревания).
Каждое свойство наделяется именем. Имена должны быть понятными и однозначными.
Вопросы, которые рекомендуется задавать при выявлении свойств:
- какую информацию о классе объектов надо хранить;
- какую информацию о классе объектов надо выводить на экран или печать;
- нужно ли на самом деле это свойство.
Заказчики часто забывают о своих конкретных потребностях - думают, что поле само появится на экране или отчете, и не видят необходимости упоминать об этом.
Изучая существующую на предприятии документацию, необходимо обращать внимание на устаревшие требования прежних систем, например, старая форма выходного документа - членство в партии, национальность.
Необходимо также отмечать производные и агрегированные данные, для каждого класса объектов фиксируются только исходные свойства.
Производные и агрегированные свойства описываются отдельно и формируются, как правило, программой на основе значений исходных свойств. Необходимость хранения таких свойств бывает достаточно редкой.
К имени свойства предъявляется ряд требований. Имена должны быть понятными и однозначными, например название свойства "количество" может привести к путанице - возвращенное, поставленное? Необходимо выбирать более конкретные имена: «размер поставки», «объем заказа» и т.п. Если имя состоит из более, чем одного слова, они разделяются пробелами.
Самый распространенный пример - свойство «дата». Если не указано конкретно, что это за дата, она может интерпретироваться как дата рождения, дата найма.
Если необходимо хранить и то и другое, добавляется конкретное свойство, например, кроме даты найма необходимо еще хранить дату избрания по конкурсу. Это может быть выявлено на более поздних этапах анализа предметной области.
Выявленное в ходе анализа предметной области свойство необходимо разбить на мельчайшие компоненты, имеющие смысл. Уровень деления зависит от потребностей предприятия.
Классические примеры: адрес, блочные размеры пиломатериалов (высота, длина, ширина), можно хранить и в виде одного свойства, но более полезно хранить в виде отдельных свойств.
Отличие класса объектов (сущности) от свойства (атрибута) приведено в таблице 4.
Таблица 4 — Отличия между классом объектов и свойством
Характеристики класса объектов |
Характеристики свойства |
Вещь, о которой необходимо хранить информацию. |
Квалифицирует класс объектов. |
Имеет одно или более свойств. |
Собственных свойств не имеет (в противном случае это класс объектов или комбинация свойств, которой дали неудачное название). |
Может иметь несколько экземпляров и должна иметь значимую связь с другой класс объектов. |
Для каждого экземпляра класса объектов имеет только одно значение. |
Определив свойство, необходимо убедиться, что для каждого конкретного объекта свойство может иметь одно единственное значение.
Если обнаруживается более одного значения у какого—либо свойства, это свидетельствует о недостающем свойстве у класса объектов или кандидате в новый класс объектов.
Если обнаружится свойство, имеющее собственные свойства, то это не свойство, а класс объектов. Например, выявлен класс объектов «СПЕЦОДЕЖДА», имеющий свойства «номер», «название», «цвет». Если в ходе дальнейшего анализа и изучения соответствующего в предметной области документа, что цвет кроме названия должен иметь артикул, то «цвет» это уже не свойство, а класс объектов «ЦВЕТ» с соответствующими свойствами «название», «артикул».
Для каждого свойства необходимо определить его опциональность.
Опр.: Опциональность свойства - определение обязательности значения свойства объекта сохранении в базе данных информации о конкретном объекте.
Обязательное значение свойства должно существовать и быть известным для каждого объекта рассматриваемого класса объектов.
Необязательные значения свойства могут быть неизвестны (или не существуют) для какого—либо объекта на момент его создания.
Например, значение свойства «дата начала работы» известно всегда для работающего сотрудника, а значение свойства «дата окончания работы» может быть неизвестным в заданный момент времени, если у сотрудника контракт бессрочный.
Для каждого свойства также выявляются в предметной области и описываются:
- формат (тип, максимальное длина, средняя длина (обычный размер), место десятичной точки, единица измерения;
- допустимые значения (диапазон, список значений, несколько диапазонов, значения по умолчанию);
При выявлении характеристик свойств могут быть определены и домены.
Домен (с точки зрения предметной области) - это набор правил проверки с точки зрения бизнеса, ограничений, относящихся более чем к одному свойству.
Домен с точки зрения реляционной БД - допустимое множество значений, на котором м.б. определен (ы) один или более атрибутов одного или более реляционного отношения.
С помощью домена можно задать: диапазон значений; список конкретных значений; несколько диапазонов; математическое уравнение; значение по умолчанию и т.п. Эти правила описываются в БД один раз и применяются для разных свойств. Самый известный домен {да, нет}.
Существует следующая технология работы со свойствами, содержашая шаги:
- выявление кандидата в свойство;
- связывание свойства с классом объектов;
- присвоение имени свойству;
- определение формата свойства;
- определение опциональности свойства;
- определение логических ограничений свойства, накладываемых предметной областью (вхождение значения в диапазон и др.);
- проверка того, что это действительно свойство, а не класс объектов;
- в случае необходимости создание домена.
Все экземпляры (объекты) выявленного класса объектов должны однозначно определяться, быть идентифицированными. Если объект не может быть однозначно идентифицирован в классе объектов, то это возможно это не класс объектов вообще.
Определение уникальных идентификаторов
Для каждого класса объектов должны быть обязательно выявлены уникальные идентификаторы.
Уникальный идентификатор - это свойство, совокупность свойств или комбинация свойств и связей, используемых для однозначной идентификации объекта в классе объектов.
Свойство, входящее в состав уникального идентификатора должно иметь обязательную опциональность.
Количество уникальных идентификаторов в классе объектов может быть каким угодно. И каким угодно может быть количество компонентов (свойств и связей), входящих в состав уникального идентификатора.
Уникальный идентификатор можно определять на любом этапе анализа предметной области, но чтобы приступить к описанию и проектированию класса объектов, необходимо, чтобы каждый класс объектов имел уникальные идентификаторы.
Замечание:
Выбирая способ идентификации объектов класса объектов, необходимо моделировать не технологические потребности разрабатываемой системы, а потребности бизнеса.
При использовании в качестве уникального идентификатора числового кода необходимо убедиться, что в предметной области имеется соответствующий документ, в котором такой код отображается.
Например, свойства «табельный номер сотрудника», «код подразделения» уже определены существующей на предприятии системой бухгалтерского учета, свойство «код должности» представлено в отраслевом классификаторе должностей и т.п.
Замечание:
На этапе проектирования БД (далее при построение ДЛМ БД - суррогатные ключи) уникальный идентификатор может быть сгенерирован технически, но во время анализа предметной области используются уникальные идентификаторы, используемые предприятием.
Если уникальных идентификаторов несколько, необходимо определить главный. Таким делается идентификатор, чаще используемый в бизнесе, например, «табельный номер». Либо любой уникальный идентификатор, имеющий наименьшую длину и числовой тип.
Самое большое количество уникальных идентификаторов имеет такой класс объектов, как «ФИЗИЧЕСКОЕ ЛИЦО/ ЧЕЛОВЕК». Каждый объект в таком классе объектов может быть однозначно идентифицирован такими свойствами: «номер», «серия паспорта», «ИНН», «номер водительского удостоверения», «номер жетона». Для класса объектов «ДОЛЖНОСТЬ» могут быть выявлены следующие уникальные идентификаторы: «код», «название», «краткое название».
Необходимо отметить, что чем больше классов объектов будет выявлено в ходе анализа предметной области, тем более нормализованной затем будет структура реляционной базы данных.
Почти любое существительное в предметной области имеет право быть определено как класс объектов, поскольку почти каждое существительное имеет,
как минимум, набор из трех свойств: название объекта, краткое название объекта, числовой эквивалент названия объекта (код, номер, шифр).
Увидеть классы объектов можно подробно изучив на предприятии информационные потоки, подлежащие автоматизации.
Информационные потоки представлены документами.
Любой документ является кандидатом в класс объектов. Документ имеет шапку, в которой, как правило, указано название документа и дата его формирования.
Документ имеет информативную часть, в которой находятся качественные и количественные показатели.
В нижней части документа находятся фамилии и должности лиц, подписывающих документ.
На документе могут также быть расположены название, адрес и другие реквизиты предприятия, выпускающего документ.
Таким образом, изучая документ, можно увидеть и выделить следующие классы объектов: «ПРЕДПРИЯТИЕ/ ЮРИДИЧЕСКОЕ ЛИЦО» или
«СТРУКТУРНАЯ ЕДИНИЦА ПРЕДПРИЯТИЯ»; «ТИП СТРУКТУРНОЙ ЕДИНИЦЫ»; «АДРЕС»; «НАСЕЛЕННЫЙ ПУНКТ»; «ТИП НАСЕЛЕННОГО ПУНКТА»; «УЛИЦА»; «ТИП УЛИЦЫ» (улица, проспект, переулок, проезд и т.п.); «ДОКУМЕНТ»; «ПОЗИЦИЯ ДОКУМЕНТА»; «ФИЗИЧЕСКОЕ ЛИЦО»; «ДОЛЖНОСТЬ»; «ЗАПИСЬ О РАБОТЕ ФИЗИЧЕСКОГО ЛИЦА» (дата начала, дата окончания); «ТОВАР/ УСЛУГА»; «Объект» (учета).
Что представляет из себя класс объектов «ПОЗИЦИЯ ДОКУМЕНТА»? Любой документ обычно имеет несколько позиций (позиции приказа, позиции прайс—листа, позиции счета—фактуры, записи учетной карточки и тому подобное). Таким образом, видна существующая в предметной области связь типа 1:М: «каждый ДОКУМЕНТ должен иметь одну или более ПОЗИЦИЙ»; с обратной стороны связь читается - «каждая ПОЗИЦИЯ ДОКУМЕНТА должна относиться к одному и тому же ДОКУМЕНТУ». Кроме того, каждая позиция документа имеет свои собственные свойства — номер, какие—то количественные показатели (количество учетных единиц, цена за единицу и другие).
Для каждой предметной области можно увидеть обязательный для всех предметных областей перечень классов объектов. Каждая предметная область, в широком смысле слова, отображает работу какого—либо предприятия или организации - производственного предприятия, учебного или лечебного учреждения, торговой организации, склада, пункта проката, домашней экономической сферы и так далее. Название (полное или краткое) предприятия или организации фигурирует в различных выходных документах и отчетах. Таким образом, в предметной области присутствует класс объектов ПРЕДПРИЯТИЕ или СТРУКТУРНАЯ ЕДИНИЦА ПРЕДПРИЯТИЯ. Кроме того, зачастую необходимо вести учет адреса и телефона этого предприятия. В предметной области обязательно
присутствуют физические лица, занимающие те или иные должности, своими подписями фиксирующие учет (приход или расход) какого—либо объекта. При чем, для решения задач анализа данных и принятия затем соответствующих управленческих решений, для предметной области представляет интерес хранения знаний об истории учета состояния того или иного объекта. И ещё одна категория обязательных для каждой предметной области классов объектов - это документы, на основании которых и происходят все процессы в заданной предметной области.
Свести все итоги анализа предметной области в ходе выявления классов объектов и их свойств можно в виде формализованного описания, таблицы. Пример такого описания приведен в таблице 5.
Таблица 5 — Формализованное описание предметной области. Классы объектов, свойства.
Объект/ Свойство |
Уникальный иденти— фикатор |
Физические характерис— тики свойства (тип, длина) |
Опциональ— ность свойства (Да/ Нет) |
Логические ограничения свойства (диапазон значений, прописные, строчные буквы для символьных свойств и т.п.) |
Процессы для значений свойств |
ЧЕЛОВЕК |
|
|
|
|
|
таб.номер |
У1, П |
число, 10 |
Да |
<p>> 0 |
Г, Пр |
ИНН |
У2 |
число, 12 |
Нет |
<p>> 0 |
Вв, Пр, Об |
Имя |
|
симв., 25 |
Да |
Перв. буква заглавн. |
Вв, Пр, Об |
дата рожд |
|
дата |
Нет |
ДД.ММ.ГГГГ |
Вв, Пр, Об |
ДОЛЖНОСТЬ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В таблице использованы сокращения: У - уникальный идентификатор, П -кандидат в первичный ключ (главный уникальный идентификатор), Г - генерация данных, Вв - ввод данных, Пр - просмотр данных, Об - обновление данных.
Связи между классами объектов
Поскольку всё в этом мире связано, то параллельным шагом в ходе анализа предметной области, вместе с выявлением классов объектов и их свойств, является шаг выявления связей, ассоциаций, возникающих между классами объектов. Связи представляют информационные потребности и правила бизнеса на предприятии, их определение можно выразить следующим:
— именованная, значимая ассоциация между двумя классами объектов.
— отношение, которое имеет одна вещь к другой.
Рассматривая связь необходимо думать о ней как о двусторонней, двунаправленной.
Например, класс объектов «КАТЕГОРИЯ ДОЛЖНОСТИ» связан с классом объектов «ДОЛЖНОСТЬ». Класс объектов «ДОЛЖНОСТЬ» связан с классом объектов «КАТЕГОРИЯ ДОЛЖНОСТИ».
Каждая связь обладает определенными характеристиками.
Опциональность связи число. Это бизнес—правило, указывающее должна ли связь существовать для каждого объекта класса объектов (обязательная связь) или это не требуется (необязательная связь).
Например, на предприятии выявлено следующее правило: «каждой
конкретной категории должности может соответствовать должность». В некоторый момент времени на предприятии появляется документ о создании новой категории, но нет ещё ни одной должности, ссылающейся на эту категорию. Но с другой стороны есть и правило: «каждая должность на предприятии должна быть отнесена к одной и только одной должности». Таким образом, видно, что между двумя классами объектов («КАТЕГОРИЯ ДОЛЖНОСТИ» и «ДОЛЖНОСТЬ») выявлены две разные ассоциации.
Мощность (максимальное кардинальное число). Это бизнес правило, указывающее сколько таких связей существует - одна и только одна, или много. Если обнаружена связь, которая имеет мощность «ноль», эта связь необязательная.
Мы рассматриваем бинарные связи (могут быть разные)
Каждая сторона связи имеет имя. Это описание правил бизнеса.
Например: «соответствует», «относится к».
Имена часто составляют пары: «основан на» - «является основой для»; «приобретается у» - «поставляется»; «отвечает за» - «находится под ответственностью».
Имя имеет большое значение, оно показывает насколько хорошо понята взаимосвязь информации.
Увидев связь, необходимо убедиться в том, что она имеет смысл. Для этого её необходимо проговорить как обычное предложение в обе стороны (любая связь двусторонняя), используя правило произношения связи (таблица 6).
Таблица 6 - Правило чтения связи
Часть 1 |
Часть 2 |
Часть 3 |
Часть 4 |
Часть 5 |
Часть 6 |
Каждый (ая, ое) |
Имя первого класса объектов |
Опциональность связи (д.б. или м.б.) |
Имя связи |
Мощность связи (одна или много) |
Имя второго класса объектов |
Пример чтения связи: «каждое ФИЗИЧЕСКОЕ ЛИЦО может иметь ноль, одну или более ЗАПИСЕЙ ТРУДОВОЙ КНИГИ»; «Каждая ЗАПИСЬ ТРУДОВОЙ КНИГИ должна относиться к одному и только одному ФИЗИЧЕСКОМУ ЛИЦУ».
Рассмотрим более подробно существующие типы (мощности) связей.
1. Связь «один_ко_многим» (1:М). Это самый распространенный тип связи, имеющей мощность один и более в одном направлении и один и только один в
другом. Классы объектов, находящиеся в этой связи на стороне «один» называют главным или родительским. Класс объектов, находящийся на стороне «много» -подчиненным или потомком.
В большинстве случаев подчиненные классы объектов необязательны, а главные обязательны. То есть, объект главного класса объектов может существовать без подчиненного объекта, а подчиненный без главного нет.
С точки зрения базы данных это означает, что сначала в БД создается объект главного класса объектов, а потом объекты подчиненного. Если связь 1:М не обязательная с обеих сторон, объекты могут создаваться произвольно. Связи 1:М, обязательные с обеих сторон, очень редки и означают, что объекты двух классов объектов не могут существовать друг без друга.
Пример связи 1:М: «каждой СТРУКТУРНОЙ ЕДИНИЦЕ ПРЕДПРИЯТИЯ может соответствовать ноль, одна или более ЗАПИСЕЙ ТРУДОВОЙ КНИГИ». С обратной стороны: «Каждая ЗАПИСЬ ТРУДОВОЙ КНИГИ должна относиться к одной и только одной СТРУКТУРНОЙ ЕДИНИЦЕ ПРЕДПРИЯТИЯ».
2. Связь «многие_ко_многим» (М:М или M:N). Это тоже очень распространенный тип связи, особенно на начальных этапах анализа предметной области. Эта связь имеет мощность «один или более» в обоих направлениях. Пример такой связи: «в каждой СТРУКТУРНОЙ ЕДИНИЦЕ ПРЕДПРИЯТИЯ могут работать много ФИЗИЧЕСКИХ ЛИЦ». С обратной стороны: «каждое
ФИЗИЧЕСКОЕ ЛИЦО может работать во многих «СТРУКТУРНЫХ ЕДИНИЦАХ ПРЕДПРИЯТИЯ».
Большинство связей М:М необязательны в обоих направлениях, то есть объект одного класса объектов может существовать без привязки к объекту другого класса объектов, любой экземпляр может появиться первым. Связи М:М, обязательные с обеих сторон очень редки - объекты обоих классов объектов должны быть созданы одновременно.
Необходимо заметить, что в любой предметной области нет связей «многие_ко_многим», в каждый момент времени всё определяется однозначно. Появление такой связи в проектной документации показывает, что предметная область не дообследована. Связь М:М может быть «разорвана» каким—либо документом или позицией документа. Такой класс объектов, разрывающий связь М:М называют «сущностью пересечения». Необходимо только увидеть, найти этот класс объектов. Для выше приведенного примера связи М:М таким классом объектов является «ЗАПИСЬ ТРУДОВОЙ КНИГИ». Если мы его выявили, то связи в предметной области уже звучат так: «каждой СТРУКТУРНОЙ ЕДИНИЦЕ ПРЕДПРИЯТИЯ может соответствовать ноль, одна или более ЗАПИСЕЙ ТРУДОВОЙ КНИГИ». С обратной стороны: «каждая ЗАПИСЬ ТРУДОВОЙ КНИГИ должна относиться к одной и только одной СТРУКТУРНОЙ ЕДИНИЦЕ ПРЕДПРИЯТИЯ». И ещё одна связь: «каждому ФИЗИЧЕСКОМУ ЛИЦУ,
работающему на предприятии, может соответствовать ноль, одна или более ЗАПИСЕЙ ТРУДОВОЙ КНИГИ».
3. Связь «один_к_одному» (1:1). Редкая связь, обычно с точки зрения бизнеса это означает, что это не два класса объектов, а один. Эта связь может иметь мощность один и только один в обоих направлениях. Если обнаружится такая связь, следует ещё раз исследовать информационные потоки и может выясниться, что два выявленных класса объектов фактически составляют один.
Пример связи 1:1: «каждый ВЕЛОСИПЕД может использоваться только одним ЧЛЕНОМ КЛУБА». С обратной стороны: «каждый ЧЛЕН КЛУБА может ездить только на одном ВЕЛОСИПЕДЕ»
Связи 1:1, обязательные на обоих концах, когда оба объекта должны появляются одновременно, очень редки.
После выявления любой связи между классами объектов необходимо (для каждой её стороны):
— установить наличие;
— выбрать имя;
— определить мощность;
— определить опциональность;
— проверить путем чтения.
Необходимо заметить, что между двумя классами объектов может быть выявлено сколь угодно много связей. Например, между классами объектов «ФИЗИЧЕСКОЕ ЛИЦО» и «АДРЕС» может быть выявлено 2 связи: одна фиксирующая адрес прописки, другая - адрес проживания.
4. Рекурсивная связь. Связь между объектами одного класса объектов. Такая связь может обладать всеми свойствами, присущими любой другой связи.
Пример: Каждый УЗЕЛ может выступать в качестве родителя для одного или более УЗЛОВ. Каждый УЗЕЛ может подчиняться одному и только одному УЗЛУ.
Свести итоги выявления связей можно с помощью следующей таблицы:
Таблица — Формализованное описание предметной области. Связи между классами объектов
В таблице использованы следующие сокращения: КО - класс объектов; Д.б. -должна быть, М.б. - может быть.
Выявленные связи проверяются путем чтения. Необходимо помнить, что каждая связь двусторонняя!
Неформализованное описание предметной области
В процессе анализа также необходимо зафиксировать бизнес правила или семантические (смысловые) утверждения, ограничивающие предметную область в рамках решаемой задачи. Это не функции предприятия, как таковые, а непреложные факты, которым всегда должна подчиняться разрабатываемая автоматизированная информационная система.
Примеры семантических утверждений:
— «На работу принимаются служащие, достигшие 16—ти летнего возраста»;
— «Любой сотрудник не может отвечать одновременно более чем за десять сдаваемых в аренду или продаваемых объектов недвижимости»;
— «Любой сотрудник не имеет права продавать или сдавать в аренду свою собственную недвижимость»;
— «Специальные скидки не распространяются на автомобили возрастом менее одного года»;
— «Общая сумма скидок не может превышать 40% чистой суммы, указанной в счете—фактуре».
Выявленные семантические утверждения записываются на естественном языке и должны быть далее отражены в БД. Как правило, подобные правила реализуются с помощью таких объектов БД, как триггеры, процедуры, просмотры (представления).
Скачать лекцию:
Пароль на архив: privetstudent.com