Автоматизированное рабочее место руководителя производственного подразделения ремонтного предприятия

0

3 Анализ показателей работы сотрудников для установления квалификационной группы

3.1 Математическая постановка задачи и выбор метода решения

Необходимо сгруппировать работников организации, на группы по показателям характеризующих их работу, такие как производительность труда, часовая заработная плата, стаж работы, для того чтобы принять решение об установлении сотрудникам квалификационной группы.

Решение поставленной задачи можно осуществить с помощью следующих методов:

– факторный анализ;

– дискриминантный анализ;

– кластерный анализ.

Факторным анализом называют совокупность методов, которые позволяют выявлять латентные (скрытые, неявные) обобщающие характеристики структуры и механизма развития изучаемых явлений и процессов на основе существующих связей признаков (или объектов). Факторный анализ позволяет сгруппировать и выделить основные факторы, влияющие на изучаемое явление. В основе моделей факторного анализа лежит гипотеза, что наблюдаемые переменные являются косвенными проявлениями небольшого числа скрытых (латентных) факторов. Хотя такую идею можно приписать многим методам анализа данных, обычно под моделью факторного анализа понимают представление исходных переменных в виде линейной комбинации факторов [7]. Основной задачей факторного анализа считается сжатие исходного массива переменных, так как число латентных факторов обычно значительно меньше числа исходных признаков. Факторный анализ основывается на матрице корреляций между переменными. Каждый полученный латентный фактор состоит из тех переменных, которые имеют тесную взаимную корреляцию [8].

Дискриминантный анализ, является обобщенным термином, относящимся к нескольким тесно связанным статистическим процедурам. В конкретных ситуациях не обязательно использовать все эти процедуры. Их можно разделить на методы интерпретации межгрупповых различий и методы классификации наблюдений по группам [9]. Речь идет об интерпретации, когда рассматриваются различия между классами. Метод, относящийся к классификации, связан с получением одной или нескольких функций, обеспечивающих возможность отнести данный объект к одной из групп. Эти функции, называемые дискриминантными, зависят от значений характеристик таким образом, что появляется возможность отнести каждый объект к одной из групп. Таким образом, данный анализ используется для разбиения исходных данных на группы с целью обнаружить общую структуру, исходя из набора измерений. Кроме того, данный метод также может быть использован для того, чтобы определить, какие переменные вносят вклад в эту классификацию. Основной задачей дискриминантного анализа является исследование групповых различий – различение (дискриминация) объектов по определенным признакам. Все процедуры данного анализа можно разбить на две группы: первая группа позволяет интерпретировать различия между имеющимися группами (сравнивая средние), вторая – проводить классификацию новых объектов в тех случаях, когда неизвестно заранее, к какому из существующих классов они принадлежат.

Кластерный анализ – это общее название множества вычислительных процедур, используемых при создании классификации. В результате работы с процедурами образуются «кластеры» или группы очень похожих объектов. Более точно, кластерный метод – это многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы [10].

Все исследования, использующие кластерный анализ, характеризуют следующие основные этапы:

– отбор выборки для кластеризации;

– определение множества признаков, по которым будут оцениваться объекты в выборке;

– вычисление значений той или иной меры сходства между объектами;

– применение метода кластерного анализа для создания групп сходных объектов;

– проверка достоверности результатов кластерного решения.

Каждый из перечисленных этапов играет существенную роль при использовании кластерного анализа в прикладном анализе данных.

Задача кластерного анализа формулируется как выделение «сгущений точек», разбиение совокупности на однородные подмножества объектов. Объекты в каждом кластере должны быть похожи между собой и отличаться от объектов в других кластерах [11].

В отличие от дискриминатного в кластерном анализе заранее не задаются классы объектов и их свойства. Разбиение объектов на группы проводится автоматически по некоторому критерию. При этом число классов может заранее фиксироваться, либо определяться в процессе расчетов. Основная трудность реализации кластерного анализа заключается в выборе и обосновании критерия, который позволял бы оценивать качество того или иного разбиения на классы.
Все предложенные критерии так или иначе сводятся к оценке расстояния между объектами в одной группе и между группами объектов в многомерном пространстве исходных переменных [12]. При этом все критерии дают приблизительно одинаковый результат, если имеются четко выраженные, удаленные друг от друга группы объектов. При отсутствии четкой структуры в делении объектов на группы ни один из критериев не дает удовлетворительного результата и остается неясным, является ли найденное разбиение действительно единственным и наилучшим и соответствует ли оно какому-либо объективному критерию.

В дискриминантном анализе необходима предварительная информация о кластерной (групповой) принадлежности каждого рассматриваемого объекта или события для того, чтобы разработать правило классификации. В отличие от этого, в кластерном анализе нет необходимости в предварительной информации о кластерной принадлежности любого из объектов. Группы, или кластеры, определяют с помощью собранных данных, а не заранее.

Кластерный анализ наиболее ярко отражает черты многомерного анализа в классификации, а факторный анализ – в исследовании связи.

Большое достоинство кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков. Кроме того, кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов, и позволяет рассматривать множество исходных данных практически произвольной природы.

Из выше перечисленных методов наиболее подходящим для поставленной задачи является кластерный анализ данных.

3.2 Описание метода и алгоритма решения задачи

Кластерный анализ позволяет разделить исходный набор исследуемых объектов на группы объектов таким образом, чтобы каждый объект был более схож с объектами из своей группы, чем с объектами других групп. Анализируя в дальнейшем полученные группы, называемые кластерами, можно определить, чем характеризуется та или иная группа, принять решение о методах работы с объектами различных групп. При помощи параметров кластерного анализа пользователь может настроить алгоритм, по которому будет производиться разбиение, а также может динамически изменять состав характеристик, учитываемых при анализе, настраивать для них весовые коэффициенты [13].

Результат кластеризации может быть выведен в дендрограмму – специальный вид диаграммы, предназначенный для графического отображения результатов анализа.

В основе данного анализа лежит вычисление расстояния между объектами. Именно исходя из расстояний между объектами и производится их группировка по кластерам. Определение расстояния может проводиться разными способами (по разным метрикам). Существуют сле­дующие метрики:

– евклидова метрика;

– евклидова метрика в квадрате;

– метрика города;

– мера сходства Хэмминга;

– манхэттенская метрика;

– расстояние Журавлева;

– метрика доминирования.

После определения расстояний между объектами может использоваться один из нескольких алгоритмов распределения объектов по кластерам. Существуют сле­дующие методы кластеризации:

– ближняя связь;

– дальняя связь;

– центр тяжести;

– «k средних»;

– метод невзвешенного попарного среднего;

– метод взвешенного попарного среднего;

– метод Варда.

Рассмотрим некоторые метрики определение расстояния между объектами.

С помощью евклидовой метрики расстояние между двумя объектами вычисляется по формуле:

Расстояние (3.1)

где – значения атрибутов двух объектов (между кото­рыми определяется расстояние);

– весовой коэффициент атрибута (устанавливается в колонке анализа);

– номер атрибута, от 1 до

– число атрибутов.

С помощью евклидовой метрики в квадрате расстояние между двумя объектами вычисляется по формуле:

Расстояние = (3.2)

где – значения атрибутов двух объектов (между кото­рыми определяется расстояние);

– весовой коэффициент атрибута (устанавливается в колонке анализа);

– номер атрибута, от 1 до

– число атрибутов.

С помощью метрики города расстояние между двумя объектами вычисляется по формуле:

Расстояние = (3.3)

где – значения атрибутов двух объектов (между кото­рыми определяется расстояние);

– весовой коэффициент атрибута (устанавливается в колонке анализа);

– номер атрибута, от 1 до

– число атрибутов.

С помощью метрики доминирования расстояние между двумя объектами вычисляется по формуле:

Расстояние (3.4)

где – значения атрибутов двух объектов (между кото­рыми определяется расстояние);

– весовой коэффициент атрибута (устанавливается в колонке анализа);

– номер атрибута, от 1 до

– число атрибутов.

Вариант метода кластеризации определяет, исходя из каких «принципов» объект соотносится к той или группе, по какому алгоритму производится формирование кластеров. Рассмотрим некоторые из методы кластеризации.

Можно сказать, что целью любого алгоритма кластеризации является:

– минимизировать изменчивость внутри кластеров;

– максимизировать изменчивость между кластерами.

С помощью метода кластеризации – ближняя связь объект присоединяется к той группе, для которой расстояние до ближайшего объекта минимально.

С помощью метода кластеризации – дальняя связь объект присоединяется к той группе, для которой расстояние до наиболее дальнего объекта минимально.

Метод центр тяжести. Метод кластеризации, в котором объект присоединяется к той группе, для которой расстояние до центра тяжести минимально.

В методе «k средних» выбираются объекты, находящиеся первыми в выборке. Они считаются центрами кластеров. Далее выбирается следующий объект и, в соответствии с расстоянием до центров кластеров, относится к тому или кластеру. Центр кластера, к которому был добав­лен объект, пересчитывается. Процедура повторяется до полного перебора всех объектов. Далее опять производится новая выборка объектов (начиная с первого). Процедура повторяется до тех пор, пока изменяются центры кластеров.

При использовании метода Варда в качестве расстояния между кластерами берется прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения. В отличие от других методов кластерного анализа для оценки расстояний между кластерами, здесь используются методы дисперсионного анализа. На каждом шаге алгоритма объединяются такие два кластера, которые приводят к минимальному увеличению целевой функции, то есть внутригрупповой суммы квадратов. Этот метод направлен на объединение близко расположенных кластеров и «стремится» создавать кластеры малого размера.

Метод невзвешенного попарного среднего в качестве расстояния между двумя кластерами берется среднее расстояние между всеми парами объектов в них. Этот метод следует использовать, если объекты действительно происходят из различных классов, в случаях присутствия кластеров зависимого типа, при предположении неравных размеров кластеров.

Метод взвешенного попарного среднего похож на метод невзвешенного попарного среднего, разница состоит лишь в том, что здесь в качестве весового коэффициента используется размер кластера (число объектов, содержащихся в кластере). Этот метод рекомендуется использовать именно при наличии предположения о кластерах разных размеров.

Для решения поставленной задачи, используются четыре типа метрики: евклидова метрика, евклидова метрика в квадрате, метрика города, метрика доминирования; и следующие методы кластеризации: ближняя связь, дальняя связь, центр тяжести, «k средних».

Схема решения поставленной задачи, а именно механизм проведения кластерного анализа представлен на рисунке 3.1.

Рисунок 3.1 – Укрупненная схема решения задачи анализа показателей

работы сотрудников

Источником данных для решения поставленной задачи является входная информация о производительности труда, часовой заработной плате, стаже работы каждого сотрудника. Параметры анализ данных устанавливаются в процессе настройки отчетной формы пользователем, а именно, задается количество кластеров, тип метрики и метод кластеризации, а так же предусмотрены, заданные по умолчанию параметры. По итогам кластеризации формируется результата анализа: информация о данных, количество кластеров, принадлежность объекта к кластеру, центры кластеров, расстояние между кластерами.

3.3 Описание программной реализации метода

На первом этапе кластерного анализа данных в системе «1С : Предприятие 8.1» необходимо задать тип анализа (АнализДанных-Кластеризация), который устанавливается программно, листинг программы представлен в приложении Д.

На «вход» объекту АнализДанных подается источник данных. В качестве источника выступает результат запроса, позволяющего выбрать данные из регистра накопления «РезультатыПоказателейРаботыСотрудников», имеющего следующие поля: сотрудник, часовая производительность труда, часовая заработная плата, стаж работы. Данный регистр формируется перед началом процедуры кластерного анализа: необходимые для расчета данные, а именно, период, сотрудник, время по наряду, фактическое отработанное время, берутся из регистра накопления «ВыработкаСотрудниковЗарплата», а из справочника «Сотрудники», берется стаж работы, затем в цикле для каждого сотрудника рассчитываются данные необходимые для проведения анализа и заносятся в регистр накопления «РезультатыПоказателейРаботыСотрудников».

Колонки источника определяются как входные, все значения колонок содержатся в системном перечислении ТипКолонкиАнализаДанныхКласте-ризация.

Кластерный анализ производится в соответствии с установленными параметрами анализа. Пользователь может самостоятельно производить настройку параметров анализа, выбирая тип метрики, метод кластеризации и устанавливая количество кластеров. В зависимости от этого в коде программы производится проверка условий, выбранных пользователем, и программно задается тип метрики (Анализ.Параметры.МераРасстояния.Значение = ТипМе-рыРасстоянияАнализаДанных.ЕвклидоваМетрикаВКвадрате), метод кластери-зации (Анализ.Параметры.МетодКластеризации.Значение = МетодКластериза-ции.КСредних), количество кластеров (Анализ.Параметры.КоличествоКлас-теров.Значение=ЭлементыФормы.ПолеВвода1.Значение). После чего необходимо выполнить анализ (Анализ.Выполнить()).

После выполнения анализа данные выводятся на форму в поле табличного документа, в котором отображаются следующие результативные данные:

– кластеры, с указанием количества кластеров, количество объектов относящихся к соответствующему кластеру, и процентном соотношении распределенных объектов;

– центры кластеров с разбивкой по всем параметрам;

– расстояния между кластерами;

– таблица классификации;

– дендрограмма.

Кроме этого таблица классификаций отображается на новой форме в таблице значений, в которой при нажатии на кнопку «Печать» открывается, результирующая отчетная форма с указанием сотрудника и номера кластера представленного на рисунке И.6.

3.4 Анализ полученных результатов

Выполнение кластерного анализа данных показателей работы сотрудников приведет к тому, что в качестве начальных установок анализа данных будут опреде­лены следующие значения, установленные пользователем системы, представленные на рисунке 3.2.

Состав колонок определился исходя из состава полей вы­борки запроса. По умолчанию они определены с равным «весом». Для поля «ФИО» определен дискретный тип данных, а для производительности труду, часовой заработной платы, стажа работы установлен непрерывной тип, так как эти данные характеризуются числовым значением.

Рисунок 3.2 – Параметры кластерного анализа,

Выборка данных, для которых будет произведен анализ, имеет следующее наполнение, представленное в таблице 3.1.

Таблица 3.1 – Исходные данные для анализа

ФИО

Производительность

труда (час)

Часовая зарплата (руб.)

Стаж

работы (лет)

Замовкин И.И.

1,21

108,42

2,6

Абрамов С.Г.

0,6

53,53

1,4

Зимсков П.П.

0,53

47,23

1,6

Бизик А.В.

0,52

46,1

2,1

Жуков А.А.

0,51

45,84

4,5

Кайрушев М.П.

0,42

37,47

2,5

Абдулин А.Г.

0,4

35,87

1,6

Дубинин И.И.

0,37

32,86

1,7

Ахматенко А.И.

0,29

26,23

1,3

Кирилов К.А.

0,26

23,26

3,4

В результате анализа получаются данные именно о найденных стандартных кластерах (их количество, центры, расстояния между ними). По итогам стандартного анализа нет возможности получить данные о том, какие объекты в какие кластеры входят, необходимо дописывать конфигурацию.

Результат кластерного анализа, полученного в виде кластеров, представлен в таблице 3.2.

Таблица 3.2 – Результат кластерного анализа в виде кластеров

№ кластера

Количество

объектов

Процент

1

6

60

2

3

30

3

1

10

Результат кластерного анализа, полученного в виде центров кластеров, представлен в таблице 3.3.

Таблица 3.3 – Результат кластерного анализа в виде центров кластеров

Поле \ Кластер

1

2

3

1

2

3

4

ФИО = Абдулин А.Г.

0,1667


Продолжение таблицы 3.3

1

2

3

4

ФИО = Абрамов С.Г.

0,3333

ФИО = Ахматенко А.И.

1,0000

ФИО = Бизик А.В.

0,1667

ФИО = Дубинин И.И.

0,1667

ФИО = Жуков А.А.

0,1667

ФИО = Замовкин И.И.

0,3333

ФИО = Зимсков П.П.

0,3333

ФИО = Кайрушев М.П.

0,1667

ФИО = Кирилов К.А.

0,1667

ПТ

0,4133

0,7800

0,2900

ЧасоваяЗП

36,9000

69,7267

26,2300

СтажРаботы

2,6333

1,8667

1,3000

Результат кластерного анализа, полученного в виде расстояния между кластерами, представлен в таблице 3.4.

Таблица 3.4 – Результат кластерного анализа в виде расстояния между кластерами

Кластеры

1

2

3

1

4,7903

3,2834

2

4,7903

8,2387

3

3,2834

8,2387

Результат кластерного анализа, полученного в виде таблица классификации, представлен в таблице 3.5.

Таблица 3.5 – Результат кластерного анализа в виде таблица классификации

ФИО

Производительность

труда (час)

Часовая зарплата (руб.)

Стаж

работы (лет)

Кластер

1

2

3

4

5

Замовкин И.И.

1,21

108,42

2,6

1

Абрамов С.Г.

0,6

53,53

1,4

1


Продолжение таблицы 3.5

1

2

3

4

5

Зимсков П.П.

0,53

47,23

1,6

1

Бизик А.В.

0,52

46,1

2,1

2

Жуков А.А.

0,51

45,84

4,5

2

Кайрушев М.П.

0,42

37,47

2,5

2

Абдулин А.Г.

0,4

35,87

1,6

2

Дубинин И.И.

0,37

32,86

1,7

2

Ахматенко А.И.

0,29

26,23

1,3

3

Кирилов К.А.

0,26

23,26

3,4

2

В результате проведенного кластерного анализа показателей работы сотрудников, можно увидеть, что все работники фирмы разделились на три группы. К первой группе относятся сотрудники с наилучшими показателями по производительности труда, часовой заработной плате, ко второй с показателями немного пониже и так далее. По данным результатам анализа можно установить квалификационную группу.

Категория: Дипломные работы / Дипломные работы по экономике

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.