Планирование и организация эксперимента

0

Министерство образования и науки Российской Федерации

 

 

 

КУРСОВАЯ РАБОТА

 

 Планирование и организация эксперимента

 

 

 

 

Содержание

 

Введение………………………………………………………………………………...3
1    Построение гистограммы, расчет количественных характеристик, проверка

гипотезы нормальности распределения….…………………………………………...4

1.1 Плотность распределения. Гистограмма…...……………………………………..4

1.2 Исходные данные......................................................................................................4

1.3 Построение гистограммы……………………………………………………. ….....4

1.4 Количественные характеристики распределения…………...…………................5

1.5 Нормальное распределение……..…………………………………………............7

1.6 Проверка гипотезы нормальности распределения………..……………………...9

2    Статическое оценивание и проверка количественных оценок………………...11

2.1 Проверка средних значений……………………………………………………...11

2.2 Проверка ошибок при оценке дисперсии………………………………………..14

2.3 Проверка различных средних арифметических…….…………………………..14

2.4 Статистическое оценивание количественных значений………………………..15

2.5Статистическая проверка доли дефектных изделий в генеральной совокупности

…………………………………………….…………………………………………....16

3     Корреляционный и регрессионный анализ……………………………………..17

3.1 Корреляционный анализ….……………………………………………………....17

3.2 Регрессионный анализ…..…………………………………………………….......19

3.3 Пример выполнения парного корреляционного и регрессионного анализа….20

4    Планирование эксперимента……………………………………………………..24

  • Полный факторный эксперимент………………………...………………… …....25
  • Дробный факторный эксперимент…..………………………………………...….29

Заключение…..………………………………………………………………………...32

Список использованных источников………….……………………………………..33


 

Введение

Планирование и организация эксперимента играет большую роль в современном мире. Оно имеет практическое значение в различных сферах деятельности человека.

Планирование и организация эксперимента позволяет повысить эффективность статистических методов контроля качества и управления качеством, широко применяемых в настоящее время во многих странах.

Наряду с контролем продукции нередко требуется провести контроль параметров технологических процессов. Эта задача может быть решена путем проверки статистических гипотез. Однако, наибольшего эффекта, можно добиться не контролем параметров качества, а такой организацией производственных процессов, при которой брак продукции не производится.

Поэтому целью данной курсовой работы является ознакомление с основными этапами планирования эксперимента и применение их на практике для определения вида распределения генеральной совокупности и определения ее основных параметров, а также для проведения регрессионного анализа.

 

1 Построение гистограммы, расчет количественных характеристик, проверка гипотезы нормальности распределения

 

1.1 Плотность распределения. Гистограмма

 

Одним из способов графического изображения плотности распределения является гистограмма (столбиковая диаграмма). Это такой вид диаграммы, который при помощи столбиков, расставленных в ряд на мелких размерных интервалах, отражает состояние качества проверенной партии изделий и помогает разобраться в состоянии измерений или качества изделий в генеральной совокупности, выявить в ней положение среднего значения и характер рассеивания.

 

 

1.2 Исходные данные

Из исходной таблицы чисел был убран шестой столбец и пятая строка, что соответствует двум последним цифрам номера зачетной книги. Полученные результаты исходных данных приведены в таблице 1.

 

Таблица 1 - Коэффициенты   деформации   деталей   в процессе термообработки

 

1

2

3

4

5

6

7

8

9

1

0,9

1,5

0,9

1,1

0,9

1,1

1,1

1,2

1,0

2

0,6

0,1

0,7

0,8

0,3

0,5

0,8

1,2

0,6

3

0,5

0,8

0,3

0,4

1,0

1,1

0,6

1,2

0,4

4

0,6

0,7

0,5

0,2

0,3

0,5

0,4

1,0

0,8

5

0,7

0,8

0,3

0,4

0,7

1,1

0,7

1,2

0,8

6

1,0

0,9

1,0

1,2

0,9

1,3

1,2

1,4

1,0

7

1,4

1,4

0,9

1,1

1,4

0,9

1,8

0,9

1,4

8

1,1

1,4

1,4

1,4

1,1

1,4

1,1

1,3

1,1

9

1,5

1,6

1,6

1,5

1,5

1,6

1,7

1,8

1,5

 

Рассматривая таблицу 1, можно понять, что одним зрительным восприятием этих данных невозможно получить достоверную информацию о состоянии качества изделий в генеральной совокупности. Отсюда следует, что эти данные необходимо упорядочить. В такой ситуации лучше всего составлять гистограмму.

 

1.3 Построение гистограммы

1)  среди измеренных значений находим максимальное Xmax и минимальное Xmin значения и определяем широту распределения по формуле R = Xmax -Xmin. В данном случае R =1,8 - 0,1 = 1,7;

  • определяем количество интервалов (классов) к === 9, где n- число наблюдений;
  • делим широту распределения Rна количество интервалов, полученный результат округляем и принимаем за широту интервала

h = R/k = 1,7/9 = 0,188 ~ 0,2;

  • размечаем в бланке регистрации (Таблица 2) интервалы варьирования, устанавливая граничные значения с конца одной из сторон, а также вписываем значения середины интервалов;

Таблица 2-Бланк регистрации

№ п/п

Интервалы

Значения середины интервалов

Подсчет частот

Частоты f

Накопленные частоты

1

0,1-0,3

0,2

IIII I

6

6

2

0,3-0,5

0,4

IIII III

8

14

3

0,5-0,7

0,6

IIII IIII

9

23

4

0,7-0,9

0,8

IIII  IIII  IIII

14

37

5

0,9-1,1

1,0

IIII  IIII  IIII I

16

53

6

1,1-1,3

1,2

IIII III

8

61

7

1,3-1,5

1,4

IIII  IIII  IIII

14

74

8

1,5-1,7

1,6

IIII

5

79

9

1,7-1,9

1,8

II

2

81

 

  • просмотрим таблицу 1 по порядку от первой до последней строчки и при чтении каждого результата соответствующую метку (черточку) заносим в тот класс, к которому относится данное наблюдение. Каждый знак IIIIсоответствует пяти наблюдениям, поэтому подсчет частот значительно облегчается;
  • по оси абсцисс наносят границы интервалов, а по оси ординат шкалу для частот. Над интервалами вычерчивают прямоугольники, высота которых пропорциональна частотам.

 

Рисунок 1.1. – Гистограмма

1.4   Количественные характеристики распределения

 

Среднее арифметическое

Предположим, что в результате измерений получены величины х1, х2, х3, . . . , хп, число которых равно n. Тогда среднее арифметическое X определяют по следующей формуле:

(1.1)

 

В тех случаях, когда измеряемые величины разделяют на интервалы, то, обозначив значения середины каждого интервала через хj1, х2, х3,..., хк, а частоту в этих интервалах соответственно через fj = f1, f2 ,….. , fk , среднее арифметическое х вычисляют по следующей формуле:

 

                                      (1.2)
 

 

 Рассеивание значений

Для количественной оценки рассеивания значений часто используют сумму квадратов отклонений, дисперсию, среднее квадратическое отклонение.

Сумма квадратов отклонений S

Отклонением называют разницу между каждым измеренным значением величины и ее средним арифметическим (xi - ). Если применить это ко всем измеренным данным, то полученная сумма возведенных в квадрат отклонений и будет представлять собой сумму квадратов (отклонений) S:

 

                                        (1.3)

S=13.990

Дисперсия

Если сумма квадратов отклонений S выражает рассеивание значений во всем комплексе данных, то дисперсия , полученная делением S на число n -1 данных, является мерой рассеивания на каждую отдельную единицу данных:

 

             (1.4)

=

 

Среднее квадратическое отклонение

Взятый с положительным знаком квадратный корень из дисперсии называют средним квадратическим отклонением:

    (1.5)

 

1.5 Нормальное распределение

При большом числе данных соответственное сужение интервалов в распределении влечет за собой постепенное приближение гистограммы к гладкой кривой. Если же число данных будет беспредельно большое, то гистограмма превратится в безукоризненную кривую. В этом случае кривая может рассматриваться в качестве распределения генеральной совокупности (Рисунок 1.1).

Если кривая распределения имеет тенденцию в центре обнаруживать один пик, причем симметрично справа и слева от среднего арифметического она принимает форму колокола, то такую кривую называют нормальным распределением, или распределением Гаусса.

Закон, или функцию нормального распределения выражают следующей формулой

                               (1.6)

 

где   µ - среднее арифметическое распределения;

                   σ – среднее квадратическое отклонение.

Величины µ и σ называют параметрами распределения. Для удобства вычисления функции распределения у = f (х) случайные величины нормируют по формуле:

 

(1.7)

 

Рисунок 1.1 – Нормальное распределение

 

Нормальное распределение с параметрами µ = 0 и σ =1 называется нормированным нормальным распределением (Рисунок 1.2). Функция нормального нормированного распределения примет вид:

 

                                            (1.8)

Рисунок 1.2 – Нормированное нормальное распределение

 

При анализе качества продукции количество замеров не всегда бывает достаточным для определения законов распределения. Но если заранее известен закон распределения, то для определения важнейших числовых характеристик распределения нужно небольшое количество замеров. В том случае, когда закон распределения случайной величины близок к нормальному, для обработки результатов опытов необходимо определение двух статистических оценок параметров распределения:  и . В связи с этим, проверка нормальности распределения составляет основное содержание предварительной обработки результатов эксперимента.

 

1.6 Проверка гипотезы нормальности распределения

 

Некоторое представление о близости эмпирического распределения к нормальному дает анализ показателей асимметрии и эксцесса. Показатель асимметрии определяют по формуле:

                                                      (1.9)

где m3=- третий центральный момент;                           (1.10)

- среднее квадратическое отклонение.                  (1.11)

 

A=  

 

Показатель эксцесса определяют по формуле:

                                                 (1.12)

где m4=- четвертый центральный момент.                   (1.13)

m4=  

Э=  

Для симметричных распределений m3 = 0, m/4 = 3, следовательно, А = 0 и Э = 0.

Несмещенные оценки для показателей асимметрии и эксцесса находят по формулам:

                                        (1.14)

 

                              (1.15)

 

Для проверки гипотезы нормальности распределения следует также вычислить среднеквадратические отклонения для показателей асимметрии и эксцесса:

                                 (1.16)

 

 

                    (1.17)

 

                |A*|=|0.015|   <   3σA=0.801;      |Э*|=|-0.850|   <   5σЭ=2.56     

С целью упрощения необходимые для расчета данные сводим в таблицу (Таблица1.3).

 

Таблица 1.3 - Вычисление количественных характеристик

№ п/п

Интервалы варьирования

Середины

интервала

Частота

f;

fixi

 

 

 

 

 

fi

 

fi

 

fi

1

0,1-0,3

0,2

6

1.2

-0.741

0.549

-0.407

0.301

3,294

-2,442

1,809

2

0,3-0,5

0,4

8

3.2

-0.541

0.292

-0.158

0.086

2,336

-1,264

0,685

3

0,5-0,7

0,6

9

5.4

-0.341

0.116

-0.039

0.013

1,044

-0,351

0,122

4

0,7-0,9

0,8

14

11.2

-0.141

0.019

-0.003

0.0004

1,266

-0,042

0,005

5

0,9-1,1

1,0

16

16

0.059

0.003

0.0002

0.00001

0,048

0,003

0,0002

6

1,1-1,3

1,2

8

9.6

0.259

0.067

0.017

0.004

0,536

0,136

0,359

7

1,3-1,5

1,4

14

19.6

0.459

0.211

0.097

0.044

2,954

1,358

0,621

8

1,5-1,7

1,6

5

8

0.659

0.434

0.188

0.124

2,17

0,94

0,621

9

1,7-1,9

1,8

2

3.6

0.859

0.738

0.634

0.544

1,476

1,268

1,089

 

 

81

77,8

 

 

 

5,311

                         

 

Вывод:  Так как |A*| < 3σA  и  |Э*| < 5σЭ, следовательно, данное распределение можно отнести к нормальному.


 

2 Статистическое оценивание и проверка количественных оценок

 

Выбор правильного решения из двух противоположных предположений о генеральной совокупности называется статистической проверкой.

Предположительная количественная оценка параметра генеральной совокупности называется статистическим оцениванием.

 

2.1. Проверка средних значений

 

2.1.1 Ситуация, когда среднее арифметическое по совокупности µ и дисперсия генеральной совокупности σ2  известны

В практической деятельности ситуация, когда  µ и σ2 генеральной совокупности уже известны, встречаются редко. Однако, такую ситуацию можно приближенно заменить ситуацией, при которой из многочисленных данных статистически управляемого технологического процесса можно определить среднее арифметическое и дисперсию. Ниже рассмотрим ситуацию, когда проверяют, действительно ли n-ное количество данных, которые считаются взятыми из генеральной совокупности, имеющей нормальное распределение, взяты из этой генеральной совокупности.

Порядок проверки гипотез:

  • Строят нулевую гипотезу (ее обозначают Ho).

Ho: µ1 = µ2 (n-е количество данных взято из идентичной генеральной совокупности, имеющей нормальное распределение).

  • Выдвигают альтернативную гипотезу:

Н1 1 ≠ µ2 (п-е количество данных было взято не из идентичной генеральной совокупности).

  • Выбирают тип распределения, исходя из гипотезы 1 принимают нормальное распределение N(µ,σ2).
  • Вычисляют статистическую оценку

 

                                                (2.1)

 

5     Принимают решение о проведении двухсторонней либо односторонней проверки гипотез.

Разграничение области 5%, 1%-ного уровня значимости и т.д. называют областями отклонения гипотезы. На рисунке 2.1 они заштрихованы. Эти области отклонения иногда берут по обе стороны распределения, а иногда по одну сторону. Например, в отличие от нулевой гипотезы.

 

µ1 = µ2 если предположить, что альтернативная гипотеза будет µ1 ≠ µ2 то область отклонения берут с двух сторон, если же предположить, что она µ1 > µ2 или µ1 < µ2, то берут только с одной стороны. Такие проверки гипотез соответственно называют двухсторонней или односторонней проверкой.

6 Принимают решение отклонить или принять нулевую гипотезу.

После того, как будут найдены числовые значения величин, соответствующие 5% или 1%-ному уровню значимости, их сравнивают со статистическими оценками, полученными в результате вычислений, и выносится решение.

Если значение

U0 < Uα

 

 

 
   

 

 


расхождения не являются значимыми

 

 

нулевая гипотеза принимается

 

 

Если значение

U0.01, >U0 > U0.05

 

расхождения являются значимыми

 

 

альтернативная гипотеза принимается

 

 

 

Если значение

 U0 > U0,01

 

расхождения имеют высокую степень значи­мости

 

альтернативная гипотеза принимается

 

2.1.2 Ситуация, когда известно только среднее арифметическое генеральной совокупности µ

Поскольку дисперсия генеральной совокупности σ2 неизвестна, необходимо пользоваться ее предположительной оценкой, исходя из выборочных данных. А именно, осуществляют проверку над µ используя  и основываясь на t-распределении (Стьюдента):

1 Строят нулевую гипотезу:

         Ho12

  • Строят альтернативную гипотезу:

Н1: µ1≠µ2 (двухсторонняя проверка),

µ12 или µ1<µ2 (односторонняя проверка).

  • Выбирают распределение для проверки статистических оценок. Поскольку σ   неизвестно,   проводят   проверку,   используя   σe и основываясь на t-распределении.
  • Вычисляют статистические оценки

 

                                                (2.2)

5 Сравнивая значение из таблицы t-распределения (для соответствующей степени свободы Ф = п -1 и уровня значимости α) и значение t0 , принимают решение.

Если to > t(Ф;0,05) , то различие имеет место, поскольку уровень значимости 5%-ный.

Если to > t(Ф;0,01), то имеет место существенное различие, поскольку уровень значимости 1%-ный

 

Пример проверки средних значений.

Задача №6. Вариант задачи выбран по последней цифре номера зачетной книги. Из исходных данных задания было убрано также третье значение взвешиваний.

 

По данным из таблиц проверить, можно ли с вероятностью 95% утверждать, что автоматы настроены одинаково?

Таблица 2.1- Данные для расчета задачи

№ поковки

0

1

2

3

4

5

6

7

8

9

Масса, г

570

569

590

540

537

585

595

568

580

545

545

560

548

575

547

559

560

548

540

550

 

Решение:

По формуле 2.3 определяют сумму квадратов отклонений:

                                                                   (2.3)

 

SA=(567,9-570)2+(567,9-569)2+(567,9-590)2+(567,9-540)2+(567,9-537)2+(567,9-585)2+(567,9-595)2+(567,9-568)2+(567,9-580)2+(567,9-545)2=4020,4

 

                                                                   (2.4)

 

SB=(545-553,2)2+(560-553,2)2+(548-553,2)2+(575-553,2)2+(547-553,2)2+(559-553,2)2+(560-553,2)2+(548-553,2)2+(540-553,2)2+(550-553,2)2=945,2

 

 Определяют несмещенные оценки дисперсии:

                                                                                (2.5)

 

                                                                                (2.6)

Определяют отношение дисперсий:

                                                                                  (2.7)

Сравнивают предельные значения из таблицы F-распределения с F0

 

Вывод:

Так как  Fтаб>F0, значит расхождение не существенное. Следовательно, можно утверждать, что автоматы настроены одинаково.

 

2.2 Проверка ошибок при оценке дисперсии

 

Для того, чтобы проверить возможные ошибки при оценке дисперсии исходной генеральной совокупности, имея две группы данных (выборка которых была сделана независимо друг от друга) и предполагая, что они получены из одной генеральной совокупности можно основываться на таблице распределения Фишера (F-распределение). При этом, сравнивая значение F0, вычисленное из данных, с сопоставимыми значениями из таблиц F-распределения, принимают решение отклонить или принять нулевую гипотезу.

Таблица F-распределения составлена так, что большая несмещенная оценка дисперсии принимается за числитель. Следует также иметь в виду то, что таблица предназначена для односторонней проверки и если понадобится проводить двухстороннюю проверку соотношения дисперсий при уровне значимости а, то используют значения таблицы F-распределения для α/2 (Рисунок 2.1).

 

2.3 Проверка различия средних арифметических

 

Обычно при сравнении существующего технологического процесса с усовершенствованным технологическим процессом, при сравнении производственной методики по способу А и В, при сопоставлении результатов работы группы А и группы В и т.д. среднее генеральной совокупности часто бывает неизвестно. В такого рода ситуациях рекомендуется осуществлять проверку, придерживаясь следующего порядка.

Прежде всего, определяют отношение дисперсий, полученных из несмещенных оценок σеl2, σе22 для двух групп выборок, и осуществляют проверку по F-распределению, в результате чего убеждаются, что в дисперсии не обнаруживается существенного различия. В том случае, когда между σеl2 и   σе22 имеется существенное различие, то определить общую дисперсию σ22 становится невозможным.

Если нет существенного различия между σеl2 и   σе22, то обозначая средние арифметические измеренных значений двух групп выборок n1, n2 через х1, х2, а сумму квадратов через S1 , S2, можно построить предположение, что дисперсия генеральной совокупности σ2  оценивается общей для двух групп несмещенной оценкой σe2 :

 

 

                              (2,6)

 

При проверке существенного различия средних арифметических в двух группах выборок целесообразно применить формулу:

                                                       (2.7)

 

 

и осуществлять проверку по t-распределению. При этом число степеней свободы равно Ф = n1+n2 - 2.

 

 

2.4 Статистическое оценивание количественных значений. Интервальная оценка

 

2.4.1 Ситуация, когда дисперсия генеральной совокупности σ2 уже известна

Если определить среднее арифметическое в выборке объемом n, взятой методом случайного отбора образцов из нормальной генеральной совокупности со средним арифметическим µ и дисперсией σ2 и нормировать его, то выражение (2.1) подчинится нормальному распределению со средним значением µ = 0 и дисперсией σ2 = 1.

Приняв значение U, соответствующее уровню значимости α, за Uα , получают, что вероятность неравенства

                                                 (2.8)

будет (1 - α). Видоизменив эту формулу, получают нижнюю границу   и верхнюю границу  нахождения среднего арифметического. Это и есть доверительный интервал.

 

2.4.2. Ситуация, когда дисперсия генеральной совокупности σ2  неизвестна

Если дисперсия генеральной совокупности σ2 неизвестна и при этом использовать выражение (1.10), то определенное при помощи выражения (2.2) распределение статистической величины t принимает распределение Стьюдента при числе степеней свободы Ф = n - 1. Доверительный интервал, обусловленный вероятностью (1 - α), выражают:

                                                  (2.9)

причем доверительные границы

                                                   (2.10)

 

2.5. Статистическая проверка доли дефектных изделий в генеральной совокупности

 

Если подсчитать число дефектных изделий в произвольно отобранной выборке объемом п, взятой методом случайного отбора, например, из генеральной совокупности со средней долей дефектных изделий в технологическом процессе равно р', то поскольку известно, что это число подчиняется биномиальному распределению, определяют вероятность превышения числом дефектных изделий значения r.

Вместе с тем при условии р' ≤ 0,5 и пр'≥ 5 биномиальное распределение может приблизиться к нормальному распределению. Другими словами, в биномиальном распределении:

Среднее значение равно пр';

Среднее квадратическое отклонение равно .

Исходя из этого статистику U0 определяют по формуле:

                                                   (2.11)

 

 

3 Корреляционный и регрессионный анализ

 

3.1.   Корреляционный анализ

На заводах и в лабораториях приходится часто проводить экспериментальное изучение зависимостей между случайными величинами x и у. Для этого производят некоторое количество n независимых опытов. Результат i-го опыта дает пару значений (xt, уi), i=1, 2,..., n.

Когда непрерывным изменениям измеряемой величины x в некоторых характеристиках сопутствуют непрерывные изменения другой величины у, то утверждают, что между x и у имеется корреляция.

Метод, анализирующий корреляционную зависимость между несколькими переменными величинами, называют корреляционным анализом. В частности, когда переменных величин только две, анализ называется простым корреляционным анализом, когда же одновременно подвергают анализу более трех переменных величин, то анализ называют сложным корреляционным анализом. В данном разделе рассмотрим простой корреляционный анализ.

О наличии или отсутствии корреляции между двумя величинами можно судить по виду поля корреляции, нанося точки (xi, yi) на координатную плоскость. Такую фигуру называют корреляционной диаграммой (Рисунок 3.1).

 

Рисунок 3.1 – Корреляционная диаграмма

 

Если провести прямые линии, параллельные оси абсцисс и оси ординат через точки (), то плоскость рисунка, на которой разбросаны точки, окажется разделенной на четыре части.

Корреляционная диаграмма показывает, что точки, расположенные в I секторе, будут превышать средние значения, а точки расположенные в III секторе, окажутся меньше средних значений.

  1. I. (xt - ) > 0 (у, - )> 0

III.     (xx -) < 0   (уг -) < 0

В обоих секторах при увеличении х увеличивается и у, или при увеличении у увеличивается x. В свою очередь сумма произведений отклонений, называемая корреляционным соотношением  в первом и третьем секторах >0, а во втором и четвертом секторах -<0. По корреляционному соотношению можно приблизительно понять степень корреляции, ибо, если эта сумма составит значительную положительную величину, то это будет положительной корреляцией, если же она составит значительную отрицательную величину - отрицательной корреляцией. Вместе с тем, если рассчитывать степень корреляции только по сумме произведений, то нужно учесть, что она изменяется в зависимости от рассеивания значений x и у. Поэтому в качестве критерия корреляции принимают сумму произведений, деленную на произведение корней квадратных из суммы квадратов каждого из отклонений x и у, что и называют коэффициентом корреляции:

 

Обозначая сумму квадратов х, сумму квадратов у, а также сумму произведений x и у соответственно через Sxx, Sуу, Sху, то r можно выразить следующей формулой:

                                                                                                 (3.2)

Коэффициент корреляции занимает промежуточное значение между -1 и +1- Причем, если вслед за увеличением x увеличивается и у, то коэффициент корреляции становится положительным, а если вслед за увеличением x уменьшается у, то он становится отрицательным. Поэтому при приближении r к единице, корреляция вполне вероятна, тогда как при приближении r к нулю она маловероятна. Поскольку r представляет собой статистическую величину, вычисленную на основании опытных данных, то необходимо проверить значимость коэффициента корреляции.

Оценку значимости коэффициента парной корреляции (проверку наличия корреляции) выполняют по формуле:

 

                                                            (3.3)

Подставив  в  вышеупомянутую  формулу  значение  tФ,α , получают предельное значение   rФ,α, с которым сравнивают r0. При условии |r0 | > =rФα, принимается решение о наличии взаимосвязи. Поскольку для вычисления r используют два расчетных значения , то число степеней свободы Ф = n -2.

 

3.2. Регрессионный анализ

Для характеристики формы связи при изучении корреляционной зависимости пользуются уравнением регрессии. Задача ставится таким образом: по данной выборке объема n найти уравнение регрессии и оценить допу1скаемую при этом ошибку. Для простоты и более легкого освоения методики регрессионного анализа предположим (на первых порах), что при проведении парного линейного регрессионного анализа имеем дело только с уравнением прямой линии.

Уравнение прямой на плоскости в декартовых координатах:

 

                                                      (3.4)

 

Для определения линии регрессии необходимо непременно статистически оценить коэффициент регрессии b1 и постоянное число b0.

Для этого должны быть удовлетворены два следующих условия:

  1. Линия регрессии должна проходить через точку с координатами () средних значений xи у.
  2. Сумма квадратов отклонений от линии регрессии вдоль оси Оу должна быть наименьшей:

              (наименьшее значение)                     (3.5)

Если в эту формулу подставим значение , то получим:

                                            (3.6)

Для решения этой задачи необходимо в каждом конкретном случае вычислить значение коэффициентов b0 и b1, минимизирующих сумму отклонений U. Для этого, как известно из математического анализа, необходимо вычислить частные производные функции U по коэффициентам b0 и b1 и приравнять их к нулю:

 

 

                                                     (3.7)

 

 

 

 

                                    (3.8)

 

Следовательно, прямая линия регрессии определяется формулами:

,                            (3.9)

                               (3.10)

 

Если выражение из формулы (3.9) b0 =  - b1  подставить в формулу (3.10), то получим:

           (3.11)   

 

Отсюда выразим b1:     

 

            (3.12)

b0 =  - b1                                                (3.13)

Для проверки значимости уравнения регрессии используют F-критерий. Для этого определяют общую дисперсию σy2  и остаточную σост2.

 

                              (3.14)

 

                                           (3.15)

 

и определяют их отношение

                                                 (3.16)

Если F0 > Fn-1, n-2,α , то уравнение статистически значимо описывает результаты экспериментов.

 

 

3.3 Пример выполнения парного корреляционного и регрессионного анализа

Из исходных данных задания был исключен одинадцатый опыт, соответствующий сумме двух последних цифр зачеток.

 

По данным таблицы 3.1 определить коэффициент корреляции между входной толщиной h0(x) и выходной толщиной hi(y) при прокатке. При наличии взаимосвязи определить уравнение регрессии и его адекватность экспериментальным результатам.

 

 

Таблица 3.1 - Парный корреляционный и регрессионный анализ

x

y

x2

y2

xy

     

1

0.71

0.46

0,5041

0,2116

0,3266

0,4586

-0,0014

0,00000196

2

0.78

0.50

0,6084

0,25

0,39

0,4929

0,0071

0,00005041

3

0.84

0.52

0,7059

0,2704

0,4368

0,5224

-0,0024

0,00000576

4

0.92

0.56

0,8464

0,3136

0,5152

0,5616

-0,0016

0,00000256

5

0.87

0.54

0,7569

0,2916

0,4698

0,5371

0,0029

0,00000841

6

0.85

0.52

0,7225

0,2704

0,442

0,5273

0,0073

0,00005329

7

0.86

0.51

0,7396

0,2601

0,4386

0,5322

-0,0222

0,000493

8

0.91

0.54

0,8281

0,2916

0,4914

0,5567

-0,0167

0,0002789

9

0.93

0.57

0,8649

0,3249

0,5301

0,5664

0,0036

0,00001296

10

0.93

0.59

0,8649

0,3481

0,5487

0,5664

0,0236

0,0005569

11

0.85

0.53

0,7225

0,2809

0,4505

0,5273

0,0027

0,00000729

12

0.81

0.50

0,6561

0,25

0,405

0,5077

0,0077

0,00005929

13

0.80

0.48

0,64

0,2304

0,384

0,5028

-0,0228

0,0005198

14

0.78

0.50

0,6081

0,25

0,39

0,4929

0,0071

0,00005041

15

0.84

0.53

0,7056

0,2809

0,4452

0,5224

0,0076

0,00005776

16

0.82

0.52

0,6724

0,2704

0,4264

0,5126

0,0074

0,00005476

17

0.85

0.54

0,7225

0,2916

0,459

0,5273

0,0127

0,00016129

18

0.82

0.53

0,6724

0,2809

0,4346

0,5126

0,0174

0,0003027

19

0.90

0.54

0,81

0,2916

0,486

0,5518

-0,0118

0,0001392

16,07

9,98

13,651

5,259

8,4699

 

 

0,00282

 

 

1 Определим коэффициент корреляции:

 

 

            

 

Тогда, коэффициент корреляции

 

 

 

  1. Проводят проверку коэффициента корреляции. Для этого выбирают уровень значимости α=0,01 и определяют число степеней свободы Ф = n-2 = 19 - 2 = 17.

Определяем rФ,α = r17:0,01 = 0,575. Поскольку r0 = 0,9166 > rФ,α то r обладает высокой степенью значимости.

 

3 Определяют коэффициент уравнения регрессии.

 

 

Для определения b0, необходимо определить средние x, y:

 

 

 

 

Тогда уравнение регрессии будет:

 

 

4  Определяют адекватность уравнения экспериментальным данным:

 

Для проверки значимости уравнения регрессии используют F-критерий. Для этого определяют общую дисперсию σy2 и остаточную σ2 ост .

и определяем их соотношение

 

  • Вывод. Так как F0 = 5,644 > Fn-1: n-2: 0,05 = 2,2, то следует признать, что
    уравнение адекватно описывает экспериментальные результаты.

 

 

4 Планирование эксперимента

 

Важной задачей планирования эксперимента является определение числа опытов, которые необходимы для выявления зависимости между исследуемыми переменными величинами.

Те, переменные параметры, которые изменяются экспериментатором в процессе испытаний, называются факторами, а те параметры, которые изучаются или оптимизируются, называются выходами или откликами системы, или параметрами оптимизации системы.

При математическом планировании эксперимента предполагается, что существует некоторая аналитическая связь между факторами и откликом процесса, и требуется выбрать минимальное число и условия проведения опытов, позволяющих найти область оптимальных значений параметров. Другими словами необходимо найти приближенную зависимость выходного параметра от факторов, т.е. построить математическую модель процесса. Математическая задача планирования эксперимента состоит в том, чтобы найти уравнение поверхности отклика:

                                                (4.1)

где y - выход процесса, т.е. параметр оптимизации;

xi - факторы, которые варьируются при проведении эксперимента.

Таким образом, математическое планирование фактически связано с изучением формы поверхности отклика и, следовательно, оптимальному значению выхода будут соответствовать максимальные или минимальные точки этой поверхности.

Для большинства реальных задач вид поверхности отклика заранее неизвестен, поэтому при экспериментальном поиске оптимальных условий функцию у представляют в виде системного ряда:

                      (4.2)

Очевидно, точность подобной аппроксимации определяется порядком системного ряда и диапазоном изменения переменных хi. Так как поверхность отклика изучается обычно в сравнительно узком интервале варьирования факторов, то без большой погрешности можно отбросить члены высших порядков. Задача оптимизации решается в два этапа: сначала осуществляется поиск области оптимума, для чего используется линейная модель поверхности отклика; на втором этапе для описания почти стационарной (оптимальной) области используется степенной ряд, содержащий члены второго, а иногда и третьего порядка. Коэффициенты степенного ряда β можно оценить с помощью выборочных коэффициентов регрессии b, которые определяются по результатам конечного числа опытов. Тогда уравнение регрессии, получаемое на основании результатов экспериментов, примет вид:

                             (4.3)

Таким образом, после вычисления коэффициентов регрессии появляется возможность оценить влияние изучаемых факторов на функцию отклика и определить направление движения к области оптимума.

В качестве выхода процесса рекомендуется выбирать параметр, который имеет ясный физический смысл и количественное выражение, при этом желательно, чтобы параметр оптимизации был единственным и не зависел от времени.

Для каждого фактора выбираются условный нулевой или основной уровень хi0 диапазон и шаг ∆xi варьирования переменных. Диапазон изменения факторов равен разности между верхним и нижним пределом данного фактора.

 

 

4.1. Полный факторный эксперимент

 

Полным факторным экспериментом (ПФЭ) называется эксперимент, реализующий все возможные неповторяющиеся комбинации опытов n независимых управляемых факторов, каждый из которых варьируется на k уровнях. Необходимое число опытов N при ПФЭ равно N = kn. Если число уровней составляет 2, то N=2n.

Рассмотрим пример планирования полного факторного эксперимента.

Сопротивление деформации σs алюминиевого сплава 1915 в наибольшей степени зависит от температуры θ и скорости деформации ξ.  Необходимо получить математическую модель вида σss (θ,ξ) для последующей оптимизации параметров процесса пластической обработки.

Экспериментальное исследование условий горячего прессования алюминиевого сплава 1915 позволило установить технологически разумные пределы, в которых могут изменяться факторы: температура от 3700С до 4300С; скорость деформации от 8 до12 с-1. Для решения задачи моделирования принято решение провести ПФЭ 22 .

Опыты проводятся путем растяжения образцов на пластометре. Условия эксперимента приведены в таблице 4.1, а матрица плана и результаты экспериментов в таблице 4.2. Проводилось по три параллельных опыта (m=3) с рандомизацией.

 

 Таблица 4.1 – Условия эксперимента

Уровень фактора

θ, 0с

ξ, с-1

Основной Xi = 0

400

10

Интервал варьирования ∆xi

30

2

Нижний xi = -1

370

8

Верхний xi = +1

430

12

Кодовые обозначения

X1

X2

 

 

Таблица 4.2 – План эксперимента

№ опыта j

X1

X2

X1

Параллельные опыты σs, Мпа

       

Y1

Y2

Y3

1

+

+

+

10,59

10,48

10,72

10,6

0,0145

5,63

0,0011

2

-

+

-

9,54

9,50

9,67

9,57

0,0079

4,54

0,0009

3

+

-

-

11,10

11,03

11,20

11,11

0,0073

6,08

0,0009

4

-

-

+

9,90

10,00

9,97

9,96

0,00265

4,99

0,0011

 

 

 

 

 

 

 

0,03235

 

0,004

 

После составления плана эксперимента приступают к его реализации. На исследуемый процесс влияют не только выбранные факторы xi, но и еще ряд факторов, которые могут быть вообще неизвестны исследователю. Для того, чтобы внести элемент случайности влияния этих факторов на результат эксперимента (а это необходимо для обоснованного использования аппарата математической статистики), приходится проводить m параллельных опытов и устанавливать случайный порядок проведения опытов во времени. Эта процедура называется рандомизацией (перемешиванием) и выпприступают к его реализации. На исследуемый процесс влияют не только выбранные факторы xi, но и еще ряд факторов, которые могут быть вообще неизвестны исследователю. Для того, чтобы внести элемент случайности влияния этих факторов на результат эксперимента:

 

                                       (4.4)

 

 

где  - выборочная дисперсия выходной величины y по j строке матрицы планирования, полученная из m параллельных опытов:

                                                (4.5)

где yij - значение выходной величины по j строке матрицы планирования (j изменяется от 1 до N) из i-го параллельного опыта ( i изменяется от 1 до m);

yj  -   среднее   значение   выходной   переменной,   полученное из параллельных опытов по j строке матрицы планирования;

max - наибольшая из дисперсий в строках плана.

 

Табличное значение критерия Кохрена для уровня значимости α = 0,05 и степеней свободы Ф1 = m -1= 3 -1=2, Ф2 = N =4

G(0,05,2,4)= 0,7679

Сравниваем G0 и G(0,05,2,4).

G0 < G(0,05,2,4), следовательно, дисперсии однородны, опыты воспроизводимы.

Находим дисперсию воспроизводимости:

                             (4.6)

Степень свободы дисперсии воспроизводимости равна

Ф =N(m -1) = 4(3-1) = 8.

Определяем коэффициенты уравнения регрессии, которое в общем случае имеет вид:

                                   (4.7)

 

 Независимые оценки b0, bi, bik соответствующих коэффициентов β0, βi, βk,(b0→ β0, bi→βi,, bik→βik) находят по следующим формулам:

                    

                   или                                                      (4.8)

               или                                          (4.9)

 

                или             (4.10)

 

Следовательно

b0 = (10,6+9,570+11,11+9,96)/4 = 10,31

b1 = (10,6-9,570+11,11-9,96)/4 = 0,545

b2= (10,6+9,570-11,11-9,96)/4 = -0,5

b12= (10,6-9,570-11,11+9,96)/4 = -0,12

Уравнение регрессии примет вид:

Находим дисперсию коэффициентов

 и, исходя из зависимости  , оцениваем значимость коэффициентов   уравнения   регрессии.   Табличное   значение критерия Стьюдента для уровня значимости а =0,05 и степени свободы Ф= N(m -1) = 4(3-1) = 8 равно t0,05, 8=2,31.

Произведение =2,31*=0,06

Все коэффициенты по абсолютной величине превышают это значение. Следовательно мы должны признать их значимыми.

 

Проверяем адекватность полученного уравнения экспериментальным результатам. В нашем случае число значимых коэффициентов уравнения регрессии  равно числу опытов, т.е. степень свободы дисперсии адекватности  равна нулю. Поэтому мы вынуждены поставить дополнительный опыт на нулевом уровне. Результаты опыта мы заносим в план эксперимента. При этом число опытов N становится равно пяти, а дисперсия воспроизводимости:

 

По уравнению регрессии рассчитываем значения  и определяем сумму квадратов отклонений . Результаты расчета заносим в таблицу плана эксперимента.  Определяем дисперсию адекватности для N=5 и d=4

                                                               (4.11)

Тогда F-отношение (расчетное значение критерия Фишера):

                                       (4.12)

Табличное значение критерия Фишера для α=0,05, Ф1=N(m-1)=8, Ф2=N-d=1, F(0,05.8.1) =5,3 . Получаем F0> F(0,05.8.1) и, следовательно, уравнение регрессии  не адекватно экспериментальным результатам. В этом случае необходимо переходить к более сложной форме математического описания, либо, если это возможно, провести эксперимент с меньшим интервалом варьирования.

Выполняем переход от кодированных значений факторов к натуральным по уже известной зависимости:

-

           i=1,2,…,n                               (4.13)

 

Для двухфакторного эксперимента:

 

                  (4.14)

 

 

4.2. Дробный факторный эксперимент

ПФЭ требует большого числа опытов, причем часть из них несет мало информации. Дробный факторный эксперимент (ДФЭ) позволяет сократить число опытов и в то же время получить основной объем необходимой информации.

Эксперимент, составляющий по объему только часть ПФЭ, называется дробным факторным экспериментом или дробной репликой. Существует 1/2 реплики,1/4 реплики, 1/8 реплики и т.д..

Эффективность применения дробных реплик зависит от удачного выбора системы смешивания линейных эффектов с эффектами взаимодействий. Реплики, у которых линейные эффекты смешаны с взаимодействиями наивысшего порядка, являются наиболее эффективными, они обладают наибольшей разрешающей способностью и называются главными.

В реальных условиях разработчик может не иметь твердой уверенности в отсутствии того или иного взаимодействия факторов. В этом случае надо знать, когда и какие эффекты определяются совместно, определить разрешающую способность дробных реплик. Для этого пользуются понятиями «определяющие контрасты» и «генерирующее соотношения».

Рассмотрим пример. Необходимо спланировать эксперимент с целью выбора оптимальных параметров устройства для получения максимального значения выходной характеристики у. Исходные значения факторов и интервалы варьирования заданы в таблице 4.3.

 

Таблица 4.3 – Условия эксперимента

Фактор

Уровни факторов

Интервал варьирования

 

-1

0

+1

 

Х1

200

220

240

20

Х2

3

6

9

3

Х3

40

100

160

60

Х4

1

2

3

1

Х5

140

150

160

10

Х6

2

4

6

2

 

Для матрицы планирования выбираем полуреплику от ПФЭ 26 , заданную генерирующим соотношением Х6 = Х1Х2Х3Х4Х5 . Определяющим контрастом является 1=Х1Х3Х4Х52Х3Х4Х6. Умножая определяющий контраст последовательно на Х1, Х2, Х3, Х4, Х5 и Х6, найдем совместно оценки линейных эффектов и взаимодействий.

Составляем таблицу матрицы планирования в которою вносим результаты эксперимента.

 

Таблица 4.4 – Матрица планирования эксперимента

№ опыта

Х1

Х2

Х3

Х4

Х51Х2Х4

Х61Х2Х3

Х71Х3Х4

 

1

+

+

+

+

+

+

+

10

2

-

+

+

+

+

+

+

9

3

+

-

+

+

-

-

+

15

4

-

-

+

+

+

+

-

25

5

+

+

-

+

+

-

-

26

6

-

+

-

+

-

+

+

14

7

+

-

-

+

-

+

-

5

8

-

-

-

+

+

-

+

20

9

+

+

+

-

-

+

-

20

10

-

+

+

-

+

-

+

18

11

+

-

+

-

+

-

+

30

12

-

-

+

-

-

+

+

50

13

+

+

-

-

-

-

-

52

14

-

+

-

-

+

+

+

28

15

+

-

-

-

+

+

+

10

16

-

-

-

-

-

-

-

40

bi

 

 

 

 

 

 

 

 


          

Коэффициенты bi рассчитываем по формулам:

 

                                                                                         (4.16)

  (4.17)

 (4.18)

 (4.19)

 (4.20)

 (4.21)

 (4.22)

 

    (4.23)

 

Таким образом, аналитическое выражение для у принимает вид:

 

Заключение

 

В результате проделанной работы мы познакомились с основными математическими статистическими методами планирования эксперимента, а также с методами анализа законов распределения вероятностей случайных величин. На первоначальном этапе была собрана априорная информация, необходимая для дальнейшего исследования, было выдвинуто предположение о виде закона распределения случайной величины и проведено доказательство данного предположения, были определены оценки параметров данного распределения. Во второй части работы выяснялась зависимость между факторами, действующими на исследуемую величину, и изменение этой величины. Для предвидения влияния определенных факторов используется полный факторный эксперимент для построения регрессионной математической модели. Эта модель позволяет нормировать измерения вне зависимости от влияющих факторов или указывает на влияющее воздействие, которое необходимо устранить.

Несмотря на простоту методов, они представляют собой мощный механизм повышения качества продукции и могут использоваться для решения весьма обширного круга задач, когда приходится принимать решения в условиях действия многочисленных влияющих на процесс факторов.

Преимущество простых статистических методов здесь выражается в том, что появляется возможность проведения корректировки производственного процесса еще тогда, когда в нем возникают некоторые отклонения, которые еще не приводят к браку, но уже создают угрозу появления дефектной продукции. Такое управление качеством процессов, называемое управлением по отклонениям, неизмеримо эффективнее, чем применяемый в настоящее время контроль качества продукции по результатам, при котором контролируется не процесс, а продукция на разных стадиях ее изготовления путем применения либо сплошного, либо выборочного статистического контроля.

 

 

Список использованных источников

 

1 Любимов И.И. Планирование и организация эксперимента: Методическое указание 2013 – 48 с.

 

Скачать: kursovaya_p_i_oe_2007.docx-kozar-oks.docx

Категория: Курсовые / Метрология курсовые

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.