close

Вход

Забыли?

вход по аккаунту

?

Нелинейный регрессионный анализ в статистическом машинном эксперименте.

код для вставкиСкачать
Известия ТулГУ. Технические науки. 2014. Вып. 10. Ч. 1
Abhari Peyman Bahmanovich, candidate of technical sciences, docent., payharies@gmail.com, Ukraine, Kramatorsk, Donbass State Engineering Academy,
Goncharuk Kristina Vasil'evna, postgraduate, goncharuk_omd@mail.ua, Ukraine,
Kramatorsk, Donbass State Engineering Academy
УДК 004.021
НЕЛИНЕЙНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ
В СТАТИСТИЧЕСКОМ МАШИННОМ ЭКСПЕРИМЕНТЕ
С.В. Недошивин
Предложена методика проведения статистического машинного эксперимента при анализе исследуемой технологической системы с детерминированной моделью.
Рассмотрены этапы проведения нелинейного множественного корреляционного анализа на заключительных этапах разработанной методики.
Ключевые слова: статистический машинный эксперимент, множественный
нелинейный регрессионный анализ.
Проведение и обработка результатов статистических машинных
(модельных, условных) экспериментов (СМЭ) с детерминированными
(теоретическими) моделями позволяют существенно расширить и углубить
количественное и качественное представление о сущности и характере
сложных взаимосвязей между признаками в многопараметрических исследуемых системах, особенно в тех случаях, когда проведение натурных экспериментов проблематично или нецелесообразно [1]. Во многих случаях
планирование, проведение и обработка результатов СМЭ осуществляются
на основе планируемого многофакторного эксперимента [2, 3]. Однако в
процессе проведения исследований часто возникают варианты, когда проведение активного многофакторного эксперимента не представляется возможным или в нем нет необходимости по другим соображениям. В этих
случаях значительный результат может дать реализация СМЭ на основе
математического аппарата классического множественного корреляционнорегрессионного анализа [4]. В работе [5] изложены фрагменты разработанной методики проведения статистического машинного эксперимента, касающиеся этапов непосредственной реализации множественного регрессионного анализа при линейном характере получаемого уравнения регрессии.
Сравнительно часто линейная регрессионная модель неадекватно
68
Механика деформируемого твердого тела и теория ОМД
отображает исследуемые взаимосвязи, и наилучшее приближение дают нелинейные уравнения.
Для взаимоувязанного представления материала, изложенного в
данной работе, в рамках одной совокупной методики, продолжим его изложение в соответствии с пунктами, сформулированными в работах [4, 5].
Проведение нелинейного множественного регрессионного анализа. В зависимости от характера нелинейной связи различают положительную равноускоренно или равнозамедленно возрастающую регрессию,
отрицательную равноускоренно или равнозамедленно убывающую регрессию либо их комбинированные формы. Для выбора и обоснования кривой
регрессии нет универсального метода. Односторонняя стохастическая зависимость между двумя явлениями может быть описана, например, с помощью полиномиальной регрессии:
y = b0 + b1 ⋅ x + b2 ⋅ x 2 + ...
(1)
Либо с помощью гиперболической регрессии
1
y = b0 + b1 ⋅ .
(2)
x
Применяются также степенная, показательная, логарифмическая и
тригонометрическая функции. Подбор функции регрессии должен производиться с применением той конкретной науки, на базе которой возникает
задача установления связи между явлениями. Чаще всего рекомендуется
использовать семейства кривых, уравнения которых выражаются многочленами целых положительных степеней (полиномы типа (1)). Полином
первой
степени
(прямая
линия)
не
имеет
перегибов.
С помощью полинома второй степени можно передать одну точку поворота функции. Полином третьей степени отражает две точки поворота функции. О характере зависимости между переменными часто судят по внешнему виду эмпирического графика регрессии. Однако при малом числе наблюдений этот путь приводит к неудовлетворительным результатам, т. к.
резкие зигзаги эмпирической (ломаной) линии регрессии затрудняет выявление закономерностей. В каждом случае следует проверять возможность
применения линейной регрессии. Также следует обращать внимание на то,
чтобы оценка регрессии производилась с достаточной степенью надежности. Информацию об этом дает коэффициент детерминации.
Различают два класса нелинейных регрессий. К первому классу относятся регрессии, нелинейные относительно включенных в анализ независимых переменных xi , но линейные по неизвестным, подлежащим
оценке параметрам (коэффициентам) регрессии bi . Поэтому образующие
этот класс нелинейные регрессии называют также квазилинейными регрессиями. Их преимущество состоит в том, что для них возможно непосредст69
Известия ТулГУ. Технические науки. 2014. Вып. 10. Ч. 1
венное применение метода наименьших квадратов, а следовательно, остаются все исходные предпосылки линейного регрессионного анализа. Используются те же критерии значимости, аналогично строятся доверительные интервалы.
Второй
класс регрессий характеризуется нелинейностью
по оцениваемым параметрам. Он обладает существенным недостатком –
не допускает применения обычного метода наименьших квадратов.
Для решения получающейся системы уравнений привлекают итерационные методы либо прибегают к аппроксимации параметров искомой зависимости. Широко используется, также, линейное преобразование функции
регрессии, которое позволяет применять к преобразованным параметрам
статистические критерии линейной регрессии.
Оценивание параметров регрессий, нелинейных по независимым переменным.
Проблема оценивания параметров, в данном случае, решается относительно просто. Можно использовать два основных способа.
1. Составление системы нормальных уравнений на основе метода
наименьших квадратов.
Рассмотрим в общем виде квазилинейную регрессию, т. е. функцию, нелинейную по независимым переменным, но линейную по оцениваемым параметрам:
y = b0 + b1 ⋅ F1 ( x ) + b2 ⋅ F2 ( x ) + ... ,
(3)
где F1 ( x ) , F2 ( x ) , … – функции от независимых переменных x . Они не содержат других параметров. Так, например, это могут быть функции вида
1
F1 ( x ) = log x или F2 ( x ) = , но не такие, как F1 ( x ) = log ( x − b1 ) или
x
1
F2 ( x ) = b .
x2
Применяя метод наименьших квадратов к (3), получим систему
нормальных уравнений
m
m
m
j =1
j =1
m
∑ y j = m ⋅ b0 + b1 ⋅ ∑ F1 ( x ) + b2 ⋅ ∑ F2 ( x ) + ... ;
m
m
j =1
m
j =1
m
j =1
m
j =1
m
j =1
j =1
j =1
∑ y j ⋅F j1 ( x ) = b0 ⋅ ∑ F j1 ( x ) + b1 ⋅ ∑ F j21 ( x ) + b2 ⋅ ∑ F j1 ( x ) ⋅ F j 2 ( x ) + ... ;
j =1
m
∑ y j ⋅F j 2 ( x ) = b0 ⋅ ∑ F j 2 ( x ) + b1 ⋅ ∑ F j1 ( x ) ⋅ F j 2 ( x ) + b2 ⋅ ∑ F j22 ( x ) + ... .
70
j =1
Механика деформируемого твердого тела и теория ОМД
После подстановки числовых данных полученная система нормальных уравнений приводится к каноническому виду и решается одним из известных методов.
Приведем системы нормальных уравнений для функций, используемых при проведении машинных экспериментов, моделирующих процессы обработки металлов давлением (табл. 1).
Таблица 1
Перечень квазилинейных аппроксимирующих функций (первого класса)
и соответствующих им систем нормальных уравнений
№
Функция
Нормальные уравнения
1
2
3
m
m
m
j =1
j =1
j =1
∑ y j = b0 ⋅ m + b1 ⋅ ∑ x j + b2 ⋅ ∑ x 2j ;
1
m
m
m
m
j =1
j =1
j =1
j =1
m
m
m
m
j =1
j =1
j =1
j =1
∑ y j ⋅ x j = b0 ⋅ ∑ x j + b1 ⋅ ∑ x 2j + b2 ⋅ ∑ x3j ;
y = b0 + b1 ⋅ x + b2 ⋅ x 2
∑ y j ⋅ x 2j = b0 ⋅ ∑ x 2j + b1 ⋅ ∑ x3j + b2 ⋅ ∑ x 4j .
m
m
m
m
j =1
j =1
j =1
j =1
∑ y j = b0 ⋅ m + b1 ⋅ ∑ x j + b2 ⋅ ∑ x 2j + b3 ⋅ ∑ x3j ;
m
m
m
m
m
j =1
j =1
j =1
j =1
j =1
m
m
m
m
m
j =1
j =1
j =1
j =1
j =1
m
m
m
m
m
j =1
j =1
j =1
j =1
j =1
∑ y j ⋅ x j = b0 ⋅ ∑ x j + b1 ⋅ ∑ x 2j + b2 ⋅ ∑ x3j + b3 ⋅ ∑ x 4j ;
2
y = b0 + b1 ⋅ x + b2 ⋅ x 2 +
+ b3 ⋅ x3
∑ y j ⋅ x 2j = b0 ⋅ ∑ x 2j + b1 ⋅ ∑ x3j + b2 ⋅ ∑ x 4j + b3 ⋅ ∑ x5j ;
∑ y j ⋅ x3j = b0 ⋅ ∑ x3j + b1 ⋅ ∑ x 4j + b2 ⋅ ∑ x5j + b3 ⋅ ∑ x6j .
m
m
j =1
j =1
∑ log y j = b0 ⋅ m + b1 ⋅ ∑ x j ;
3
log y = b0 + b1 ⋅ x
m
m
m
j =1
j =1
j =1
∑ x j ⋅ log y j = b0 ⋅ ∑ x j + b1 ⋅ ∑ x 2j .
71
Известия ТулГУ. Технические науки. 2014. Вып. 10. Ч. 1
Окончание табл. 1
1
2
3
m
m
m
j =1
j =1
j =1
∑ log y j = b0 ⋅ m + b1 ⋅ ∑ x j + b2 ⋅ ∑ x 2j ;
4
log y = b0 + b1 ⋅ x + b2 ⋅ x 2
m
m
m
m
j =1
j =1
j =1
j =1
m
m
m
m
j =1
j =1
j =1
j =1
∑ x j ⋅ log y j = b0 ⋅ ∑ x j + b1 ⋅ ∑ x 2j . + b2 ⋅ ∑ x3j ;
∑ x 2j ⋅ log y j = b0 ⋅ ∑ x 2j + b1 ⋅ ∑ x3j + b2 ⋅ ∑ x 4j .
log y = b0 + b1 ⋅ x + b2 ⋅ x +
2
5
+ b3 ⋅ x3
Такие же, как для функции 2, при замене y j на log y j
m
m
j =1
j =1
∑ y j = b0 ⋅ m + b1 ⋅ ∑ log x j ;
6
y = b0 + b1 ⋅ log x
m
m
m
j =1
j =1
j =1
(
)
2
∑ y j ⋅ log x j = b0 ⋅ ∑ log x j + b1 ⋅ ∑ log x j .
m
m
∑ log y j = b0 ⋅ m + b1 ⋅ ∑ log x j ;
7
8
9
j =1
log y = b0 + b1 ⋅ log x
m
m
j =1
j =1
j =1
∑ ( log y j ⋅ log x j ) = b0 ⋅ ∑ log x j + b1 ⋅ ∑ ( log x j )
(
2
на log x j
2
.
)
2
; y j на log y j .
Такие же, как для функции 2, при замене: x j на log x j ; x 2j
log y = b0 + b1 ⋅ log x +
+b2 ⋅ ( log x ) + b3 ⋅ ( log x )
2
Такие же, как для функции 1, при замене: x j на log x j ; x 2j
log y = b0 + b1 ⋅ log x +
+ b2 ⋅ ( log x )
j =1
m
3
(
на log x j
)
2
(
; x3j на log x j
m
)
3
; y j на log y j .
m
1
;
j =1 x j
∑ y j = b0 ⋅ m + b1 ⋅ ∑
10
y = b0 + b1 ⋅
1
x
j =1
m
∑ yj ⋅
j =1
11
1
1
y = b0 + b1 ⋅ + b2 ⋅ 2
x
x
m
m
1
1
1
= b0 ⋅ ∑ + b1 ⋅ ∑ 2 .
xj
j =1 x j
j =1 x j
Такие же, как для функции 1, при замене:
1
1
x j на
; x 2j на 2 .
xj
xj
Замена переменных. Независимые переменные, имеющие степень,
отличающуюся от первой, заменяют другими независимыми переменными
в первой степени, и к новой системе переменных применяют обычный ме72
Механика деформируемого твердого тела и теория ОМД
тод наименьших квадратов. После того как получено уравнение регрессии
с оцененными параметрами, введенные в него новые независимые переменные вновь заменяются на первоначальные.
Пусть необходимо рассчитать параметры (коэффициенты регрессии) теоретического уравнения
y = b0 + b1 ⋅ x1 + b2 ⋅ x2 + b3 ⋅ x12 + b4 ⋅ x22 + e .
Введем переменные
(4)
z1 = x1 ; z2 = x2 ; z3 = x12 ; z4 = x22 ,
(5)
после чего запишем
y = b0 + b1 ⋅ z1 + b2 ⋅ z2 + b3 ⋅ z3 + b4 ⋅ z4 + e .
(6)
Далее, следуя аналогии линейного множественного регрессионного
анализа [5], определяют компоненты вектора неизвестных (искомых) параметров bi ([5], зависимость (3)). Для этого в формуле ([5], зависимость
(
(7)) следует заменить обратную матрицу X T X
(
новых переменных Z T Z
)
−1
)
−1
на обратную матрицу в
и вектор X T ⋅ y - на вектор Z T ⋅ y . В резуль-
тате получим
(
b = ZT Z
)
−1
⋅ ZT ⋅ y .
(7)
Для полученной регрессии можно найти ошибки параметров (коэффициентов регрессии) и доверительные интервалы, например, по численным данным табл. 2.
В качестве аппроксимирующей кривой выберем параболу второго
порядка
y = b0 + b1 ⋅ x + b2 ⋅ x 2 = b0 + b1 ⋅ z1 + b2 ⋅ z2 .
Как уже отмечалось, форму, уравнение аппроксимирующей кривой
и систему соответствующих линейных уравнений для оценок искомых коэффициентов этого уравнения устанавливают визуально по характеру расположения экспериментальных (модельных) точек на графике с использованием соответствующих статистических таблиц [6].
Таблица 2
Числовые данные для определения ошибок параметров
и доверительных интервалов регрессии
y
x
6
0,9
7
1,0
13
1,8
16
2,4
73
20
4,0
24
5,8
22
7,6
20
8,5
Известия ТулГУ. Технические науки. 2014. Вып. 10. Ч. 1
Для оценки параметров воспользуемся формулами ([5], зависимость
(2)). По приведенным числовым данным табл. 2 получим
y = 16,0 ; z1 = 4,0 ;
m
∑
j =1
m
∑
j =1
y 'j
⋅ z 'j1 = 118,6 ;
2
z 'j1 = 62,46 ;
m
m
2
∑ z 'j 2 = 5453,9 ;
j =1
m
∑ y 'j ⋅ z 'j 2 = 943,0 ; ∑ z 'j1 ⋅ z 'j 2 = 572,0 .
j =1
j =1
Далее ([5], зависимость (2)):
D = 62,46 ⋅ 5453,9 − 572,02 = 13466,6 ;
5453,9 ⋅ 118,6 − 572,0 ⋅ 943,0
b1 =
= 7,7231 ;
13466,6
62, 46 ⋅ 943,0 − 572,0 ⋅ 118,6
= −0,6638 ;
b2 =
13466,6
b0 = 16,0 − 7,7231 ⋅ 4 + 0,6638 ⋅ 23,81 = 0,9127 .
Таким образом,
y = 0,9127 + 7,7231 ⋅ x − 0,6638 ⋅ x 2 .
Индекс корреляции (корреляционное отношение). Измерение
силы (тесноты) связи в случае нелинейной регрессии осуществляется с помощью индекса корреляции или корреляционного отношения
m
∑ e2j
I = 1−
j =1
m
∑ ( y j − y)
,
(8)
2
j =1
где I - индекс корреляции (корреляционное отношение); e j - отклонение
экспериментального (модельного) значения результативного признака y
от расчетного (полученного по уравнению нелинейной регрессии) в каждом j -м условном опыте.
По данным предыдущего примера
m
∑
j =1
e2j
= 7, 25 ;
m
∑ ( y j − y)
2
= 322,0 , тогда I = 1 −
j =1
7,25
= 989 .
322,0
Если, например, в качестве первого и самого грубого приближения
применить линейную парную регрессию, то получим
74
Механика деформируемого твердого тела и теория ОМД
y j = 8, 405 + 1,899 ⋅ x j ;
m
∑ e2j = 96,7 ; и r = 0,83 .
j =1
Таким образом, введение дополнительного члена в уравнение
регрессии, т. е. переход от линейной к параболической регрессии
y j = 8,405 + 7,7231 ⋅ x j − 0,6638 ⋅ x 2j , повышает качество описания иссле-
дуемой зависимости. При этом резко снижается значение «необъясненной»
регрессией суммы квадратов отклонений и возрастает мера тесноты связи.
Дальнейшее усложнение формы кривой, например, введение членов в
третьей и более степени, практически не увеличит меру тесноты связи, так
как «объясняющая способность» уравнения регрессии, по существу, не изменится.
Оценивание параметров регрессий, нелинейных по параметрам.
При обработке результатов машинных экспериментов часто приходится
иметь дело с функциями, нелинейными относительно оцениваемых параметров. Использование этого класса регрессий связано с вычислительными
трудностями, т. к. указанные регрессии не допускают непосредственного
применения обычного метода наименьших квадратов. Для того, чтобы
сделать это возможным, исходные данные подвергают преобразованиям,
главное назначение которых в линеаризации рассматриваемых зависимостей по оцениваемым параметрам. Так, например, путем логарифмического преобразования можно перейти от зависимости показательного типа к
линейной:
y = a ⋅ bx ,
(9)
log y = log a + x ⋅ log b .
(10)
Произведя в (10) замену log y = Z , log a = A и log b = B , получим
Z = A+ B.
При
m
К уравнению (11) можно применить метод наименьших квадратов.
этом требование МНК будет относиться к условию
∑(zj − Z j )
j =1
(11)
2
→ min , а не к условию
∑(yj − y j )
m
2
→ min . Следовательно,
j =1
для (11) не является обязательным равенство
m
m
j =1
j =1
∑ y j =∑ y j .
Таким образом, для определения зависимости типа (9) нужно выполнить логарифмическое преобразование переменной y , т. е. пролога75
Известия ТулГУ. Технические науки. 2014. Вып. 10. Ч. 1
рифмировать эмпирическое значение y j , z j = log y j . Аналогичному преобразованию подвергают исходные данные при изучении зависимости вида y = a ⋅ xb . После возведения в квадрат обеих частей данного уравнения
перейдем к логарифмам. Введем следующие обозначения: 2log y = Z ;
2log a = A ; b = B . В итоге получим: Z = A + B ⋅ log x . Оценки параметров A
и B можно найти снова с помощью метода наименьших квадратов.
Итак, некоторые функции с помощью преобразования переменных
поддаются линеаризации относительно своих параметров. Параметры регрессии исходных функций находят путем обратных преобразований. Линеаризация связей дает возможность применять для нахождения оценок
параметров метод наименьших квадратов. Но оценки параметров исходных функций могут не обладать свойствами МНК-оценок, поэтому разработаны способы уточнения этих оценок.
Для удобства практического использования приведем в табл. 3 наиболее часто встречающиеся при обработке экспериментальных результатов
нелинейные функции второго класса.
Таблица 3
Перечень нелинейных аппроксимирующих функций (второго класса)
и соответствующих им систем нормальных уравнений
Название
функции
Аналитическое
выражение функции
Преобразование функции
1. Степенная
y = a ⋅ xb
log y = log a + b ⋅ log x
2. Показательная
y = a ⋅bx
log y = log a + x ⋅ log b
y = a ⋅ xb ⋅ c x
log y = log a + b ⋅ log x + x ⋅ log c
3. Показательно-степенная
4. Экологическая
5. Логистическая
(S-образная функция, сигмоид, функция Фишера)
6. Частный случай
логистической функции
7. Функция Гомперца
(S-образная функция)
y = a⋅e
y=
y=
−b2 ⋅( x −c )
2
a
1 + b ⋅ e− c⋅x
a
1 + b ⋅ eb−c⋅x
y=
a
b
1+  
 x
c
log y = log a + b ⋅ c x
76
log y = log a − b 2 ⋅ c 2 ⋅ log e +
+2b 2 ⋅ c ⋅ ( log e ) ⋅ x − b 2 ⋅ ( log e ) ⋅ x 2
a 
log  − 1 = log b − c ⋅ x ⋅ log e
y 
a 
log  − 1 = b ⋅ log e − c ⋅ x ⋅ log e
y 
a 
log  − 1 = c ⋅ log b − c ⋅ log x
y 
log ( log a − log y ) = log ( −b ) +
+ x ⋅ log c
Механика деформируемого твердого тела и теория ОМД
Окончание табл. 3
Название
функции
Аналитическое
выражение функции
8. Иррациональная
9. Гиперболическая
10. Функция, обратная
квадратному трехчлену
11. Дробно-рациональная
функция
12. Функция Джонсона
13. Модифицированная
экспоненциальная
Преобразование функции
y ⋅ 2 = a + b ⋅ x + c ⋅ x2
y = a + b ⋅ x + c ⋅ x2
1
y=
a +b⋅ x
1
y=
a + b ⋅ x + c ⋅ x2
x
y=
a + b ⋅ x + c ⋅ x2
a
log y = −
+c
b+ x
1
= a + b ⋅ x + c ⋅ x2
y
x
= a + b ⋅ x + c ⋅ x2
y
1
b 1
=− − x
( log y − c ) a a
y = a ⋅ eb⋅x
log y = log a + b ⋅ x ⋅ log e
1
1
=
y a +b⋅x
Проверка уравнений регрессии с помощью дисперсионного анализа. Дисперсионный анализ как вспомогательное средство применим и в
корреляционно-регрессионном анализе. В частности, с его помощью можно проверить гипотезу о наличии связи между переменными (без постановки вопроса о форме этой связи). Далее последовательно можно испытать пригодность линейной регрессии и регрессии более высоких порядков. Если испытывается регрессия на несколько независимых переменных,
то дисперсионный анализ позволяет проверить существенность вклада дополнительных переменных.
Наличие зависимости между переменными проверяется с помощью
простой схемы дисперсионного анализа (полностью случайный отбор) при
условии, что для каждого уровня (числового значения) фактора имеется
несколько наблюдений результативного признака. В качестве фактора
здесь выступает независимая переменная. Если систематическая дисперсия
существенно выше случайной, то гипотеза об отсутствии связи отклоняется.
Проверка гипотезы линейной связи состоит в расчленении суммы
квадратов отклонений на две составляющие:
2
2
∑ ( y j − y ) = ∑ ( y j − y ) + ∑ e2j ,
m
j =1
m
j =1
m
(12)
j =1
где e j = y j − y . Первое слагаемое в этой сумме характеризует сумму квадратов, определяемую изменением по линейной регрессии (кратко – сумма
квадратов регрессии), второе – случайную составляющую (отклонение от
регрессии). Схема дисперсионного анализа имеет вид, представленный в
77
Известия ТулГУ. Технические науки. 2014. Вып. 10. Ч. 1
табл. 4.
Соответственно находится соотношение дисперсий, определяющее
расчетное значение критерия Фишера:
F=
s22
 1 

.
m − 2
;
2
s1
(13)
Табличное значение критерия Фишера FT определяется для соответствующего уровня значимости α и двух степеней свободы (в выражении (13) фигурные скобки): r1 = 1 и r2 = m − 2 .
Таблица 4
Схема дисперсионного анализа для проверки гипотезы
о наличии линейной связи
Источник
вариации
Сумма квадратов
(
m
Q2 = ∑ y j − y
Линейная регрессия
j =1
m
(
Q1 = ∑ y j − y
Остаточная вариация
j =1
m
(
Q0 = ∑ y j − y
Итого
j =1
)
)
Число
степеней
свободы
Оценка дисперсии
1
s22 = Q2
2
2
s12 =
m−2
)
Q1
m−2
2
m −1
Известны соотношения
∑ ( y − y)
m
2
j =1
m
∑
j =1
e2j
m
(
= ∑ yj − y
j =1
m
(
)
(
)(
= b2 ⋅ ∑ x j − x
j =1
)
2
m
2
;
(14)
)
−b⋅∑ xj − x ⋅ yj − y .
j =1
(15)
Этими соотношениями можно пользоваться при определении Q1
и Q1 .
Общее число степеней свободы равно m − 1 . Число степеней свободы для оценки остаточной дисперсии равно m − 2 . Таким образом, на долю
линейной регрессии остается m − 1 − ( m − 2 ) = 1 степень свободы. Отношение
дисперсий F позволяет проверить нулевую дисперсию о том, что переменные не имеют линейной связи. Аналогичный подход сохраняется и при
проверке гипотез о наличии регрессий более высоких степеней, т. е. дисперсия, обусловленная регрессией, сравнивается с остаточной дисперсией.
78
Механика деформируемого твердого тела и теория ОМД
Рассмотрим далее проверку гипотезы о существовании нелинейной
регрессии. Эту проблему можно решить, прибегая к дисперсионному анализу, следующим образом. Сначала определяются линейная регрессия и

m

 j =1



сумма квадратов отклонений от нее  ∑ e2j( л )  . Затем находятся нелинейная
регрессия, допустим, параболическая, и соответствующая остаточная сум
m


m
m

 j =1



 j =1

j =1


ма квадратов  ∑ e2j( нл )  . Разность  ∑ e2j( л ) − ∑ e2j( нл )  показывает, как
уменьшается (или увеличивается) случайная составляющая суммы квадратов отклонений. Можно, также, проверить, значимо или нет это уменьшение. Приведем схему дисперсионного анализа для этого случая (табл. 5).
Таблица 5
Схема дисперсионного анализа для проверки гипотезы
о наличии нелинейной связи
Источник
вариации
Сумма квадратов
Число
степеней
свободы
Оценка дисперсии
m−2
-
m
Линейная регрессия
Параболическая
регрессия
Криволинейность
Q0 = ∑ e2j( л )
j =1
m
Q1 = ∑ e2j( нл )
m−3
Q2 = Q0 − Q1
1
j =1
s12 =
Q1
m−3
s22 = Q2
Для проверки нулевой гипотезы (криволинейность и соответственно сокращение остаточной суммы квадратов несущественны) находим отношение дисперсий
F=
s22
;
2
s1
 1 

.
 m − 3
(16)
Ранее были оценены регрессии
y = 8, 405 + 1,899 ⋅ x и y = 0,9127 + 7, 7231⋅ x − 0, 6638 ⋅ x 2 .
Значим ли переход от линейной к квадратичной дисперсии?
Для ответа на этот вопрос составлена таблица дисперсионного анализа
(табл. 6).
79
Известия ТулГУ. Технические науки. 2014. Вып. 10. Ч. 1
Таблица 6
Схема дисперсионного анализа
для проверки нулевой гипотезы в примере
Источник
вариации
Линейная регрессия
Параболическая
регрессия
Криволинейность
Сумма квадратов
96,7
7,5
89,2
Число
степеней
свободы
8-2
Оценка дисперсии
-
8-3
1,5
1
89,2
По полученным данным расчетное значение F = 59, 5 . Для α = 0, 05 ,
r1 = 1 и r2 = 8 − 3 = 5 табличное значение критерия Фишера FT = 6, 61 . Поскольку F = 59, 5 < FT = 6, 61 , то нулевая гипотеза отвергается.
Таким образом, в данной работе подробно рассмотрены основные
аспекты проведения математических операций и действий, рекомендуемых
для реализации нелинейного регрессионного анализа на соответствующем
этапе разработанной методики статистического машинного эксперимента с
детерминированной моделью.
Список литературы
1. Советов Б.Я., Яковлев С.А. Моделирование систем: учебник для
вузов. М.: Высшая школа, 2009. 343 с.
2. Панфилов Г.В., Недошивин С.В. Активный статистический анализ систем с теоретическими моделями проведением машинного эксперимента // Известия ТулГУ. Технические науки. Тула: Изд-во ТулГУ. 2011.
Вып. 4. С. 27-34.
3. Панфилов Г.В., Недошивин С.В., Перминов Д.А. Применение
статистического машинного эксперимента для исследования теоретической модели штамповки сердечников пуль // Известия ТулГУ. Технические
науки. Тула: Изд-во ТулГУ. 2011. Вып. 4. С. 27-34.
4. Панфилов Г.В., Недошивин С.В., Калинин С.С. Планирование и
первичная обработка результатов статистического машинного эксперимента на основе множественного корреляционно-регрессионного анализа //
Известия ТулГУ. Технические науки. Тула: Изд-во ТулГУ. 2011. Вып. 4.
С. 27-34.
5. Недошивин С.В. Линейный множественный регрессионный анализ в статистическом машинном эксперименте // Известия ТулГУ. Технические науки. Тула: Изд-во ТулГУ. 2011. Вып. 4. С. 27-34.
80
Механика деформируемого твердого тела и теория ОМД
6. Информационно-статистические методы в технологии машиностроения: пособие по обработке результатов эксперимента В.Г. Григорович [и др.] М.: Изд-во «Нефть и газ» РГУ нефти и газа им. И.М. Губкина,
2000. 184 с.
Недошивин Сергей Владимирович, канд. техн. наук, доц., Archon80@mail.ru,
Россия, Тула, Тульский государственный университет
THE NONLINEAR REGRESSION ANALYSIS IN STATISTICAL
MACHINE EXPERIMENT
S. V. Nedoshivin
The technique of carrying out statistical machine experiment is offered in the analysis of studied technological system with the determined model. Aspects of carrying out the
nonlinear multiple correlation analysis at the final stages of the developed technique are considered.
Key words: statistical machine experiment, multiple nonlinear regression
analysis.
Nedoshivin Sergey Vladimirovich, candidate of technical sciences, docent, Archon80@mail.ru, Russia, Tula, Tula State University
81
Документ
Категория
Без категории
Просмотров
7
Размер файла
229 Кб
Теги
анализа, нелинейные, эксперимент, статистический, регрессионных, машинное
1/--страниц
Пожаловаться на содержимое документа