close

Вход

Забыли?

вход по аккаунту

?

Презентация

код для вставкиСкачать
Анализ данных в системе Fitter
Алексей Померанцев
Институт химической физики РАН
17.02.03
1
Содержание
1. Введение
2. Данные
3. Модель
4. Оценка параметров
5. Пример BoxBod
6. Прогнозирование
7. Тестирование модели
8. Мультиколлинеарность
9. Прогноз срока службы ПВХ изоляции
10.Выводы
17.02.03
2
1. Введение
17.02.03
3
Содержательно (hard)
или формально (soft)?
Содержательно
Откуда
Формула
Физика, химия, ….
Формально
Математика, …
y=Xa+e
e
Разнообразие
украшает жизнь!
y=f (x,a)+
Трудно ?
Легко ?
Проблемы
Придумать модель
Получить данные
Назначение
Экстраполяция
Построение
Программы
17.02.03
Fitter, Matlab, Origin, …
Интерполяция
Unscrambler, Simca, SIC,…
4
Система Fitter
Fitter –это
надстройка
(Add-In)
к программе
Excel
Фактор
A
B
C
D
1
2
3
E
B o x B o d D a ta
x
y
w
Значения
Отклик
F
G
Веса
H
P a ra m e te rs
f
a
11
2
03
0 .8 0 9 4 1
b
0 .5
.4 4 7 2 3 7 5
4
0
0
5
5
1 109
1
6
2 149
1 1 4 2 .2 4
'BoxBOD model
7
7
3 149
1 1 7 2 .4 1
y=a*[1-exp(-b*x)]
8
8
5 191
7 213
10 224
1 1 9 9 .9 5
1 2 0 9 .1 7
1 2 1 2 .9 1
9
9
10
0
1
11
0 .0 0
I
J
K
L
M
y
200
9 0 .1 1
100
a=?
b=?
0
0
Модель
17.02.03
Комментарии
Параметры
4
8
x
Уравнение
5
Установка Fitter Add-In
Fitter Add-In
установлен!
17.02.03
6
Главный диалог системы Fitter
Число
итераций
Пауза на
итерации
Точность
поиска
Вывод хода
поиска
Вывод
результатов
Поиск
Настройки
Регистрация
данных
Регистрация
модели
Регистрация
апр. инфор.
Дополнит.
диалог
Выход
Помощь
17.02.03
7
2. Данные
17.02.03
8
Данные и ошибки
При содержательном
подходе связь между
a
y
f
w
X
данными нелинейная
например
Отклик
Предикторы
y
1
x 11 x 12
y
2
x 21 x 22
.
.
.
.
y
.
.
.
.
N
.
.
.
.
.
.
.
.
.
.
.
x N1 x N2
Веса
x 1m
w
1
x 2m
w
2
x
Модель
f1
.
.
.
.
.
.
Параметры
a
1
f2
a
2
.
.
.
a
.
Nm
w
.
p
fN
N
y = f + e *x)+a *exp(a
y=a1*exp(a
2
3 Вес и дисперсия
4*x)
Абсолютная
Относительная
17.02.03
i
i
i
yi = f i (1 + e i )
wi cov( e i , e i ) = e = Const
2
2
9
Регистрация типа ошибки
Настройки
17.02.03
10
Регистрация типа ошибки . Шаг 1
Абсолютная
ошибка
Тип ошибки
установлен!
Относительная
ошибка
17.02.03
Продолжить
Точность
вычислений
Формат
таблиц
Панель
инструментов
Закончить
11
Представление данных в системе Fitter
Отклик
Левая и правая границы
доверительных интервалов
Модель
Все данные
вводятся
и выводятся на
страницу Excel
Промежуточная
переменная
Вес
Предикторы
Дисперсия
CO Data
Титул
Заголовок
Тело
17.02.03
P
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.1
0.1
…
…
…
…
10
10
10
10
t
CO
W
0
0.000 0
1
0.011 1
1
0.011 1
1
0.008 1
1
0.011 1
2
0.066 1
2
0.064 1
2
0.057 1
2
0.067 1
…
…
…
…
…
…
…
…
…
…
…
…
16
9.384 1
16
9.911 1
16 10.400 1
16
9.737 1
Fit
0.000
0.011
0.011
0.011
0.011
0.063
0.063
0.063
0.063
…
…
…
…
9.942
9.942
9.942
9.942
ROOH Left
0.000
0.053
0.053
0.053
0.053
0.161
0.161
0.161
0.161
…
…
…
…
1.416
1.416
1.416
1.416
0.000
0.010
0.010
0.010
0.010
0.061
0.061
0.061
0.061
…
…
…
…
9.418
9.418
9.418
9.418
Right
Var
0.000
0.011
0.011
0.011
0.011
0.066
0.066
0.066
0.066
…
…
…
…
10.311
10.311
10.311
10.311
0.018
0.018
0.018
0.018
0.002
0.002
0.002
0.002
…
…
…
…
0.179
0.179
0.179
0.179
Повторные
измерения
12
Регистрация данных
Регистрация
данных
17.02.03
13
Регистрация данных. Шаг 1
Адрес
таблицы
данных
Закончить
Продолжить
17.02.03
14
Регистрация данных. Шаг 2
Первый ряд
таблицы – это
титул
Интерпретация
столбца таблицы
данных
Продолжить
Вернуться
на шаг
назад
17.02.03
Закончить
15
Регистрация данных. Шаг 3
При регистрации
данные нельзя
изменить, а
можно только
объяснять
Результаты
регистрации
таблицы
данных
Вернуться
на шаг
назад
17.02.03
Закончить
16
3. Модель
17.02.03
17
Данные и модель
Мера согласия
данных и моделиэто сумма
квадратов
отклонений
y
y
y
о
т
y
к
y
y
л
и
к
y
y
y
f
f
ff
f
f
y
y
y
y
y
ff
f
ff
f
f
y
f
f
f
f
f
y
yf
yy y
y
ff
f
f
Мера согласия
f
y
y
предикт ор
17.02.03
18
Представление модели в системе Fitter
Модель записывается
в текстовое поле
(Text Box), а
параметры на
страницу Excel
17.02.03
19
Модель f(x,a)
'Цикл "увлажнение-сушка"
M=Sor*hev(t1-t)+Des*[hev(t-t1)+imp(t-t1)]
'Кинетика "увлажнения"
Sor=Sor1*hev(USESor1)+Sor2*[hev(-USESor1)+imp(-USESor1)]
'Кинетика "сушки"
Des=Des1*hev(USEDes1)+Des2*[hev(-USEDes1)+imp(-USEDes1)]
'Условие применимости асимптотик
USESor1=Sor2-Sor1
USEDes1=Des1-Des2
'константы и промежуточные величины
t3=(t-t1)*hev(t-t1)
t4=t*hev(t1-t)+t1*[hev(t-t1)+imp(t-t1)]
P2=PI*PI
P12=(PI)^(-0.5)
R=r*(M1-M0)*exp(-r*t4)
K=M1+(M0-M1)*exp(-r*t4)
V0=M0-C0
V1=M1-C0
'асимптотика сорбции при 0<t<tau
Sor1=C0+4*P12*(d*t)^0.5*[M0-C0+(M1-M0)*beta]
beta=1-exp(-z)
x=r*t
z=(a1*x+a2*x*x+a3*x*x*x)/(1+b1*x+b2*x*x+b3*x*x*x)
a1=0.6666539250029
a2=0.0121051017749
a3=0.0099225322428
b1=0.0848006232519
b2=0.0246634591223
b3=0.0017549947958
'кинетика сорбции при tau<t<t1
Sor2=K-8*S1
S1=U01/n0+U11/n1+U21/n2+U31/n3+U41/n4
n0=P2
U01=[(V0*n0*d-V1*r)*exp(-n0*d*t4)+R]/(n0*d-r)
n1=P2*9
U11=[(V0*n1*d-V1*r)*exp(-n1*d*t4)+R]/(n1*d-r)
n2=P2*25
U21=[(V0*n2*d-V1*r)*exp(-n2*d*t4)+R]/(n2*d-r)
n3=P2*49
U31=[(V0*n3*d-V1*r)*exp(-n3*d*t4)+R]/(n3*d-r)
n4=P2*81
U41=[(V0*n4*d-V1*r)*exp(-n4*d*t4)+R]/(n4*d-r)
'асимптотика десорбции при t1<t<t1+tau
Des1=K*[1-4*P12*(d*t3)^0.5]-8*S1
'кинетика десорбции при t1+tau<t
Des2=8*S2
S2=U02/n0+U12/n1+U22/n2+U32/n3+U42/n4
U02=(K-U01)*exp(-n0*d*t3)
U12=(K-U11)*exp(-n1*d*t3)
U22=(K-U21)*exp(-n2*d*t3)
U32=(K-U31)*exp(-n3*d*t3)
U42=(K-U41)*exp(-n4*d*t3)
'неизвестные параметры
d=?
M0=?
M1=?
C0=?
r=?
t1=?
Различные формы записи одной и той же модели
y = a + (b – a)*exp(–c*x)
Явная
Очень
сложная
модель!
0 = a + (b – a)*exp(–c*x) – y
Неявная
Дифф. уравнение
d[y]/d[x] = – c*(y –a); y(0) = b
Представление в Fitter
'
Explicit model
y=a+(b-a)*exp(-c*t)
a=?
b=?
c=?
17.02.03
'
Diff. equation
d[y]/d[t]=-c*(y-a); y(0)=b
a=?
b=?
c=?
20
Регистрация модели
Регистрация
модели
17.02.03
21
Регистрация модели. Шаг 1
Выбор
текстового поля
с моделью
Адрес первой
клетки
таблицы
параметров
Закончить
Продолжить
17.02.03
22
Регистрация модели. Шаг 2
Вид модели
Переменные
модели
Продолжить
Закончить
Вернуться
на шаг
назад
17.02.03
23
Регистрация модели. Шаг 3
При регистрации
модель нельзя
изменить, а
можно только
объяснять
Первый ряд
таблицы
параметров –
это титул
Вернуться
на шаг
назад
17.02.03
Начальные
значения
параметров
Закончить
24
4. Оценка параметров
17.02.03
25
Целевая функция Q(a)
Целевая функция Qэто сумма квадратов
и, может быть,
что-то еще…
Сумма квадратов
Байесовский член
Целевая функция
Оценки параметров
17.02.03
26
Градиентный метод поиска оценок
Исходная точка a0
Локальный минимум
17.02.03
O b je ctiv e fu n ctio n Q (a )
Проблемы поиска
Целевая функция Q(a)
Матрица A –
это ключ
к поиску!
P a ra me te rs aa a 7a a6 a
Параметры
5 4 a 3
a2
a
1
a0
27
Точность оценивания (статистики)
Матрица A –
это мера
качества
оценивания!
Матрица ковариаций
Средне-квадратичные
отклонения оценок
Матрица корреляций
F-матрица (Фишера)
Оценка дисперсии и число
степеней свободы
17.02.03
28
Регистрация настроек статистик
Настройки
17.02.03
29
Регистрация настроек . Шаг 1
Продолжить
17.02.03
30
Регистрация настроек статистик. Шаг 2
Общие
данные
СКО
Ковариации
Корреляции
F-матрица
Итоги поиска
Закончить
17.02.03
31
5. Пример BoxBod (NIST)
Модель
Данные
x
y
1
f
109
90.11
Посмотрим, как
работает Fitter
2
149
142.24
3
149
172.41
Параметры
5
191
199.95
О ценки
7
213
209.17
a1
213.809
12.3545
10
224
212.91
a2
0.547237
0.104560
СКО
Априорная (байесовская) информация
17.02.03
32
Переключаемся в Excel
17.02.03
33
6. Прогноз
17.02.03
34
Достоверный прогноз
Достоверный
прогноз
должен учитывать
погрешности
в оценках
Оценка отклика
Доверительные границы
Линеаризация
17.02.03
35
Имитационное прогнозирование
Нелинейные модели
требуют специальных
методов достоверного
прогноза
17.02.03
36
Пример разных методов прогноза
Модель старения
резины
Y = 1e
( kt )
a
k =e
,
k0 E
RT
Линеаризация –
быстро, но не точно,
моделирование –
точно,но долго
Результат ускоренных испытаний
Y
1 .0 0
Верхняя доверительная граница
T =383K
Y
T =368K
1 .0 0
М о д е л и р о в а ни е
Л и не а р и з а ц и я
T =353K
0 .8 0
T =293K
В с р е д не м
0 .8 0
0 .6 0
0 .6 0
0 .4 0
0 .4 0
0 .2 0
0 .2 0
0 .0 0
0 .0 0
0
24
48
72
tim e , h r
17.02.03
96
120
0
60
120
180
240
300
360
tim e , d a y
37
Регистрация настроек прогноза
Настройки
17.02.03
38
Регистрация настроек . Шаг 1
Продолжить
17.02.03
39
Регистрация настроек прогноза. Шаг 2
Достоверность
прогноза
Метод линеаризация
Метод моделирование
Число повторов
Правая
граница
Левая
граница
Закончить
17.02.03
40
7. Тестирование модели
17.02.03
41
Проверка гипотез
Статистика x сравнивается с критическим значением t (a)
Из
эксперимента
17.02.03
Тестовая статистика x
Проверка не доказывает
верности модели!
Она только показывает,
что гипотеза
противоречит или не
противоречит данным!
Из
теории
42
Адекватность и гомоскедастичность
Эти тесты используют выборочные дисперсии
и они не могут быть проверены без реплик!
Эти тесты
часто вводят
в заблуждение
6
Реплика 1
Реплика 2
75
О ткл и к
4
50
2
Дисперсии
по
репликам
Диспе рсия
100
25
0
0
0 .5
1 .5
2 .5
3 .5
4 .5
5 .5
П р е д и к то р
17.02.03
43
Выбросы и тест серий
Эти тесты используют только остатки, поэтому
они могут быть проверены и без реплик
Положительные остатки
1 .2
О ткл и к
Тест серий –очень
чувствительный !
1
С е рий з на ко в
5
По ло ж ит е ль ны х о с т а т ко в
6
О т риц а т е ль ны х о с т а т ко в 1 1
0 .8
0 .6
Отрицательные остатки
Вы брос
0 .4
0 .2
0
17.02.03
5
Приемлемые
отклонения
10
15
П р е д и к то р
44
Регистрация настроек проверки гипотез
Настройки
17.02.03
45
Регистрация настроек . Шаг 1
Продолжить
17.02.03
46
Регистрация настроек гипотез. Шаг 2
Уровень
значимости
Тест выбросов
Тест
адекватности
Тест дисперсий
Тест серий
Коэффициент
нелинейности
Закончить
17.02.03
47
8. Мультиколлинеарность
17.02.03
48
Что такое мультиколлинеарность
Мультиколлинеарность – это вырождение матрицы A
Целевая функция Q(a)
Мультиколлинеарность
– это наш главный
враг!
88
7.2
7.2
6.4
6.4
a1
5.6
5.6
4.8
4.8
44
3.2
3.2
2.4
2.4
1.6
1.6
0.8
0.8
000
1.2
1.2
2.4
2.4
a2
3.6
3.6
4.8
4.8
66
это мера вырождения
матрицы A
7.2
7.2
Разброс собственных
значений:
N(A) = 2
1
7
6
5
4
17.02.03
49
Причины мультиколлинеарности
“Нестрогая” мультиколлинеарность
“Строгая” мультиколлинеарность
1 .0
0
.2 6
.6
.1
0
2
y
Планирование
эксперимента!
1 .0
0
.5 5
.1
0
a 2 x = 00
0 05
10.0
.5
.1
0
0 .0
.8 4
.4
0
8
0 .0
.6 3
.3
0
6
0 .0
.4 2
.2
0
4
0 .0
.2 1
.1
0
2
x
0 .0 0
0
17.02.03
5
10
50
Подготовка данных и модели
((a + b) + c) + d a + (b + (c + d)) т.к. 1+10 –20 = 1
64-х битное представление числа в компьютере
Компьютеру
трудно – нужно
ему помочь!
1
0
0
1
…
0
1
1
Средства
Цель сделать матрицу A регулярной, т.е. уменьшить N(A)
Шкалирование
X mX
Центрирование
X X – X0
Перепараметризация
17.02.03
a (a) x (x)
y (y)
51
Пример: закон Аррениуса
Обычная форма записи
Улучшенная форма записи
Простые
преобразования,
дающие большой
N(A) выигрыш!
= 20
N(A) = 2
Шкалирование и центрирование
Перепараметризация
17.02.03
52
Вычисление производных и точность
N(A)
A-1
y=f (a,x)
0=f (y,a,x)
dy/dx=f (y,a,x)
6
10
8
6+2=8
10+2=12
8+2=10
8+0=8
12+0=12
10+0=10
8+2=10
10+2=12
12+2=14
14+2=16
10+2=12
12+2=14
1) Численное вычисление разностных производных
C
2) Автовычисление аналитических производных
f=exp(-a*t)
17.02.03
df/da=-t*exp(-a*t)
53
9. Прогноз срока службы ПВХ изоляции
17.02.03
54
Постановка задачи
Предсказать
Цель
Прогноз срока службы
значения,которые
нельзя измерить
– это экстраполяция!
Объект
Кабельная изоляция из ПВХ
Эксперимент
Термогравиметрический метод
Обработка
Нелинейная регрессия + Fitter
17.02.03
55
ТГА эксперимент и данные
ТГА эксперимент
ТГА данные
510
490
0 .9 8
470
0 .9 6
450
430
0 .9 4
410
0 .9 2
Т е м пе р а ту р а T , K
И зм е н е ни е м а с с ы , y
1 .0 0
390
0 .9 0
370
0
10
20
30
40
50
В р е мя t , ми н
Это схема эксперимента, а не грешник в аду!
17.02.03
56
Переменные в примере ТГА
Оцениваемые
Измеряемые
Нелинейная
задача малой
размерности!
Промежуточные
Отклик
y=m/m
0
Изменение массы
Факторы
t
C0
v
T0
F
C Концентрация пластификатора
Параметры
Время
y0 Начальное значение y
Исходная концентрация
k0 Константа скорости испарения
Скорость нагрева
E Энергия активации
Начальная температура
Удельная поверхность образца
Удельная поверхность образца F = S =
V
17.02.03
2R
R r2
2
57
Модель испарения пластификатора
dy
= k C , y (0 ) = y 0
dt
Диффузия
здесь
не важна!
Закон испарения
Изменение объема
Закон Аррениуса
Рост температуры
17.02.03
C = 1
1 C0
y
æ
ç
ç
ç
è
ö
E
÷
k = F exp k0 ÷
RT ÷ø
T=T0+vt
58
Пример ТГА на рабочем листе Fitter
A
B
C
D
E
F
G
H
I
T0
C
F
t
y
f
L e ft
J
K
L
M
N
O
1
2
D a ta
3
v
4
3 373
0 .3
2 .4
0 .0 0
1 .0 0 0
1 .0 0 1
1 .0 0 1
5
3 373
0 .3
2 .4
1 .1 5
1 .0 0 0
1 .0 0 1
1 .0 0 1
6
3 373
0 .3
2 .4
2 .2 5
1 .0 0 0
1 .0 0 1
1 .0 0 0
7
3 373
0 .3
2 .4
3 .4 0
1 .0 0 0
1 .0 0 1
1 .0 0 0
8
3 373
0 .3
2 .4
4 .5 5
1 .0 0 0
1 .0 0 1
1 .0 0 0
9
3 373
0 .3
2 .4
5 .6 5
1 .0 0 0
1 .0 0 1
1 .0 0 0
T=T0+v*t
10
3 373
0 .3
2 .4
6 .7 5
1 .0 0 0
1 .0 0 1
1 .0 0 0
R=1.98717
11
3 373
0 .3
2 .4
7 .8 5
1 .0 0 0
1
1 .0 0 0
y0=?
12
3 373
0 .3
2 .4
9 .0 0
1 .0 0 0
1
1 .0 0 0
k0=?
13
3 373
0 .3
2 .4
1 0 .1 0
1 .0 0 0
1
1 .0 0 0
E=?
15
0 293
0 .4
2
3E +06
0 .9 3 1
0 .9 1 5
P a r a m e te r s e s tim a tio n
16
0 293
0 .4
2
5E +06
0 .8 7 1
0 .8 4 4
Na m e
17
0 293
0 .4
2
8E +06
0 .8 2 1
0 .7 8 8
y0
1
1 .0 0 0 8 8
0 .0 0 0 2
18
0 293
0 .4
2
1E +07
0 .7 8 1
0 .7 4 6
k0
10
1 3 .9 9 6 4
0 .2 4 0 1 6
19
0 293
0 .4
2
1E +07
0 .7 4 8
0 .7 1 4
E
10000
1 8 0 5 2 .3
2 2 5 .4 2 4
Просто!
'TGA Desorbtion Model
D[y]/D[t]=-k*[1-(1-C0)/y];y(0)=y0
k=F*exp(k0-E/R/T)
14
In itia l
F in a l
D e v ia tio n
20
17.02.03
59
Прогноз срока службы
На все условия,
произвольный
размер,с любой
достоверностью!
17.02.03
60
10. Выводы
Формальный
подход
Загадочная природа
Содержательный
подход
Спасибо
за
внимание!
17.02.03
61
Документ
Категория
Презентации по информатике
Просмотров
0
Размер файла
1 264 Кб
Теги
1/--страниц
Пожаловаться на содержимое документа