close

Вход

Забыли?

вход по аккаунту

?

Bure lab r N3 1

код для вставкиСкачать
ЛАБОРАТОРНАЯ РАБОТА N 3_1
Проверка статистических гипотез
I. Критерий согласия хи-квадрат
1.Получите выборку объемом 100 значений из нормально распределенной генеральной совокупности с помощью стандартного средства Excel Сервис\Анализ данных\Генерация случайных чисел. В отсутствие данного пункта в меню необходимо в Надстройках указать Пакет анализа, после чего Анализ данных должен стать доступным в меню Сервис.
Для того чтобы с помощью Сервис\Анализ данных\Генерация случайных чисел получить выборку из нормального распределения необходимо заполнить соответствующие поля:
Число переменных - поле, указывающее число выводимых столбцов данных; если необходимо получить значения только в одном столбце, то это поле можно оставить пустым;
Число случайных чисел - объем выборки (в нашем случае 100);
Распределение - тип распределения: выберите в списке Нормальное и укажите его Параметры: математическое ожидание и среднее квадратическое отклонение (выберите произвольно);
Случайное рассеивание - это поле можно оставить пустым;
Параметры вывода - в поле Выходной интервал укажите адреса диапазона, состоящего из 100 ячеек, в который будут выведены значения (можно указать только адрес первой ячейки - в этом случае все остальные значения будут записаны ниже в том же столбце).
2.Разбейте диапазон изменения показателя на конечное число непересекающихся интервалов и для каждого из них подсчитать частоту попаданий значений показателя (т.е. число значений выборки, попавших в интервал). Результаты последующих вычислений удобно сгруппировать в таблицу, в которой кроме названий интервалов разбиения и их правых границ следует также указать середины интервалов разбиения. Пусть минимальное значений выборки равно 1, а максимальное - 21. Тогда размах выборки равен . Разобьем весь диапазон на интервалов, первый и последний интервалы полу бесконечные, остальные интервалы равной длины . Следовательно, правым границам интервалов разбиения соответствуют числа 5, 9, 13, 17, а серединам конечных интервалов - числа 7, 11, 15.
Для подсчета частот попадания значений показателя в интервалы разбиения используется функция ЧАСТОТА, являющаяся функцией массива. Поэтому сначала необходимо выделить ячейки, в которых будут записаны найденные частоты (в нашем случае 5 ячеек), вставить функцию, используя мастер функций, поставить курсор в строку формул (или нажать F2) и ввести функцию в выделенные ячейки с помощью нажатия (одновременного!) Ctrl+Shift+Enter.
Аргументами функции ЧАСТОТА являются:
Массив_данных - весь интервал ячеек, в которых содержится выборка;
Двоичный_массив - адреса ячеек, в которых содержатся значения правых границ интервалов разбиения (группировки).
В результате в выделенных ячейках будет получено пять чисел, первое из которых равно числу значений выборки, попавших в 1-й интервал, второе - попавших во 2-й интервал и т.д. Сумма значений полученных частот должна быть равна объему выборки .
3. Вычислите относительные частоты попадания в каждый интервал разбиения. Относительная частота равна значению соответствующей частоты, деленной на число элементов выборки (в нашем случае 100): . Сумма значений полученных относительных частот должна быть равна 1.
4. Вычислите вероятности попадания наблюдений выборки в интервалы разбиения (группировки). Обозначим правые концы интервалов: ,
тогда , где - математическое ожидание генеральной совокупности (значение, которое использовалось при генерировании выборки из нормального распределения), - среднее квадратическое отклонение (значение, которое использовалось при генерировании выборки из нормального распределения).
5. Вычислите значение статистики хи-квадрат по формуле
, где - число интервалов разбиения.
6. Найдите по таблицам распределения хи-квадрат для вероятности ошибки первого рода 0,05 с числом степеней свободы , вместо таблиц можно применить функцию хи2обр для нахождения .
7. Проверьте гипотезу согласия , сравнив вычисленное значение статистики (в п.5) с , где - неизвестная функция распределения генеральной совокупности.
8. Проверьте сложную гипотезу согласия заменив истинные значения параметров оценками, вычисленными по группированным данным:
для этого рассмотрим минимальный () и максимальный () элементы выборки и положим , после чего рассмотрим интервалы:
и середины этих интервалов: , оценки неизвестных параметров вычислим по формулам:
.
9. Повторите пункты 4 и 5, заменив истинные значения параметров найденными оценками. Повторите пункт 6, для того чтобы найти , соответствующее вероятности 0,95 с числом степеней свободы r-3. 10.Проверьте сложную гипотезу согласия , сравнив вычисленное значение статистики с табличным значением.
11. Смоделируйте 20 независимых выборок из любого распределения (максимально не похожего на нормальное распределение) с постоянным математическим ожиданием и постоянной дисперсией , по 10 - 15 наблюдений в каждой выборке (далее обозначает число наблюдений). Вычислите выборочное среднее по каждой из 20 выборок. Для получившейся совокупности значений проверьте гипотезу о том, что эта совокупность представляет собой выборку из нормального распределения со средним и дисперсией на уровне значимости 0,05. Если гипотеза будет принята, то в отчете дайте этому теоретическое объяснение. II. Критерий согласия Колмогорова.
Проверьте простую гипотезу согласия по Критерию Колмогорова для смоделированных выборок.
Альтернативная гипотеза заключается в том, что нулевая гипотеза неверна. В силу теоремы Гливенко-Кантелли эмпирическая функция распределения представляет собой состоятельную оценку теоретической функции распределения, то есть при условии истинности гипотезы и непрерывности функции распределения справедливо
.
Статистика Колмогорова имеет вид , если нулевая гипотеза верна и функция распределения непрерывна, то закон распределения статистики Колмогорова оказывается одним и тем же для всех непрерывных функций распределения, он зависит только от объема выборки. Для малых для статистики при справедливости гипотезы составлены таблицы процентных точек. Для больших распределение статистики при справедливости гипотезы указывает теорема Колмогорова. Теорема. При справедливости гипотезы и непрерывности функция распределения справедливо
Алгоритм проверки нулевой гипотезы по критерию Колмогорова выглядит следующим образом. По исходной выборке надо вычислить значение статистики . Для этого можно воспользоваться формулой
,
здесь элементы вариационного ряда.
Полученную величину сравнивают с критическим значением, взятым из статистической таблицы, для выбранного уровня значимости 0.05. Нулевую гипотезу отвергают, если значение статистики превосходит выбранное критическое значение, в противном случае нулевую гипотезу принимают. Аналогично предыдущему можно применить подход на основе значения.
Оформите отчет.
Документ
Категория
Рефераты
Просмотров
21
Размер файла
121 Кб
Теги
lab, bure
1/--страниц
Пожаловаться на содержимое документа