close

Вход

Забыли?

вход по аккаунту

?

kursach(49)

код для вставкиСкачать
Федеральное агентство РФ по образованию
Государственное образовательное учреждение высшего профессионального образования
"Псковский государственный университет"
Кафедра "менеджмент организации и управление инновациями"
КУРСОВАЯ РАБОТА ПО СТАТИСТИКЕ
Вариант №04
Группа: 0013-08Выполнил студент: Терской В.В. Научный руководитель: Гальдикас Лариса Николаевна
Псков
2013г.
СОДЕРЖАНИЕ.
стр.
1.Задание № 1.
32.Задание № 2.
103.Задание № 3.
294.Задание № 4.
335.Задание № 5.
45Список литературы.49
Задание №1.
На основе данных, приведенных в таблице 2 приложения и соответствующих варианту (таблица 1) и требованиям преподавателя об интервале наблюдения, составить таблицу исходных данных и выполнить следующее:
1. Структурную равноинтервальную группировку по обоим признакам. Если вариация группировочного признака значительна, то при построении группировки по признаку № 1 необходимо определить оптимальное число равноинтервальных групп, а по признаку № 2 разбить совокупность на четыре группы. Результаты группировки необходимо представить в таблице и сделать выводы.
2. Аналитическую группировку, для этого определить признак-фактор и признак-результат, обосновав их выбор. Результаты представить в таблице. Сделать выводы о наличии и направлении взаимосвязи между признаками.
3. Комбинационную группировку по признаку-фактору и признаку-результату. Сделать выводы.
Решение:
Таблица 1.1. Исходные данные
№
п/прегионыПлощадь территории на 1 января 2009г., тыс. км. Кв.Число дорожно-транспортных происшествий на 1000000 населения115.Тверская обл.84,20218,60216. Тульская обл.25,70194,10317. Ярославская обл.36,20183,50418.Респ. Карелия180,50114,60519.Респ. Коми416,80151,90620.Архангельская обл.588,90197,60721.Вологодская обл.144,50196,00822.Калининградская обл.15,10145,80923. Ленинградская обл.83,90203,201024.Мурманская обл.144,90118,80
Продолжение таблицы 1.1
1125.Новгородская обл.54,50287,301226. Псковская обл.55,40220,901327. Республика Дагестан50,3055,101428.Кабардино-Балкарская респ.12,5086,601529.Краснодарский край75,50134,301630.Ставропольский край66,20103,801731.Астраханская обл.49,00128,001832.Волгоградская обл.112,90122,101933.Ростовская обл.101,00146,402034. Респ. Башкиртостан142,90132,202135.Респ. Мордовия26,10142,002236.Респ. Татарстан67,80158,202337.Удмуртская респ.42,10117,502438.Чувашская респ.18,30148,302539.Пермский край160,20149,902640.Кировская обл.120,40187,802741.Нижегородская обл.76,60179,902842. Оренбургская обл.123,70158,102943.Пензенская обл.43,40124,003044.Самарская обл.53,60147,503145.Ульяновская обл.37,2098,503246.Курганская обл.71,50156,703347.Свердловская обл.194,30167,903448. Тюменская обл.1464,20195,403549.Челябинская обл.88,50147,903650.Алтайский край168,00157,403751.Забайкальский край431,90131,603852.Красноярский край2366,80176,003953.Иркутская обл.774,80159,704054.Кемеровская обл.95,70127,604155.Новосибирская обл.177,80116,404256.Омская обл.141,10160,104357.Томская обл.314,4081,704458.Камчатский край463,30164,804559.Примоский край164,70228,604660.Амурская обл.361,90151,20Продолжение таблицы 1.1
4761. Магаданская обл.462,50135,404862.Сахалинская обл.87,10219,204963.Еврейская авт. обл.36,30223,805064.Чукотская авт. обл.721,5052,10
1. Структурная равноинтервальная группировку по обоим признакам.
Группировка - это распределение единиц совокупности по группам в соответствии с группировочным признаком. Назначение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде.
Формула Стерджесса для определения оптимального числа групп:
n=1+3.322*lgN, где n - число групп;
N - число единиц совокупности.
N=83
n=1+3.322*lgN = 1+3.322*lg83=1+3.322* 1,69897= 6,644=7
Число групп: n=7.
Признак № 1: Площадь территории на 1 января 2009 г., тыс.км.кв.
Х max = 2366,8тыс.кв.км.( Красноярский край)
Х min = 12,5тыс.кв.км. (Кабардино-Балкарская Респ.)
Величина отдельного интервала:
∆=(2366,8-12,5)/7=336,329 тыс.чел.
Структурная группировка служит для исследования совокупности по одному признаку.
Таблица 1.2
Структурная группировка регионов по площади территории на 1 января 2009 г.
Площадь территории на 1 января 2009 г., тыс.кв.км.Количество регионов в отдельной группеВ процентах к итогу(%)12,5-348,8294080348,829-685.157 612685,157-1021,486241021,486-1357,814001357,814-1694,143121694,143-2030,471002030,471-2366,812Итого:50100 Вывод: На основании данной таблицы можно сделать вывод: Среди выбранных областей, большинство (80%) занимает территорию, площадью от 12,5 тыс. кв. км. До 348,829 тыс. кв. км. Лишь одна область (2%) занимает территорию в интервале от 2030,471 тыс. кв. км. до 2366,8 тыс. кв. км. (Красноярский край, чья площадь 2366,8 тыс. кв. км.).
Признак №2: Число дорожно-транспортных происшествий на 100000 человек населения.
Х max = 287,30 (Новгородская обл.)
Х min = 52,10 (Чукотская авт. обл.)
Величина отдельного интервала:
∆=(287,30 -52,10)/7=33,6 Таблица 1.3
Структурная группировка регионов по числу дорожно-транспортных происшествий на 100000 человек населения.
Число дорожно-транспортных происшествий на 100000 человек населения.Количество регионов в отдельной группеВ процентах к итогу (%)52,10-85,703685,70-119,30714119,30-152,901734152,90-186,501122186,50-220,10816220,10-253,7036253,70-287,3012Итого50100 Пример расчета столбика в % к итогу:
%=(3/50)*100% = 6%
Вывод: В 17 регионах, или 34% от выборки, число ДТП на 1 млн. человек населения находится в интервале от 119,30 до 152,90. А в 2% регионов (Новгородская обл.) число ДТП приблизительно равно 287.
2. Аналитическая группировка.
Аналитическая группировка служит для выявления аналитической зависимости между группировочными признаками. В данном случае за признак-фактор был взят показатель площади территории на 1 января 2009 г., тыс.кв.км., а признаком результатом было выбрано число дорожно-транспортных происшествий на 100000 человек населения. Иной выбор признака-фактора и признака-результата оказался бы нелогичным в данном случае. Таблица 1.4
Аналитическая таблица по признак - фактору: площадь территории на 1 января 2009 г., тыс.кв.км. Площадь территории на 1 января 2009 г., тыс.кв.км.Количество регионов в отдельной группеСреднее значение числа ДТПИтого по признаку-результату (число дорожно-транспортных происшествий на 100000 человек населения.)12,5-348,82940154,7586190,30348,829-685.157 6155,417932,50685,157-1021,4862105,9211,801021,486-1357,8140001357,814-1694,1431195,40195,401694,143-2030,4710002030,471-2366,81176,00176,00 Анализируя данную таблицу, можно сделать вывод: явной связи между площадью территории и числом ДТП не наблюдается. Тот факт, что число дорожно-транспортных происшествий на 100000 человек населения максимально в первой группе регионов, вполне логично объяснить тем, что в этой группе сконцентрировано максимальное из выборки число регионов. 3. Проследить зависимость между признаками можно также на основе комбинационной группировки. Комбинационная группировка осуществляется по двум и более признакам, взятым в сочетании.
Таблица 1.5
Комбинационная таблица площади территории на 1 января 2009 г. и числом дорожно-транспортных происшествий на 100000 человек населения
Площадь территории на 1 января 2009 г., тыс.кв.км.число дорожно-транспортных происшествий на 100000 человек населенияИтого количество регионов 52,10-85,7085,70-119,30119,30-152,90152,90-186,50186,50-220,10220,10-253,70253,70-287,3012,5-348,8293517852040348,829-685.15702012106685,157-1021,486000010121021,486-1357,814000000001357,814-1694,143000100011694,143-2030,471000000002030,471-2366,800010001 Итого количество регионов 37171183150 На основании полученных данных, можно сделать вывод: между рассматриваемыми признаками не наблюдается явной связи.
Задание №2.
1. На основе структурных группировок из задания 1 построить вариационные частотные и кумулятивные ряды распределения (по каждому признаку), оформить в таблицы, изобразить графически.
2. Проанализировать вариационные ряды распределения, вычислив для каждого из них: среднее арифметическое значение признака; медиану, квартили и моду; среднее квадратическое отклонение; коэффициент вариации.
3. Проверить теорему о разложении дисперсии, используя данные аналитической группировки.
4. Изобразить корреляционное поле. Построить уравнение регрессии. определить тесноту связи между признаками, используя дисперсионный и корреляционный анализ.
5. Сделать выводы.
Решение:
Ряд распределения - это числовой ряд, который представляет собой упорядоченное распределение единиц статистической совокупности. Он характеризует состав (структуру) изучаемого явления.
Объем совокупности: N = 50.
Таблица 2.1.
Вариационный частотный и кумулятивный ряд распределения по численности постоянного населения на конец года, тыс.чел.
Площадь территории на 1 января 2009 г., тыс.кв.км.
Количество регионов в отдельной группе, Середина интервала площади территории Показатель накопленной частоты 12,5-348,82940180,66440348,829-685.157 6516,99346685,157-1021,4862853,32148Продолжение таблицы 2.1.1021,486-1357,81401189,65481357,814-1694,14311525,978571491694,143-2030,47101862,307143492030,471-2366,812198,63571450 Итого 50 Гистограмма - графическое изображение интервального ряда распределения. При ее построении на оси абсцисс откладывают интервалы ряда. Над осью абсцисс строятся прямоугольники, основанием которых является интервал, а высота - соответствующая этому интервалу частота.
Кумулята - ломаная линия, изображающая ряд накопленных частот. Накопленные частоты наносятся в системе координат в виде ординат для границ интервалов; соединяя нанесенные точки отрезками прямых, получаем кумуляту. Кумуляту называют также полигоном накопленных частот. Рис.1. Гистограмма вариационного ряда по площади территории.
Рис. 2. Кумулята вариационного ряда площади территории.
Таблица 2.2.
Вариационный частотный и кумулятивный ряд распределения по числу ДТП
число дорожно-транспортных происшествий на 100000 человек населенияКоличество регионов в отдельной группе
Середина интервала числа ДТП
Показатель накопленной частоты52,1 -85,7368,90385,7 - 119,37102,5010119,3 - 152,917136,1027152,9 - 186,511169,7038186,5 - 220,18203,3046220,1 - 253,73236,9049253,7 - 287,31270,5050Итого50
Рис. 3. Гистограмма вариационного ряда числа дорожно-транспортных происшествий на 100000 человек населения Рис. 4. Кумулята вариационного ряда числа дорожно-транспортных происшествий на 100000 человек населения
Среднее арифметическое значение признака, среднее квадратическое отклонение. Таблица 2.3.
Вычисление среднего арифметического значения признака, среднего квадратического отклонения для вариационного ряда распределения площади территории.
Площадь территории на 1 января 2009 г., тыс.кв.км.
Количество регионов в отдельной группе, Середина интервала площади территории 12,5-348,82940180,66428577226,571429723948,2348,829-685.157 6516,99285713101,957143244332,5685,157-1021,4862853,32142861706,642857579158,61021,486-1357,81401189,65001357,814-1694,14311525,9785711525,97857114659951694,143-2030,47101862,307143002030,471-2366,812198,6357142198,6357143547346 Итого50 15759,785716560781 15759,79
50 тыс.км.кв среднее значение площади территории.
Дисперсия () - это среднее из квадратов отклонений от средней величины, для вариационного ряда она определяется по формуле:
Если ряд интервальный, то в качестве варианты (xi ), также как при расчете средней, берется середина интервала.
Среднее квадратическое отклонение () - показатель, который представляет собой квадратный корень из дисперсии. Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения и выражается в тех же единицах, что и варианты признака.
131215,6
(тыс.кв.км.)
Таблица 2.4.
Вычисление среднего арифметического значения признака для вариационного ряда распределения числа дорожно-транспортных происшествий на 100000 человек населения
число дорожно-транспортных происшествий на 100000 человек населения Количество регионов в отдельной группе
Середина интервала числа ДТП
52,1 -85,7368,90206,721850,885,7 - 119,37102,50717,518742,09119,3 - 152,917136,102313,75596,481152,9 - 186,511169,701866,72627,767186,5 - 220,18203,301626,419251,93220,1 - 253,73236,90710,720496,04253,7 - 287,31270,50270,513515,46Итого507712,2102080,563 7712,2
50 154,244 - среднее значение числа ДТП.
2041,611
В среднем, число ДТП отклоняется на 45 ед.
Мода (Мо ) - наиболее часто встречающееся значение признака в совокупности.
Если ряд равноинтервальный, то используется формула:
где - начало интервала, содержащего моду,
- величина интервала, содержащего моду,
- частота того интервала, в котором расположена мода,
- частота интервала, предшествующего модальному,
- частота интервала, следующего за модальным.
Первый интервал содержит моду, значит:
12,5 тыс.кв.км 336,329 тыс.чел.
40
6
Подставим эти данные в формулу вычисления моды для площади территории:
тыс.кв.км.
Аналогично проведем вычисление моды для числа ДТП.
119,3
33,6
Вывод: большинство регионов имеют значения площади территорий около 194,299 тыс.кв.км, в большинстве регионов количество дорожно-транспортных происшествий на 100000 человек населения приблизительно равно 140. Медиана (Ме ) - это такое значение признака, которое делит объем совокупности пополам в том смысле, что число элементов совокупности с индивидуальными значениями признака, меньшими медианы, равна числу элементов совокупности с индивидуальными значениями больше медианы.
Численное значение медианы определяется по ряду накопленных частот.
,
где
- начало интервала, содержащего медиану,
- величина интервала, содержащего медиану,
- накопленная частота интервала, который стоит перед медианным,
- объем совокупности,
- частота того интервала, в котором расположена медиана.
Медиана расположена в первом интервале:
12,5 тыс.кв.км
336,329 тыс.кв.км
50
40
тыс.кв.км
Вычисление медианы для числа ДТП:
119,3 33,6 50
17
Вывод: Половина регионов имеют значение площади территорий на 1 января 2009 г. меньше 222,7 тыс.кв.км, другая - больше. В половине регионов, количество дорожно-транспортных происшествий на 100000 человек населения, не превышает 148,95. Квартили - значения признака, делящие упорядоченную по значению признака совокупность на 4 равные части. 1-ая квартиль определяет такое значение признака, что единиц совокупности имеют значения признака меньше, чем , а - значения больше чем . 2-ая квартиль равна медиане. 3-ая квартиль определяет такое значение признака, что единиц совокупности имеют значения признака меньше, чем , а - больше чем . Значения квартилей для сгруппированных данных определяются по накопленным частотам. При этом для 1-ой квартили накопленная частота сравнивается с величиной ; для 3-ей квартили - с величиной . Значение квартили для интервального ряда распределения может быть уточнено по формуле:
,
- нижняя граница интервала, в котором находится -тая квартиль;
- сумма накопленных частот интервалов, предшествующих интервалу, в котором находится -тая квартиль;
- частота интервала, в котором находится -тая квартиль.
Метод Турки для нахождения квартилей (верхнего и нижнего) является наиболее просты и не требует каких либо расчетов. Он основан на использовании медианы в качестве опорного пункта расчетов. Чтобы найти квартили по этому методу нужно:
Произвести ранжирование ряда.
Разделить этот ряд на две части. Если число вариант четное то просто ряд делим по полам. Если нечетное, то делим ряд на две части, причем медиана входит в каждую часть.
Найти медиану для каждой половины. Полученное число и будет являться соответственно верхним и нижним квартилем.
Площадь территорий:
Число дородно-транспортных происшествий:
Вывод: 25% единиц совокупности площади территорий имеют значения признака меньше, чем 117,6 тыс.кв.км, 75% единиц совокупности площади территорий имеют значения признака меньше, чем 327,81 тыс.кв.км.
25% единиц совокупности числа дорожно-транспортных происшествий имеют значения признака меньше, чем 124,24 на 100000 человек населения, 75% единиц совокупности числа ДТП имеют значения признака меньше, чем 185.
Коэффициент вариации (V) - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс. Он позволяет сравнивать вариации различных признаков, а также одноименных признаков в разных совокупностях. Его используют для характеристики однородности совокупности.
Для площади территорий :
Для числа дорожно-транспортных происшествий :
Вывод: совокупность считается количественно однородной, если коэффициент вариации не превышает 33%. Колеблемость признака в совокупности признак-фактора составляет 114,92% (совокупность приближается к грани неоднородности, а вариация сильная), признак-результата - 29,2% (Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая).
3. Теорема о разложении дисперсии
По теореме о разложении дисперсии:
,
где - полная дисперсия (вариация) признака-результата;
- внутригрупповая дисперсия;
- межгрупповая дисперсия.
Внутригрупповая дисперсия характеризует ту часть общей дисперсии признака-результата, которая не зависит от изменения величины признака-фактора. Тем самым она отражает влияние неучтенных причин вариации признака-результата, то есть показывает степень неопределенности. В корреляционном анализе она называется остаточной дисперсией и определяется по формуле:
где - дисперсия признака-результата в пределах отдельной группы по признаку-фактору;
- численность отдельной группы.
Межгрупповая дисперсия отражает ту часть общей дисперсии признака-результата, которая объясняется влиянием рассматриваемого признака-фактора. Она определяется по формуле:
,
где - групповое среднее k-й группы.
Разложение общей суммы квадратов отклонений переменной y от среднего значения на две части - "объясненную" и "необъясненную":
Таблица 2.5
Расчетная таблица для нахождения общей дисперсии
Число дорожно-транспортных происшествий на 1000000 населения, yi
Yi-Y
(Yi-Y)2 218,6 64,48 4157,67 194,1 39,98 1598,4 183,5 29,38 863,1844 114,6 -39,52 1561,83 151,9 -2,22 4,9284 197,6 43,48 1890,51 196 41,88 1753,934 145,8 -8,32 69,2224 203,2 49,08 2408,846 118,8 -35,32 1247,502 287,3 133,18 17736,91 220,9 66,78 4459,568 55,1 -99,02 9804,96 86,6 -67,52 4558,95 134,3 -19,82 392,8324
Продолжение таблицы 2.5
103,8 -50,32 2532,102 128 -26,12 682,2544 122,1 -32,02 1025,28 146,4 -7,72 59,5984 132,2 -21,92 480,4864 142 -12,12 146,8944 158,2 4,08 16,6464 117,5 -36,62 1341,024 148,3 -5,82 33,8724 149,9 -4,22 17,8084 187,8 33,68 1134,342 179,9 25,78 664,6084 158,1 3,98 15,8404 124 -30,12 907,2144 147,5 -6,62 43,8244 98,5 -55,62 3093,584 156,7 2,58 6,6564 167,9 13,78 189,8884 195,4 41,28 1704,038 147,9 -6,22 38,6884 157,4 3,28 10,7584 131,6 -22,52 507,1504 176 21,88 478,7344 159,7 5,58 31,1364 127,6 -26,52 703,3104 116,4 -37,72 1422,798 160,1 5,98 35,7604 81,7 -72,42 5244,656 164,8 10,68 114,0624 228,6 74,48 5547,27 151,2 -2,92 8,5264 135,4 -18,72 350,4384
Продолжение таблицы 2.5
219,2 65,08 4235,406 223,8 69,68 4855,302 52,1 -102,02 10408,08 - общее среднее значение признака
n - количество элементов
D - общая дисперсия для нечастотного распределения признака
- отдельные значения признака
- общее среднее значение признака
n - количество элементов
Найдем межгрупповую дисперсию:
Таблица 2.6
Расчетная таблица для межгрупповых дисперсий
Группы регионов по территорииИтого по числу ДТПyyi-y(yi-y)2∑(yi-y)212,5---348,829218,60154,75863,844075,8685083,438 86,60 -68,164645,44 145,80 -8,9680,24 148,30 -6,4641,70 194,10 39,341547,83 142,00 -12,76162,75 183,50 28,74826,13 223,80 69,044766,87 98,50 -56,263164,91 117,50 -37,261388,12 124,00 -30,76946,02 128,00 -26,76715,96 Продолжение таблицы 2.6
55,10 -99,669931,62 147,50 -7,2652,67 287,30 132,5417567,51 220,90 66,144374,83 103,80 -50,962596,67 158,20 3,4411,85 156,70 1,943,77 134,30 -20,46418,51 179,90 25,14632,15 203,20 48,442346,68 219,20 64,444152,84 147,90 -6,8647,03 127,60 -27,16737,53 146,40 -8,3669,85 122,10 -32,661066,51 187,80 33,041091,81 158,10 3,3411,17 160,10 5,3428,54 132,20 -22,56508,84 196,00 41,241700,94 118,80 -35,961292,94 149,90 -4,8623,60 228,60 73,845452,71 157,40 2,646,98 116,40 -38,361471,30 114,60 -40,161612,62 167,90 13,14172,73 81,70 -73,065337,40 348,829-685.157 151,20155,417-4,2217,78032865,5283 151,90-3,5212,3669 131,60-23,82567,234 135,40-20,02400,667 164,809,3888,0469 197,60 42,181779,43 685,157-1021,48652,10105,9-53,802894,445788,88 159,70 53,802894,44 1021,486-1357,814000,0000
Продолжение таблицы 2.6
1357,814-1694,143195,40195,400,00001694,143-2030,471000,00002030,471-2366,8176,00176,000,0000
Найдём внутригрупповые дисперсии для каждой группы регионов:
σ24, σ25, σ26, σ27 = 0, т.к. в данных группах регионов, вес интервала не превышает единицы. Найдём среднюю из внутригрупповых дисперсий:
По правилу сложения дисперсий, получим:
2011,95≈ 2011,946
Показана выполнимость Теоремы о разложении дисперсий.
4.Для определения параметров уравнения линейной регрессии строим расчетную таблицу 2.7.
Пусть - площадь территории на 1 января 2009 г. тыс.кв.км,
- число дорожно-транспортных происшествий на 100000 человек населения. Таблица 2.7.
регионыПлощадь территории на 1 января 2009г., тыс. км. Кв.Число дорожно-транспортных происшествий на 1000000 населенияY2y*xX215.Тверская обл.84,2218,647785,9618406,127089,6416. Тульская обл.25,7194,137674,814988,37660,4917. Ярославская обл.36,2183,533672,256642,71310,4418.Респ. Карелия180,5114,613133,1620685,332580,2519.Респ. Коми416,8151,923073,6163311,92173722,220.Архангельская обл.588,9197,639045,76116366,6346803,221.Вологодская обл.144,5196384162832220880,2522.Калининградская обл.15,1145,821257,642201,58228,0123. Ленинградская обл.83,9203,241290,2417048,487039,2124.Мурманская обл.144,9118,814113,4417214,1220996,0125.Новгородская обл.54,5287,382541,2915657,852970,2526. Псковская обл.55,4220,948796,8112237,863069,1627. Республика Дагестан50,355,13036,012771,532530,0928.Кабардино-Балкарская респ.12,586,67499,561082,5156,2529.Краснодарский край75,5134,318036,4910139,655700,2530.Ставропольский край66,2103,810774,446871,564382,4431.Астраханская обл.49128163846272240132.Волгоградская обл.112,9122,114908,4113785,0912746,4133.Ростовская обл.101146,421432,9614786,41020134. Респ. Башкиртостан142,9132,217476,8418891,3820420,4135.Респ. Мордовия26,1142201643706,2681,2136.Респ. Татарстан67,8158,225027,2410725,964596,8437.Удмуртская респ.42,1117,513806,254946,751772,4138.Чувашская респ.18,3148,321992,892713,89334,8939.Пермский край160,2149,922470,0124013,9825664,0440.Кировская обл.120,4187,835268,8422611,1214496,1641.Нижегородская обл.76,6179,932364,0113780,345867,5642. Оренбургская обл.123,7158,124995,6119556,9715301,6943.Пензенская обл.43,4124153765381,61883,5644.Самарская обл.53,6147,521756,2579062872,9645.Ульяновская обл.37,298,59702,253664,21383,8446.Курганская обл.71,5156,724554,8911204,055112,2547.Свердловская обл.194,3167,928190,4132622,9737752,49
Продолжение таблицы 2.7 48. Тюменская обл.1464,2195,438181,16286104,7214388249.Челябинская обл.88,5147,921874,4113089,157832,2550.Алтайский край168157,424774,7626443,22822451.Забайкальский край431,9131,617318,5656838,04186537,652.Красноярский край2366,817630976416556,8560174253.Иркутская обл.774,8159,725504,09123735,660031554.Кемеровская обл.95,7127,616281,7612211,329158,4955.Новосибирская обл.177,8116,413548,9620695,9231612,8456.Омская обл.141,1160,125632,0122590,1119909,2157.Томская обл.314,481,76674,8925686,4898847,3658.Камчатский край463,3164,827159,0476351,84214646,959.Примоский край164,7228,652257,9637650,4227126,0960.Амурская обл.361,9151,222861,4454719,28130971,661. Магаданская обл.462,5135,418333,1662622,5213906,362.Сахалинская обл.87,1219,248048,6419092,327586,4163.Еврейская авт. обл.36,3223,850086,448123,941317,6964.Чукотская авт. обл.721,552,12714,4137590,15520562,3
.
Получено уравнение регрессии:.
С увеличением площади территорий на 1 тыс.кв.км, число дорожно-транспортных происшествий на 100000 человек населения увеличивается на 0,00541 аварий (или же с увеличением площади территории на 1000 кв. км., число ДТП увеличивается на 5,41).
3. Для оценки тесноты связи рассчитаем линейный коэффициент парной корреляции:
Коэффициент детерминации: Коэффициент корреляции, равный 0,0478, показывает, что между рассматриваемыми признаки существует слабая, практически отсутствующая прямая связь (0.1 < rxy < 0.3). Коэффициент детерминации, равный 0,002289, устанавливает, что вариация числа ДТП на 0,229% из 100% предопределена вариацией площади территорий; роль прочих факторов, влияющих на число ДТП, определяется в 99,771%. Общий вывод: средняя площадь территорий равна 235,932 тыс.кв.км, среднее значение числа дорожно-транспортных происшествий равно 154. Большая часть областей(40 из 50) обладает площадью территории в интервале от 12,5 до 348.829 тыс.кв.км. Из них, в 3-х количество дорожно-транспортных происшествий колеблется в интервале от 52,1 до 85,7 ДТП на 100000 населения , в 7 областях - от 85,7 до 119,3, в 17 областях - от 119,3 до 152,9, в 11 областях в интервале от 152,9 до 186,5 и в 2 областях, количество ДТП на 100000 населения наибольшее и находится в интервале от 186,5 до 220,1. Половина регионов имеют значение площади территорий на 1 января 2009 г. меньше 222,7 тыс.кв.км, другая - больше. В половине регионов, количество дорожно-транспортных происшествий на 100000 человек населения, не превышает 154. Колеблемость признака в совокупности признак-фактора составляет 114,92% (совокупность приближается к грани неоднородности, а вариация сильная), признак-результата - 29,3% (Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая).
Внутригрупповая дисперсия, отражающая влияние неучтенных причин вариации признака-результата меньше чем, межгрупповая дисперсия, которая объясняется влиянием рассматриваемого признака-фактора.
Задание № 3.
1.Используя результаты расчетов, выполненных в задании 2 курсовой работы по признаку 1, и полагая, что эти данные получены при помощи собственно-случайного 40% бесповторного отбора, определить:
а) пределы, за которые с доверительной вероятностью 0,954 не выйдет значение признака, рассчитанное по генеральной совокупности;
б) как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.
2. Используя результаты расчетов, выполненных в задании № 2 курсовой работы по признаку 2 и полагая, что эти данные получены при помощи повторного отбора, определить:
а) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду (уровень доверительной вероятности установите по своему усмотрению);
б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 30%.
Решение:
1. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода отбора. При бесповторном отборе, при котором повторное попадание в выборку одних и тех же единиц исключено, средняя ошибка выборки определяется следующим образом:
Средняя ошибка выборки для признака № 1:
(тыс.кв.км.)
Т.к. величина выборки: n = 50 регионов - 60,24%
Значит: N = 83 регионов - 100%
Теория устанавливает соотношение между предельной и средней ошибкой выборки, гарантируемое с некоторой вероятностью:
∆ = µ * t , где
∆ - предельная ошибка выборки
µ - средняя ошибка выборки
t - коэффициент доверия.
При этом, коэффициент доверия определяется в зависимости от того, с какой достоверной вероятностью надо гарантировать результаты выборочного исследования. Для определения коэффициента доверия пользуются готовыми таблицами. Некоторые наиболее часто встречающиеся значения этого коэффициента приведены ниже:
Доверительная вероятностьКоэффициент доверия0,68310,95420,9902,50,9973 Предельная ошибка выборки для признак-фактора
∆ = 32,3017* 2 = 64,60344129 тыс.кв.км.
Таким образом, границы доверительного интервала признак фактора могут быть представлены как:
, то есть где - среднее значение переменной в выборке (выборочное среднее)
- среднее генеральной совокупности.
Границы доверительного интервала признак-фактора могут быть определены:
, то есть или б) Чтобы снизить предельную ошибку средней величины на 50% (в 2 раза) необходимо, чтобы предельная ошибка выборки (∆) уменьшилась в два раза, поэтому необходимая численность выборки составит:
регион
Следовательно, для того, чтобы снизить предельную ошибку средней величины на 50%, необходимая численность выборки должна составлять 71 регион.
2. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода обора.
Доля альтернативного признака в выборочной совокупности определяется по формуле:
р = m / n ,где
m - число элементов совокупности, которые больше моды (мода=140,3 ДТП на 100000 человек населения в 17 региорнах. , m =17).
n - объем выборочной совокупности
р = 17 / 50 = 0,34*100%=34%
При повторном отборе, когда каждая отобранная и обследованная единица возвращается в генеральную совокупность, где ей опять предоставляется возможность попасть в выборку, средняя ошибка выборки определяется следующим образом:
Теория устанавливает соотношения между предельной и средней ошибкой выборки, гарантируемая с некоторой вероятностью. Выберем доверительную вероятность 0,954. Значит, коэффициент доверия равен 2.
∆ = µ * t , где
∆ - предельная ошибка выборки
µ - средняя ошибка выборки
t - коэффициент доверия.
∆ =0,06699*2= 0,134
Определим пределы, за которые не выйдет значение доли регионов, в которых число дорожно- транспортных происшествий на 100000 человек населения выше моды:
б) При повторном отборе необходимая численность выборки:
n = (w*(1 - w)*t2 ) / ∆2 (1)
Считая w маломеняющейся при изменении выборки, имеем:
n = (w*(1 - w)*t2 ) / (0,7∆)2 (2)
Разделив (1) на (2) имеем: Из (1) выражаем: и подставим во (2) :
n = 34,69 ≈35 регионов.
При повторном отборе необходимая численность выборки должна составлять 35регионов.
Задание №4.
1. Пользуясь данными из статистических ежегодников, составить 2 динамических ряда для характеристики изменения социально-экономических показателей по районам Псковской области. Районы и направление определяются для каждого студента по последним цифрам номера зачетной книжки.
2. Рассчитать:
а) Среднегодовой уровень динамики;
б) Цепные и базисные показатели динамики: абсолютный прирост, темп роста, темп прироста;
в) Средний абсолютный прирост, средний темп роста, средний темп прироста.
3. Произвести сглаживание ряда динамики трехлетней скользящей средней.
4. Произвести аналитическое выравнивание ряда динамики.
5. Изобразить фактический и выровненный ряды динамики графически.
6. Сделать сравнительные выводы и прогнозы по районам. Дать общую характеристику развития районов по данному направлению.
Решение:
1. В качестве показателя, который характеризовал бы динамику населения, была выбрана рождаемость.
Таблица 4.1 Динамика рождаемости в Псковском районе в 2005 - 2011 годах
ГодЧисленность родившихся за год, чел.2005323200634120073922008406200942820104082011415Итого:2713
Таблица 4.2 Динамика рождаемости в Себежском районе в 2005 - 2011годах
годчисленность родившихся за год, чел.2005235200619220072032008223200921020102352011201Итого:1499
2.Средний уровень моментного ряда определяется по формуле средней хронологической простой.
y =( y1/2+y2+y3+y4+y5+y6+y7+(y8 /2))/ n-1
(чел.)
(тыс. чел)
Базисные и цепные показатели динамики в Псковском районе
Таблица 4.3
Базисные и цепные показатели динамики рождаемости в Псковском районе в 2005 - 2011 годах
Год Рождаемость, чел.Базисные показатели динамикиЦепные показатели динамики∆, чел.Тр, %Тпр, %∆, чел.Тр, %Тпр, %20053230100,00,0---200634118105,65,618105,65,6200739269121,421,451115,015,0200840683125,725,714103,63,62009428105132,532,522105,45,4201040885126,326,3-2095,3-4,7201141592128,528,57101,71,7
Базисные показатели динамики:
Абсолютный прирост: ∆i = Темп роста: Тр = Темп прироста: Тпр = = Тр - 1
Цепные показатели динамики:
Абсолютный прирост: ∆i = Темп роста: Тр = Темп прироста: Тпр = = Тр - 1
Средние показатели динамики:
Средний абсолютный прирост:
= = (чел.)
Средний темп роста:
Средний темп прироста
Вывод: Базисные показатели динамики:
Рождаемость в Псковском районе в 2011 году увеличилась на 92 человека по сравнению с 2005 годом. Рождаемость в Псковском районе за эти годы увеличилась в 1,28 раз. Темп роста составил 128,5%. Таким образом, можно отметить, что рождаемость в Псковском районе в 2011 году по сравнению с 2005 годом увеличилась на 28,5%. Цепные показатели динамики:
В 2011 году по сравнению с 2010 годом рождаемость в Псковском районе увеличилась на 7 человек. Рождаемость в Псковском районе за 1 год увеличилась на 1,7%. Темп роста рождаемости составил 101,7%.
Средние показатели динамики:
Среднее увеличение рождаемости в Псковском районе за 2005 - 2011 годы составило 15,3 человека. Средний базисный темп роста равен 104,3%. Среднее увеличение рождаемости составило 4,3%. Базисные и цепные показатели динамики в Себежском районе
Таблица 4.4
Базисные и цепные показатели динамики рождаемости в Себежском районе в 2005 - 2011 годах
Годрождаемость, чел.Базисные показатели динамикиЦепные показатели динамики∆, чел.Тр, %Тпр, %∆, чел.Тр, %Тпр, %20052350100,00,0---
Продолжение таблицы 4.4.
2006192-4381,7-18,3-4381,7-18,32007203-3286,4-13,611105,75,72008223-1294,9-5,120109,99,92009210-2589,4-10,6-1394,2-5,820102350100,00,025111,911,92011201-3485,5-14,5-3485,5-14,5
Средние показатели динамики:
Средний абсолютный прирост:
= = (чел.)
Средний темп роста:
Средний темп прироста
Вывод: Базисные показатели динамики:
Рождаемость в Себежском районе с 2005 года до 2011 года уменьшилась на 34 человека. Уменьшение рождаемости в Себежском районе за эти годы произошло в 0,855 раз. Темп роста составил 85,5%. Таким образом, можно отметить, что рождаемость в Себежском районе в 2011 году по сравнению с 2005 годом уменьшилась на 14,5%. Цепные показатели динамики:
В 2011 году по сравнению с 2010 годом рождаемость в Островском районе уменьшилась на 34 человека. Изменение рождаемости в Себежском районе за 1 год произошло в 0,855 раз. Темп роста численности населения составил 85,5%. Уменьшение численности населения в Островском районе произошло на 14,5%.
Средние показатели динамики:
Среднее уменьшение численности населения в Островском районе за 2005 - 2011 годы составило 5,667. человек. Средний базисный темп роста равен 97,4%. Среднее уменьшение рождаемости составило 2,6%. Сглаживание ряда динамики трехлетней скользящей средней.
Таблица 4.5
Динамика рождаемости в Псковском районе в 2005 - 2011 годах
годРождаемость за год, чел.Скользящее среднее2005323-20063413522007392379,672008406408,67200942841420104084172011415-Итого:2713-
(трехлетняя скользящая средняя)
К примеру, y2006* =(323+341+392)/3=352
Рис. 4.1. Динамика рождаемости в Псковском районе в 2005 - 2011 годах
Вывод: В данном случае удалось выявить основную закономерность (тренд) в изменении рождаемости в Псковском районе; увеличение происходит неравномерно, видны несколько скачков и спад рождаемости. Рост рождаемости с 2005 по 2006 идет медленно (произошло увеличение рождаемости на 5,6%), затем с 2006 года по 2007 заметно более резкое увеличение рождаемости (15% относительно 2006 года). Затем, с 2007 года по 2008 снова увеличение рождаемости незначительно (3,6% относительно 2007года.), а в период с 2008 по 2009 год опять виден небольшой скачек (5,4%). В 2009 году рождаемость максимальна за период с 2005 по 2011 год и составляет 428 человек. В 2010 году можно видеть спад рождаемости, составляющий 4, 7% относительно 2009 года, после чего, в следующем году рождаемость вновь начинает увеличиваться. Таблица 4.6
Динамика Рождаемости в Себежском районе в 2005 - 2011 годах
годчисленность родившихся за год, чел.Скользящее среднее2005235-2006192210200720320620082232122009210222,672010235215,332011201-Итого:1499-
(трехлетняя скользящая средняя)
К примеру, y2006* =(235+192+203)/3=210
Рис. 4.2. Динамика рождаемости в Себежском районе в 2005 - 2011 годах
Вывод: В данном случае удалось выявить основную закономерность (тренд) в изменении рождаемости в Себежском районе; было выяснено, что рождаемость в как и в Псковском районе меняется неравномерно, имея подъемы и спады. Так, к примеру, спады рождаемости в Себежском районе видны в 2006, 2009 и 2011(соответственно на 18,3%, 5,8%, 14,5%) годах. С другой стороны, подъемы видны в 2005, 2008 и 2010 годах (увеличение рождаемости в 2008 году составляет 9,9% относительно предыдущего года, в 2010 году увеличение рождаемости относительно предыдущего года составляет 11,9%).
4. Аналитическое выравнивание ряда динамики.
Таблица 4.7 Динамика численности населения в Псковском районе в 2003 - 2010 годах
год родившихся за год, чел.tуслtусл2y*tусл2005323-39-969339,79 2006341-24-682 355,712007392-11-392 371,642008406000 387,57200942811428 403,5201040824816 419,432011415391245 435,36Итого:2713028446 2713Функция при аналитическом выравнивании имеет вид прямой линии. Введем условное время по порядку года таким образом, чтобы =0. Параметры a0 и a1 находятся из системы нормальных уравнений:
7∙a0 = 2713
28∙a1 = 446
a0 = 387,571
a1 = 15,929
= a0 + a1·t = 387,571 + 15,929·tусл. - теоретическая функция.
Интерпретация коэффициентов теоретической функции:
Коэффициент a0 = 387,571 показывает среднее значение рождаемости в Псковском районе за семь лет. Коэффициент a1 = 15,929 показывает, что с каждым годом рождаемость в Псковском районе увеличивается на 15,929 человек.
Рис. 4.3. Динамика рождаемости в Псковском районе в 2005 - 2011 годах
Так как известна аналитическая функция, то можно сделать прогноз динамики рождаемости в Псковском районе на 2012 год. В данном случае tусл.= 4. Подставляя это значение в функцию, получим:
= a0 + a1·t = 387,571 + 015,929∙4 = 451,286 ( чел.)
Вывод: В данном случае удалось выявить основную закономерность динамики рождаемости в Псковском районе. Рождаемость в Псковском районе увеличивается примерно на 16 человек в год. Таким образом, можно сделать прогноз рождаемости в Псковском районе на 2012 год (более долгосрочные прогнозы будут неточными вследствие влияния факторов, не учтенных в данной модели). В 2012 году рождаемость в Псковском районе составит примерно 451 человек.
Таблица 4.8 Динамика рождаемости в Себежском районе в 2005 - 2011 годах
годродившихся за год, чел.tуслtусл2y*tусл
2005235-39-705215,112006192-24-384214,792007203-11-203214,462008223000214,14200921011210213,82201023524470213,5201120139603213,18Итого:1499028-91499Функция при аналитическом выравнивании имеет вид прямой линии. Введем условное время по порядку года таким образом, чтобы =0. Параметры a0 и a1 находятся из системы нормальных уравнений:
7∙a0 = 1499
28∙a1 = 446
a0 = 214,143
a1 = -0,321
= a0 + a1·t = 214,143-0,321·tусл. - теоретическая функция.
Интерпретация коэффициентов теоретической функции:
Коэффициент a0 = 214,143 показывает среднее значение рождаемости в Себежском районе за семь лет. Коэффициент a1 = -0,321 показывает, что с каждым годом рождаемость в Себежском районе уменьшается на 0,321 тыс. человек.
Рис. 4.4. Динамика рождаемости в Себежском районе в 2005 - 2011 годах
Так как известна аналитическая функция, то можно сделать прогноз динамики рождаемости в Себежском районе на 2012 год. В данном случае tусл.= 7. Подставляя это значение в функцию, получим:
= a0 + a1·t = 214,143 - -0,321 ∙7 = 211,893(чел.)
Вывод: В данном случае удалось выявить основную закономерность динамики рождаемости в Себежском районе. Рождаемость в Себежском районе уменьшается примерно на 0,321человека в год. Не смотря на это, рождаемость в Себежском районе изменяется неравномерно и скачкообразно, тем не менее, видна тенденция к снижению рождаемости. Таким образом, можно сделать прогноз рождаемости в Себежском районе на 2012 год (более долгосрочные прогнозы будут неточными вследствие влияния факторов, не учтенных в данной модели). В 2012 году рождаемость в Себежском районе составит 212 человек.
Сравнительный вывод: в Псковском районе за 7 лет заметно планомерное повышение рождаемости. В Себежском же районе существует тенденция снижения рождаемости . Данная ситуация объясняется миграцией населения в более крупные города области (в данном случае г.Псков), где более интенсивнее развивается промышленность, имеются вакансии рабочих мест с более достойной заработной платой. Задание № 5.
Пользуясь таблицами, сформировать таблицу исходных данных.
определить индивидуальные индексы:
физического объема,
цены,
стоимости.
Определить общие индексы:
физического объема,
цены,
стоимости.
Объяснить экономический смысл каждого из индексов, показать взаимосвязь между ними.
Определить абсолютное изменение стоимости произведенной продукции в текущем периоде по сравнению с базисным, в том числе за счет изменения цен и за счет изменения выпуска продукции.
Считая продукцию однородной, определить, как изменилась средняя цена единицы продукции и как при этом повлияло изменение цен и структуры выпускаемой продукции. Объяснить полученные результаты.
Используя данные таблицы 5, рассчитать, как в среднем изменилась себестоимость единицы и выпуск продукции.
Решение:
Формируем таблицу исходных данных.
Вид продукцииБазисный периодТекущий периодИндивидуальный индекс физического объемаИндивидуальный индекс ценыИндивидуальный индекс стоимостиСтоимость продукции в сопоставимых ценах, тыс. руб.
Продано, тыс.шт.Цена за единицу, руб. шт.
Стоимость продукции, тыс. руб.
Продано, тыс.шт.Цена за единицу, руб./шт
Стоимость продукции, тыс. руб.
А704028801023535701,420,881,244080В80201400852420401,211,201,461700С1401513501101516501,221,001,221650Итого:2907556302977472607430Таблица 5.1.
2. Индивидуальный индекс физического объема показывает, как изменится объем проданного товара в текущем периоде по сравнению с базисным по каждому виду продукции и рассчитывается по формуле: .
В данном случае, объем проданного товара вида А, В, С увеличился в текущем периоде по сравнению с базисным на 42%, 21% и 22% соответственно.
Индивидуальный индекс цены рассчитывается по формуле: и показывает как изменились цены по каждому виду продукции. У продукции вида А произошло уменьшение цены на 22%, а по виду С произошло увеличение цены на 20%, а по виду В - осталось неизменным. Индивидуальный индекс стоимости отражает изменение стоимости продукции по ее видам и рассчитывается по формуле: . Таким образом по всем видам продукции произошло увеличение на 24%, 46% и 22% соответственно. 3. Общий индекс физического объема товарооборота будет иметь вид:
или 131,9%, Т.е. выпуск продукции в текущем периоде по сравнению с базисным увеличился на 31,9% .
Общий индекс цены показывает как в целом на предприятии изменились цены на продукцию и рассчитывается по формуле:
или 97,7%, Т.е. цены на всю продукцию предприятия в текущем периоде уменьшились на 2,3% по сравнению с базисным.
Общий индекс стоимости отражает среднее изменение продукции в текущем периоде по сравнению с базисным и рассчитывается по формуле:
или 128,9%,
Т.е. по предприятию, стоимость продукции в среднем увеличилась на 28,9% в текущем периоде по сравнению с базисным.
Проверка: .
4. Абсолютное изменение стоимости проданной продукции в текущем периоде по сравнению с базисным определяется по формуле:
тыс.руб.
в том числе:
За счет изменения цен на отдельные виды продукции
тыс.руб.
За счет изменения физического объема продукции
тыс.руб.
Проверка: 1800-170 = 1630 тыс.руб.
Из этого следует, что произошло увеличение стоимости продукции в текущем периоде по сравнению с базисным на 1630 тыс.руб. произошло в основном за счет уменьшения цен на отдельные виды продукции (170 тыс.руб.), а за счет изменения объема проданной продукции ее стоимость увеличилась на 1800 тыс.руб.
5. Изменение средней цены единицы продукции определяем, считая эту продукцию однородной, следовательно:
Т.е. средняя цена единицы продукции увеличилась в текущем периоде по сравнению с базисным на 25,9%. В том числе а) за счет непосредственного изменения цен на отдельные виды продукции:
, цена уменьшилась на 2,3% за счет повышения цен и структурного сдвига.
За счет изменения структуры (объема) продукции:
, средняя цена на продукцию предприятия увеличилась на 28,8% за счет изменения объема продукции.
Проверка: 1,288*0,977=1,259
Список литературы.
Теория статистики, под ред. Проф. Р.А.Шмойловой, Финансы и статистика, -М.: 2002 год.
Статистика. Методические указания по выполнению курсовой работы, Л.Н. Гальдикас, Л.И. Стрикунова.
Статистический ежегодник Псковской области за 2006г.
Статистический ежегодник Псковской области за 2012г.
2
Документ
Категория
Рефераты
Просмотров
461
Размер файла
522 Кб
Теги
kursach
1/--страниц
Пожаловаться на содержимое документа