close

Вход

Забыли?

вход по аккаунту

?

1825.Методы выборочных обследований

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение
высшего профессионального образования –
“Оренбургский государственный университет”
Кафедра статистики и эконометрики
Л.Р. МУХАМЕТОВА
МЕТОДЫ ВЫБОРОЧНЫХ
ОБСЛЕДОВАНИЙ
УЧЕБНО-ПРАКТИЧЕСКОЕ ПОСОБИЕ
Рекомендовано к изданию учебно-методическим объединением
по образованию в области статистики и антикризисного управления,
математических методов в экономике
Оренбург 2009
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
УДК 311:33 (075.8)
ББК 65.051.01 я 73
М 92
Рецензент
доктор экономических наук, профессор В.Н. Шепель
М 92
Мухаметова, Л.Р.
Методы выборочных обследований: учебно-практическое
пособие /Л.Р. Мухаметова. – Оренбург: ГОУ ОГУ, 2009. – 166
с.
В учебно-практическом пособии отражены теоретические основы
методов выборочного обследования. Рассматриваются области
применения выборочного метода в статистических исследованиях
социально-экономических
явлений.
Теоретический
материал
сопровождается тестами, заданиями и вопросами для самостоятельной
работы студентов.
Учебно-практическое пособие предназначено для студентов
высших учебных заведений, обучающихся по специальности 080601
«Статистика» и другим экономическим специальностям.
М
ББК 65.051.01 я 73
© Мухаметова Л.Р., 2009
© ГОУ ОГУ, 2009
2
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Содержание
Введение………………………………………………………………………..
1 Сущность и задачи выборочного наблюдения………………………….
1.1 Понятие о выборочном наблюдении…………………………………..
1.2 Выборочное наблюдение в системе методов несплошного
статистического наблюдения……………………………………………….
1.3 Основные преимущества и проблемы проведения выборочного
наблюдения…………………………………………………………………….
1.4 Тесты и задачи………………………………………………………..….
1.5 Вопросы для самопроверки и повторения…………………………...
2 Теоретические основы применения выборочного метода ……………
2.1 Средняя и предельная ошибки выборки…………………………..….
2.2 Теорема Чебышева……………………………………………………...
2.3 Теорема Ляпунова…………………………………………………..….
2.4 Теорема Бернулли…………………………………………………..….
2.5 Тесты и задачи………………………………………………………….
2.6 Вопросы для самопроверки и повторения…………………………...
3 Проектирование и проведение выборочного наблюдения………..….
3.1 Программно-методологические вопросы и проектирование
инструментария………………………………………………………….….
3.2 Оценка исходной информации и определение основы формирования
выборочной совокупности………………………………………………….
3.3 Тесты и задачи…………………………………………………….…….
3.4 Вопросы для самопроверки и повторения…………..……………..…
4 Способы отбора единиц из генеральной совокупности……………….
4.1 Вероятностные выборки………………………………………………..
4.1.1 Простой случайный отбор……………………………………………
4.1.2 Механическая выборка……………………………………………….
4.1.3 Типический отбор……………………………………………………..
4.1.4 Серийный отбор……………………………………………………….
4.1.5 Комбинированный отбор…………………………………………….
4.1.6 Многоступенчатый и многофазный отборы…………………..……
4.2 Квазислучайные выборки………………………………………………
4.3 Другие виды выборок…………………………………………………..
4.4 Тесты и задачи…………………………………………………….…….
4.5 Вопросы для самопроверки и повторения……………………….…...
5 Методология выборочного наблюдения…………………………….…
5.1 Основные этапы выборочного наблюдения……………………….….
5.2 Определение необходимого объема выборки………………………..
5.3 Определение вероятности того, что ошибка выборки не превысит
допустимой погрешности………………………………………………….
5.4 Информационная несопоставимость статистических данных при
проведении выборочного обследования…………………………………..
5
7
7
8
10
12
13
13
13
16
17
18
19
21
21
21
24
27
28
28
30
30
34
36
39
42
43
45
47
47
49
50
50
50
53
54
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5.5 Методы распространения результатов выборочного обследования на
генеральную совокупность…………………………………………………
5.6 Малая выборка…………………………………………………………..
5.7 Общие понятия и схема статистической проверки гипотез……….
5.8 Проверка гипотез о средней и о доле………………………………...
5.8.1 Гипотезы о средней…………………………………………………..
5.8.2 Гипотезы о доле………………………………………………………
5.9 Тесты и задачи………………………………………………………….
5.10 Вопросы для самопроверки и повторения……………………….....
6 Области применения выборочного наблюдения в социальноэкономических исследованиях……………………………………………
6.1 Прикладные задачи выборочного наблюдения…………………..…
6.2 Применение выборочного наблюдения в переписи населения………………………………………………………………………….…
6.3
Выборочное
наблюдение
бюджетов
домашних
хозяйств……………………………………………………………………..….
6.4 Выборочное обследование потребительских ожиданий населения…………………………………………………………………………....
6.5 Выборочное наблюдение за субъектами малого предпринимательства……………………………………………………………………...
6.6 Выборочное наблюдение деловой активности малых промышленных
предприятий………………………………………………………………….
6.7 Применение выборочного метода в обследованиях перевозочной
деятельности…………………………………………………………….……
6.8
Выборочное
обследование
населения
по
проблемам
занятости………………………………………………………………………
6.9 Выборочное обследование о составе затрат на рабочую
силу………………………………………………………………………..….
6.10 Выборочное наблюдение за ценами……………….…………………
6.11
Применение
выборочного
наблюдения
в
сельском
хозяйстве……………………………………………………………….…….
6.12 Тесты и задачи………………………………………………………….
6.13 Вопросы для самопроверки и повторения……………………..……
7 Задания к самостоятельной работе……………………………………….
8 Контрольные тесты………………………………………………………..
Список использованных источников……………………………………….
4
58
60
62
66
66
68
70
72
73
73
74
77
81
84
89
93
94
95
97
100
102
106
109
116
166
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Введение
Анализ социально-экономического развития, разработка стратегии
бизнеса, формирование маркетинговой политики невозможны без
соответствующего информационного обеспечения. Среди известных методов
получения статистических данных особое место принадлежит выборочному
методу, как весьма эффективному, оперативному и наименее трудоемкому.
Выборочное исследование служит в настоящее время одним из важнейших
источников статистической информации. Это во многом обусловлено
переходом российской статистики на международные стандарты учета и
отчетности.
Методы выборочных обследований базируются на общенаучных
принципах исследования социально-экономических явлений, статистической
методологии и компьютерных технологиях. Наиболее методы выборочных
обследований связаны с основными положениями теории статистики,
высшей математики, теории вероятностей и математической статистики. Они
создают методологические основы информационного обеспечения в таких
отраслях статистической науки и практики, как макроэкономическая,
международная статистика, национальное счетоводство, статистика фирм,
рынка товаров и услуг, прикладная социология и др. Это в равной степени
можно отнести к макро- и микроэкономике, оценке бизнеса и недвижимости,
финансовому анализу, техническому анализу товарных и финансовых
рынков.
На практике задачи социально-экономического обследования
сводятся к ситуациям, когда необходимо описать какое-то явление на основе
данных, доступных исследователю. Обычно описание объекта строится по
результатам исследования отдельных фрагментов исследуемого объекта.
Необходимо отметить, что в не столь далекое время в Российской
Федерации, в отличие от развитых зарубежных стран, возможности
выборочного метода использовались далеко не в полной степени. Это
положение объяснялось нехваткой специалистов в данной области,
отсутствием детально проработанных методик (в особенности - для работы
на микроуровне), недоверием региональных руководителей к результатам
выборочных обследований.
Расширение
сферы
применения
выборочного
метода
и
совершенствование
его
организационно-методологических
основ
представляют объективную необходимость на современном этапе социальноэкономического развития. Резкий рост численности хозяйствующих единиц,
появление огромного числа малых предприятий и индивидуальных
предпринимателей, признание права на коммерческую тайну, значительное
снижение отчетной дисциплины, ограниченность финансирования
статистических
работ,
большой
потенциальный
ресурс
новых
информационных технологий – это основные причины, обусловившие
значительное расширение границ применения выборочного метода.
Целью изучения дисциплины «Методы выборочного обследования»
5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
является овладение основами теории и практики выборочных обследований.
Основными задачами при этом являются: уяснение места выборочного
метода в системе приемов и методов статистического исследования; умение
различать основные виды несплошного и выборочного наблюдения;
овладение техникой формирования выборочной совокупности и методами
расчета выборочных показателей; получение прочных знаний о прикладной
значимости таких показателей, как предел ошибки репрезентативности,
коэффициент кратности ошибки выборки; познание общих принципов
организации выборочного обследования и получение представления о
наиболее значимых выборочных обследованиях, проводимых органами
государственной статистики России.
6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1 Сущность и задачи выборочного наблюдения
1.1. Понятие о выборочном наблюдении
Методология статистического исследования массовых социальноэкономических явлений различает, как известно, два способа наблюдения в
зависимости от полноты охвата объекта: сплошное и несплошное.
Разновидностью несплошного наблюдения является выборочное, которое в
условиях развития рыночных отношений в России находит все более
широкое применение.
Выборочное наблюдение представляет собой один из наиболее широко
применяемых видов несплошного наблюдения, при проведении которого
статистическому обследованию подвергаются единицы изучаемой
совокупности, отобранные по специально разработанной схеме,
базирующейся, как правило, на принципе случайности.
Совокупность, из которой отбираются варианты для совместного
изучения, называется генеральной, а отобранная из генеральной
совокупности часть ее членов носит название выборки, или выборочной
совокупности.
Теория выборочных обследований базируется на принципе,
исключающем субъективность проведения отбора единиц для их
последующего изучения по заранее разработанной программе. Она исходит
из следующих положений:
- выбор той или иной конкретной единицы для обследования должен
быть независим от воли, субъективного подхода лица, производящего отбор;
- выбор должен быть независим от значений изучаемых статистических
характеристик, которыми обладают отдельные единицы совокупности;
- процесс отбора должен быть организован так, чтобы все единицы
совокупности имели равные шансы быть отобранными.
Предметом выборочного обследования является количественная
сторона массовых социально-экономических явлений в неразрывной связи с
качественной стороной в конкретных условиях места и времени, исследуемая
на основе принципов выборочного метода.
Методология выборочного статистического исследования включает три
элемента:
1 Выборочное наблюдение – на этом этапе собираются сведения о
каждой единице совокупности, сформированные на основе того или иного
способа отбора из общей совокупности единиц.
2 Сводка и группировка полученных на основе выборочного
обследования материалов – на этом этапе сведения, относящиеся к каждой
единице выборочной совокупности, объединяются в группы и подгруппы по
заранее разработанной программе.
3 Собранные и сгруппированные данные анализируются и
распространяются на всю изучаемую совокупность, при этом
рассчитываются абсолютные, относительные, средние показатели.
7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Необходимым условием применения методологии выборочного
наблюдения является решение таких вопросов, как предварительная оценка
необходимого объема выборки, и ее точности.
1.2 Выборочное наблюдение в системе методов несплошного
статистического наблюдения
Сущность выборочного метода заключается в том, чтобы по свойствам
части (выборки) судить о численных характеристиках целого (генеральной
совокупности), по отдельным группам вариант—об их общей совокупности,
которая иногда мыслится как совокупность неограниченно большого объема.
Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.
Правильно произведенная выборка довольно хорошо представляет или
репрезентирует (от лат. represento—представляю) структуру и состояние
генеральной совокупности. Однако полного совпадения выборочных данных
с данными обработки генеральной совокупности, как правило, не бывает. В
этом и заключается недостаток выборочного метода, на фоне которого
видны преимущества сплошного описания генеральной совокупности.
В виду неполного отображения выборкой статистических характеристик
(параметров) генеральной совокупности, перед исследователем возникает
важная задача: во-первых, учитывать и соблюдать те условия, при которых
выборка наилучшим образом репрезентирует генеральную совокупность, а
во-вторых, в каждом конкретном случае устанавливать, с какой
уверенностью можно перенести результаты выборочного наблюдения на всю
генеральную совокупность, из которой выборка взята.
Репрезентативность выборки зависит от целого ряда условий и, прежде
всего, от того, как она осуществляется — или планомерно (т.е. по заранее
намеченной схеме), или путем непланомерного отбора вариант из
генеральной совокупности. В любом случае выборка должна быть типичной
и вполне объективной. Эти требования должны выполняться
неукоснительно как наиболее существенные условия репрезентативности
выборки. Прежде чем обрабатывать выборочный материал, его нужно
тщательно проверить и освободить выборку от всего лишнего, что нарушает
условия репрезентативности. В то же время при образовании выборки нельзя
поступать по произволу, включать в ее состав только те варианты, которые
кажутся типичными, а все остальные браковать. Доброкачественная выборка
должна быть объективной, т. е. производиться без предвзятых побуждений,
при исключении субъективных влияний на ее состав. Выполнению этого
условия репрезентативности отвечает принцип рендомизации (от англ.
rendom—случай), или случайного отбора вариант из генеральной
совокупности. Этот принцип положен в основу теории выборочного метода
и должен соблюдаться во всех случаях образования репрезентативной
выборочной совокупности, не исключая и случаев планомерного или
преднамеренного отбора.
8
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Основными видами несплошного статистического наблюдения
являются:
1) Монографическое обследование представляет собой детальное
изучение и описание отдельных, характерных в каком-либо отношении
единиц изучаемой совокупности. Оно может применяться, например, для
изучения причин успешной деятельности отдельных предприятий в
реализации своей продукции.
2) Метод основного массива заключается в том, что наблюдение
охватывает наиболее существенные единицы, имеющие преобладающий
удельный вес данного признака. В частности, при изучении хода посевной
кампании наблюдению подлежат категории хозяйств с наибольшим
удельным весом посевных площадей, хотя их доля в общей численности
хозяйств может быть сравнительно невелика.
3) Цензовое наблюдение предполагает отбор единиц по некоторому
определенному критерию (цензу). В качестве ценза может использоваться,
например, некоторое заданное, критическое число работников, занятых на
предприятии. Например, для определения малого предприятия в
строительстве и промышленности критическое число работников не должно
превышать 200.
Разобраться в сложных взаимосвязях рассматриваемых методов дает
возможность классификация, предложенная Г.И. Деевым, которая
представляет
собой
иерархическую
систему
наиболее
важных
классифицирующих признаков:
1) «объектно-временные характеристики наблюдения, которые
определяются особенностями исследуемого объекта и сроками наблюдения,
включают:
− количество наблюдаемых признаков (число показателей,
характеризующих объект наблюдения) – имеет принципиальное значение –
один или несколько признаков подлежат наблюдению.
− повторяемость наблюдения во времени, возможны такие варианты
наблюдения: повторение отбора единиц на каждом цикле сбора данных;
сохранение их в течение достаточно долго времени, то есть использование
статистической сети.
2) тип отбора единиц наблюдения, то есть метод формирования
обследуемой части статистической совокупности, имеет два подуровня:
− принцип отбора (случайный, систематический (механический),
направленные (целевые))
− структура отбора, существую следующие градации:
• индивидуальный отбор, когда единицами наблюдения являются
единицы наблюдения;
• групповой отбор, когда единицами наблюдения являются качественно
однородные группы или серии;
• комбинированный отбор – сочетание индивидуального и группового.
3) способ получения данных – форма организации сбора первичной
информации.
9
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Наиболее известные его разновидности: анкетный, корреспондентский,
опросный, экспедиционный, дневниковых записей и т.д.
4) метод распространения (досчета) результатов несплошного
наблюдения на всю обследуемую совокупность». [5]
1.3 Основные
преимущества
выборочного обследования
и
проблемы
проведения
К выборочному наблюдению статистика прибегает по различным
причинам. На современном этапе появилось множество субъектов
хозяйственной деятельности, которые характерны для рыночной экономики.
Речь идет об акционерных обществах, малых и совместных предприятиях,
фермерских хозяйствах и т.д.
Основной причиной организации обследования выборочным методом
является экономия средств, а предпосылкой – возможность судить с
достаточной степенью точности (т.е. обеспечение приемлемого уровня
ошибок) о характеристиках генеральной совокупности по выборке.
Вследствие этого выборочное наблюдение имеет следующие
преимущества перед сплошным:
1) происходит повышение точности данных вследствие уменьшения
ошибки регистрации. Однако, за счет неполноты охвата единиц возникает
ошибка репрезентативности, т.е. представительности выборочных данных.
Несмотря на это, удельный вес ошибок регистрации превышает вес суммы
ошибки наблюдения и ошибки репрезентативности, следовательно,
использование выборочного обследования обеспечивает большую точность
выборочных данных по сравнению с массовым сплошным наблюдением.
2) сплошное обследование статистических совокупностей, состоящих
из десятков и сотен тысяч единиц, потребовало бы огромных материальных,
финансовых, трудовых и временных затрат. Например, сплошное
обследование бюджетов домашних хозяйств потребовало бы привлечения 2
млн. специалистов-статистиков. Обращение же к опыту выборочного
наблюдения приводит к тому, что необходимый штат сотрудников
становится меньше. Это позволяет привлекать более квалифицированных
людей, снизить опасность появления субъективных ошибок, достичь
поставленных целей с помощью меньшего количества более компетентных
специалистов-статистиков. Таким образом, использование выборочного
наблюдения является единственным экономически выгодным решением.
3) объем работы по сбору и обобщению результатов обследования
значительно меньше, поэтому результаты выборочного обследования можно
получить значительно быстрее, чем при сплошном наблюдении.
4) т.к. наблюдению подвергается лишь часть элементов общей
совокупности,
появляется
возможности
расширения
программы
обследования, т.е. более широкого и детального наблюдения каждой
единицы в отдельности. Например, при переписях населения в нашей стране
(1959, 1970, 1979, 1994, 2002 гг.) 25 % населения обследовались по
10
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
расширенной программе наблюдения».
5) при проведении обследования выборочным методом общий объем
работы меньше, поэтому можно лучше подготовить и более тщательно
контролировать его проведение и обработку данных. Следовательно,
выборочное обследование может дать более достоверные результаты, чем
соответствующее сплошное.
Все эти достоинства проявляются лишь при условии правильного
решения проблем выборочного обследования. По мнению ряда авторов
(Кокрен У, Сажин Ю.В., Венецкий И.Г.), к ним относятся:
I группа. Определение целей предполагаемого исследования и
выражение их в специфическом виде:
1) область исследования;
2) величины и другие характеристики, которые необходимо подсчитать
или измерить;
3) определение средних или итоговых показателей или исследование
структуры процесса.
II группа. План обследования:
1) выбор единицы, относительно которой производится обследование
(семья или отдельное лицо, ферма или район, индивидуум или группа);
2) выбор способа наблюдения: сплошная перепись или обследование
по выборке;
3) способ получения информации об объекте (с помощью интервью, по
почте, простым наблюдением и т.д.);
4) денежные средства и др. имеющиеся в наличии ресурсы;
5) оценка стоимости каждой операции;
6) оценка дисперсии и смещений;
7) требуемая степень точности, величина и характер риска ошибки, на
которую можно пойти.
III группа. Планирование выборки (если ее нужно осуществлять):
1) Стратификация выборки;
2) определение выборочной единицы;
3) количество и типы стадий;
4) количество и типы фаз;
5) количество выборочных единиц, которое необходимо взять на
каждой стадии и на каждой фазе;
6) стоимость каждой операции;
7) метод отбора единиц наблюдения;
8) способ преодоления затруднений, возникающих при получении
выборочных данных;
9) метод получения оценок по выборочным данным.
IV группа. Принятие решений или сбор наблюдений:
1) прямые или косвенные методы;
2) выбор формы регистрации данных (анкета, таблица, дневник и т.д.);
3) метод выбора обучения и контроля исследователя (наблюдателя);
11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4) отличный от выборки метод проведения обследования при
затруднениях с получением данных об объекте.
V группа. Обработка данных:
1) метод заполнения пропусков данных;
2) кодирование информации;
3) составление таблиц;
VI группа. Оценки и их надежность:
1) выбор оценки;
2) точные и приближенные методы оценивания доверительных
пределов.
VII группа. Исследование качества исследования:
1) проверки внутренние и внешние;
2) приемлемость результата;
VIII группа. Представление результата:
1) степень подробности;
2) степень секретности.[11,2,12]
1.4 Тесты и задачи
1.4.1 Вид наблюдения, при проведении которого статистическому
обследованию подвергаются единицы изучаемой совокупности, отобранные
по специально разработанной схеме, базирующейся, как правило, на
принципе случайности называется:
а) сплошное наблюдение;
б) выборочное наблюдение;
в) комбинированное наблюдение;
г) статистическое наблюдение.
1.4.2 Вставьте недостающее слово: Методы выборочных обследований
базируются на принципе, исключающем ____________ проведения отбора
единиц для их последующего изучения по заранее разработанной программе:
а) субъективность;
б) объективность;
в) случайность;
г) принципиальность.
1.4.3 Отметьте правильное определение выборочного наблюдения:
а) наблюдение, при котором характеристика всей совокупности единиц
дается по некоторой их части, отобранной в случайном порядке;
б) наблюдения, которые проводятся не постоянно, а через
определенные промежутки времени, либо единовременно;
в) наблюдение, которое проводят систематически, постоянно
охватывая факты по мере их возникновения;
г) наблюдение, при котором характеристика всей совокупности единиц
дается по некоторой их части, отобранной в соответствии с нормативами.
12
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1.4.4 Отбор, при котором единицами наблюдения
качественно однородные группы или серии, называется:
а) комбинированный;
б) групповой;
в) индивидуальный;
г) механический;
д) однородный.
являются
1.5 Вопросы для самопроверки и повторения
1 В чем заключается сущность выборочного наблюдения?
2 Что является предметом выборочного наблюдения?
3 Какие требования должны выполняться для обеспечения репрезентативности выборочной совокупности?
4 Назовите основные виды несплошного наблюдения.
5 Перечислите преимущества выборочного наблюдения перед
сплошным.
2 Теоретические основы применения выборочного метода
2.1 Средняя и предельная ошибки выборки
Основные положения выборочного метода, составляющие основу его
практического применения, созданы научными исследованиями выдающихся
ученых П.Л.Чебышев, А.М.Ляпунова, А.А.Маркова, Бернулли и др. В их
работах содержится, в частности, доказательство теорем, в которых устанавливается факт приближения средних размеров большого числа наблюдения к некоторым постоянным величинам. Эти теоремы составляют фундамент методологии выборочных обследований.
Как бы тщательно не проводился отбор выборочной совокупности,
никогда в точности не повторить структуру и другие показатели генеральной
совокупности. Показатели выборочной совокупности всегда будут
отклоняться от показателей генеральной совокупности.
Расхождения между характеристиками (параметрами) выборочной
совокупности и искомыми параметрами генеральной совокупности
называются ошибками.
Общая величина ошибки выборочной характеристики слагается из
ошибок двоякого рода:
1) ошибки регистрации;
2) ошибки репрезентативности
Ошибки регистрации возникают из-за неправильных или неточных
сведений. Источниками таких ошибок могут быть непонимание существа
вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров и т.д.
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам и т.д.), и случайные, проявляющиеся в различных
направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.
Ошибки репрезентативности возможны только при несплошном
наблюдении и представляют собой расхождение между величиной
полученных по выборке показателей и величиной этих показателей, которые
были получены при проведении с одинаковой степенью точности сплошном
наблюдении. Они могут быть:
а) систематическими – в связи с особенностями принятой системы
отбора и обработки данных наблюдения или в связи с нарушением
установленных правил отбора.
Систематические ошибка репрезентативности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной
принцип научно организованной выборки – принцип случайности;
б) случайными – при недостаточно равномерном представлении в
выборочной совокупности различных категорий единиц генеральной
совокупности, в силу чего распределение отобранной совокупности единиц
не вполне точно воспроизводит распределение единиц генеральной
совокупности.
Случайная ошибка возникает в силу того, что выборочное
статистическое наблюдение является несплошным наблюдением, и выборка
недостаточно
точно
воспроизводит
(репрезентирует) генеральную
совокупность.
Для измерения ошибки выборки, а также сравнения двух оценок, т.е.
выявления более эффективной оценки, используют средний квадрат ошибки
оценки (СКО), который измеряет ошибку относительно оцениваемого
параметра совокупности:
[
]
2
€)= Е (ѓЖ
€ ѓЖ
€ ѓЖ
€ ѓЖ
€ ѓЖ
€ ѓЖ
€ ѓЖ
СКО(ѓЖ
) 2 = Е (ѓЖ
)+( ѓЖѓЖ
) = Е (ѓЖ
) 2 +2(ѓЖ
)Е (ѓЖ
)+(ѓЖ
)2 =
€)+B 2 ,
=ѓР2 (ѓЖ
€ ѓЖ
€)= ѓЖ
так как Е (ѓЖ
)=0, Е (ѓЖ
.
где Е – символ, заменяющий выражение «математическое ожидание
величины»;
€ – оценка некоторой характеристики совокупности θ , получаемая
ѓЖ
согласно некоторой схеме отбора и примененной формуле оценивания;
€ – среднее значение, взятое по всем
θ – математическое ожидание ѓЖ
возможным выборкам;
B = θ − θ – смещение оценки;
€) – дисперсия оценки. [11]
ѓР2 (ѓЖ
Таким образом, СКО является критерием достоверности оценки,
который характеризует величину отклонений от истинного значения
характеристики совокупности θ .
14
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Поскольку на практике трудно проследить, чтобы оценки не давали
никаких смещений, для характеристики оценки используется понятие
«точности», относящееся к величине отклонений от усредненного значения
θ .
Степень точности оценки обычно характеризуется ее дисперсией,
стандартной
ошибкой,
коэффициентом
вариации
(относительной
стандартной ошибкой) и доверительным интервалом.
Точность какой-либо оценки, полученной по выборке зависит от двух
факторов: от способа, которым оценка вычисляется по данным выборки, и от
способа формирования самой выборки.
В выборочных обследованиях способ оценивания называется
состоятельным, если оценка становится в точности равной оцениваемому
параметру для совокупности при n = N , т.е. когда выборку составляет вся
совокупность. Очевидно, что при простом случайном отборе выборочное
среднее y и произведение N y представляют собой состоятельные оценки
соответственно среднего и суммарного значений для совокупности.
В данном контексте способ оценивания называется несмещенным, если
среднее значение оценки, взятое по всем возможным выборкам данного
объема n , в точности равно истинному значению для совокупности, и это
утверждение справедливо для любой конечной совокупности значений yi и
для любого n . Например, при простом случайном отборе выборочное
среднее y – несмещенная оценка среднего значения признака, N y –
несмещенная оценка суммарного значения Y для совокупности, где y –
среднее значение признака yi по выборке.
В теории и практике выборочных обследований часто приходится
рассматривать смещенные оценки. Это обусловлено следующими
причинами. Во-первых, в некоторых случаях, особенно при оценивании
отношений двух величин, смещенные оценки дают более достоверные
результаты, чем несмещенные. Во-вторых, даже в случае использования
теоретически несмещенных оценок ошибки наблюдения и неполучение
ответов от респондентов могут привести к смещениям в распространенных
результатах.
Определение возможной и фактически допущенной ошибки выборки
имеет важное значение при выборочном наблюдении. Величина ошибки
характеризует степень надежности результатов выборки; значение этой
величины необходимо при оценке параметров генеральной совокупности,
суждения о возможной величине и составе ошибок репрезентативности
ложатся в основу планирования проектируемого выборочного наблюдения.
Величина случайной ошибки репрезентативности зависит от:
1) от принятого способа формирования выборочной совокупности (т.е.
от выбора единицы отбора, от равномерности представления в группах
единиц совокупности);
2) от объема выборки;
3) от степени колеблемости изучаемого признака в изучаемой
15
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
совокупности.
При определении величины репрезентативной ошибки предполагается,
что ошибка регистрации равна нулю. Определение ошибки производится по
формулам ошибки выборочной доли и ошибки выборочной средней. Систематическая ошибка репрезентативности возникает вследствие нарушения
правил отбора единиц генеральной совокупности, в частности принципа т
беспристрастного, непреднамеренного отбора. Систематическая ошибка
может привести к полной непригодности результатов наблюдений.
Ошибка репрезентативности – это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения. Для среднего значения ошибка будет определяться так:
~
∆х = Х − Х ,
N
где Х =
∑X
i =1
i
N
- генеральная средняя;
n
~
Х =
∑X
i =1
n
i
выборочная средняя.
Величина ∆ x называется предельной ошибкой выборки и является случайной.[11]
2.2 Теорема Чебышева
Исследованию закономерностей случайных ошибок посвящены предельные теоремы закона больших чисел. Наиболее популярно эти закономерности раскрыты в теоремах П.Л.Чебышева и применительно к рассматриваемому методу можно сформулировать следующим образом: при достаточно большом числе независимых наблюдений можно с вероятностью,
близкой к единице (т.е. почти с достоверностью) утверждать, что отклонение
выборочной средней от генеральной будет сколь угодно малым. В теореме
П.Л.Чебышева доказано, что величина ошибки не должна превышать µ t . В
свою очередь величина µ , выражающая среднее квадратическое отклонение
выборочной средней от генеральной средней, зависит от колеблемости
признака в генеральной совокупности σ и числа отобранных единиц n. Эта
зависимость выражается формулой
µ=
σ
n
,
где µ зависит также и от способа формирования выборочной совокупности, о
чем сказано ниже.
Величину
σ
n
— называют средней ошибкой выборки. В этом
выражении σ 2 - генеральная дисперсия, а п - объем выборочной совокупности.[2]
16
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рассмотрим, как влияет на величину средней ошибки число
отбираемых единиц n. Логически нетрудно убедиться, что при отборе
большого числа единиц расхождения между средними будут меньше, то есть
существует обратная связь между средней ошибкой выборки и числом
отобранных единиц. При этом здесь образуется не только просто обратная
математическая зависимость, а такая зависимость, которая показывает, что
квадрат расхождения между средними, обратно пропорционален числу
отобранных единиц. Увеличение колеблемости признака влечет за собой
увеличение среднего квадратического отклонения, а, следовательно, и
ошибки.
Если предположить, что все единицы будут иметь одинаковую величину признака, то среднее квадратичное станет равным нулю и ошибка выборки также исчезнет. Тогда нет необходимости применять выборку. Однако
следует иметь в виду, что величина колеблемости признака в генеральной
совокупности нам бывает не известна, поскольку неизвестны размеры единиц в ней. Возможно рассчитывать лишь колеблемость признака в выборочной совокупности.
Соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой:
σ x2 = σ ~x2
Поскольку величина
n
.
n −1
n
при достаточно больших п близка к 1, то
n −1
можно приближенно считать, что выборочная дисперсия равна генеральной.
Следовательно, средняя ошибка выборки показывает, какие возможны
отклонения характеристик выборочной совокупности от соответствующих
характеристик генеральной совокупности. Однако о величине этой ошибки
можно судить с определенной вероятностью. На величину вероятности указывает множитель t.
2.3 Теорема Ляпунова
А.М. Ляпунов доказал, что распределение выборочных средних (а,
следовательно, и их отклонений от генеральной средней) при достаточно
большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.
Математически теорему Ляпунова можно записать так:
p{ x − ~
x ≤ ∆x} =
где ∆ x =
σ2
n
1
2π
t
∫e
t2
2
dt = Φ (t ) ,
−t
− предельная ошибка выборки, которая дает возможность выяс-
нить, в каких пределах находится величина генеральной средней;
π = 3,14 .
17
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Значения этого интеграла для различных значений коэффициента вычислены и приводятся в специальных математических таблицах:
при t = 1 Ф(t)=0.683; при t = 1.5 Ф(t) = 0.866;
при t =2 Ф(t) = 0.954; при t = 2,5 Ф (t) = 0.988;
при t = 3 Ф(t) =0.997; при t = 3.5 Ф(t) = 0.999.
Поскольку t указывает на вероятность расхождения х − ~х , т.е. на вероятность того, на какую величину генеральная средняя будет отличаться от
выборочной средней, то это может быть прочитано так: с вероятностью 0,683
можно утверждать, что разность между выборочной и генеральной средними
не превышает одной величины средней ошибки выборки. Другими словами,
в 68,3% случаев ошибка репрезентативности не выйдет за пределы. С
вероятностью 0,954 можно утверждать, что ошибка репрезентативности не
превышает 2 µ ± (т.е. в 95% случаев). С вероятностью 0,997, т.е. довольно
близкой к единице, можно ожидать, что разность между выборочной и
генеральной средней не превзойдет трехкратной средней ошибки выборки и
т.д. [12]
Логическая связь здесь выглядит довольно ясно: чем больше пределы,
в которых допускается возможная ошибка, тем с большей вероятностью судят о ее величине.
Для различных способов отбора предельная ошибка рассчитывается
при проведении выборки по-разному. Зная выборочную среднюю величину
признака ~х предельную ошибку выборки ∆ x , можно определить границы
(пределы), в которых заключена генеральная средняя:
~
х − ∆х ≤ х ≤ ~
х + ∆х .
2.4 Теорема Бернулли
Теорема Бернулли была доказана раньше теоремы Чебышева - Ляпунова, но является лишь частным случаем последней. Она рассматривает
ошибку выборки для альтернативного признака, т.е. признака, у которого
возможны только два исхода: наличие признака (1) и отсутствие его (0).
Теорема Бернулли утверждает, что при достаточно большом объеме
выборки вероятность расхождения между долей признака в выборочной совокупности и» и долей признака в генеральной совокупности р будет стремиться к единице.
В математических символах выражение теоремы Бернулли будет иметь
вид: p[ w − p ≤ tµ ] → 1 , т.е. с вероятностью, сколь угодно близкой к единице,
можно утверждать, что при достаточно большом объеме выборки частость
признака (выборочная доля) сколько угодно мало будет отличаться от доли
признака (в генеральной совокупности).
В виду того, что вероятность расхождения между частостью и долей
следует закону нормального распределения, эту вероятность можно найти по
функции F(t) в зависимости от задаваемой величины t.
Из теоремы Бернулли следует, что величина расхождения между долей
18
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
признака в выборочной совокупности (частостью) и долей этого
признака в генеральной совокупности зависит, так же как и в расхождениях
средних, от средней ошибки выборки.[2]
Поскольку µ =
σ
n
, а среднее квадратическое отклонение в генеральной
совокупности для альтернативного признака равно рq, где q=1-p, то средняя
ошибка выборки для альтернативного признака должна быть найдена по
формуле:
µ=
pq
.
n
Однако доля признака в выборочной совокупности нам не известна, мы
вынуждены заменить ее через долю того же признака в генеральной совокупности, т.е. принять w ≈ p , а дисперсию альтернативного признака
принять за w(1-w), тогда средняя ошибка выборки выразится формулой:
µ=
w(1 − w)
.
n
Предельная величина разности между частостью и долей называется
предельной ошибкой выборки. О величине предельной ошибки можно судить
с некоторой вероятностью, которая зависит от множителя t, поскольку
∆ w = tµ .
Зная выборочную долю признака w и предельную ошибку выборки ∆ w
можно определить границы, в которых заключена генеральная доля:
w − ∆w ≤ p ≤ w + ∆w .
Если отбор единиц из генеральной совокупности произведен
бесповторным способом, то в формулы средней ошибки выборки вносится
поправка
1−
n
, где n – объем выборочной совокупности; N – объем
N
генеральной совокупности. Данный множитель вносит поправку,
учитывающую изменение характеристик генеральной совокупности
вследствие уменьшения ее численности при бесповторном отборе. Но
необходимо учитывать, что данное выражение пригодно лишь для больших
выборок, т.к. в случае малой выборки должен использоваться более точный
коэффициент
( N − n)
.
( N − 1)
2.5 Тесты и задачи
2.5.1 При проведении выборочного наблюдения
повышение точности данных вследствие:
а) уменьшения ошибки регистрации;
б) увеличения ошибки регистрации;
в) уменьшения ошибки репрезентативности;
г) увеличения ошибки репрезентативности.
происходит
19
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.5.2 Ошибки, обусловленные причинами, действующими в каком-то
одном направлении и искажающими результаты работы (например,
округление цифр, тяготение к полным пятеркам, десяткам и т.д.), являются:
а) случайными ошибками регистрации;
б) систематическими ошибками регистрации;
в) случайными ошибками репрезентативности;
г) систематическими ошибками репрезентативности.
2.5.3 Ошибки, проявляющиеся в различных направлениях,
уравновешивающие друг друга и лишь изредка дающие заметный
суммарный итог, называются:
а) случайными ошибками регистрации;
б) систематическими ошибками регистрации;
в) случайными ошибками репрезентативности;
г) систематическими ошибками репрезентативности.
2.5.4 Расхождение между значениями изучаемого признака выборочной
и генеральных совокупностей является:
а) ошибкой регистрации;
б) ошибкой совокупности;
в) ошибкой репрезентативности;
г) ошибкой наблюдения.
2.5.5 Вставьте пропущенное слово: увеличение колеблемости признака
влечет за собой ________ошибки.
а) увеличение
б) уменьшение
в) неизменность.
2.5.6 Что произойдет с величиной предельной ошибки выборки, если
вероятность, гарантирующую результат, уменьшить с 0,954 до 0,683?
а) уменьшится в 2 раза;
б) увеличится в 2 раза;
в) увеличится в 3 раза.
2.5.7 Укажите, что произойдет с предельной ошибкой выборки, если
дисперсию ( σ 2 ) уменьшить в 4 раза, численность выборки увеличить в 9 раз,
а вероятность исчисления изменится с 0,683 до 0,997 (t=1 и t =3):
а) увеличится в 9 раз;
б) уменьшится в 2 раза;
в) увеличится в 2 раза;
г) уменьшится в 9 раз.
2.5.8 По данным 5 %-ного выборочного обследования, дисперсия
среднего срока пользования краткосрочным кредитом 1-го банка 144, а 2-го
20
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
81. Число счетов 1-го банка в 4 раза больше, чем 2-го. Ошибка выборки
больше:
а) в 1-м банке;
б) во 2-м банке;
в) ошибки одинаковы;
г) предсказать невозможно.
2.6 Вопросы для самопроверки и повторения
1 Что характеризует предельная ошибка выборки?
2 В каком случае возникает систематическая ошибка репрезентативности?
3 Что является причиной возникновения случайной ошибки репрезентативности?
Что влияет на величину случайной ошибки репрезентативности?
4 В чем заключается теорема Чебышева?
5 В чем суть теоремы Лапласа?
6 В чем заключается теорема Бернулли?
3 Проектирование и проведение выборочного наблюдения
3.1 Программно-методологические вопросы и проектирование
инструментария
Проектирование любого статистического наблюдения, в том числе и
выборочного, начинается с формулировки его цели. При этом следует обратить внимание на два главных требования, предъявляемых к цели наблюдения. Во-первых, она должна быть актуальной. Из многообразия явлений и
процессов необходимо выбрать те из них, от изучения которых в первую
очередь зависит проводимых в настоящее время реформ.
Второе требование, которому должна удовлетворять цель выборочного
наблюдения, заключается в ее четкости и конкретности. Сложность и
многогранность социально-экономических явлений часто препятствует четкому и точному выражению целей и задач.
По мнению ряда авторов (Венецкий И.Г., Кильдишев Г.С., Кокрен У),
одним из принципов проектирования статистического наблюдения является
научно обоснованное определение того, что предполагается изучить, т.е.
объекта наблюдения. Определение объекта включает в себя указание его
отличительных черт, позволяющих отделить данный объект от других,
близких к нему по характеру объектов.[2,10,11]
Критериями по ограничению объекта могут быть и положения законов
и постановлений руководящих органов. При этом наиболее удобны количественные критерии, с помощью которых удается установить границы объекта
более точно. Так, если объектом выборочного наблюдения являются малые
21
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
предприятия, отделить их от других предприятий можно достаточно легко,
зная ограничения по численности занятых. Например, в науке и научном
обслуживании к малым относятся предприятия с численностью занятых до
100 человек, а в розничной торговле – до 15 человек.
Однако применение количественных критериев в целях определения
границ возможно не всегда. Иногда ограничение объекта может быть достигнуто простым перечислением его составных частей, подлежащих учету.
Такой способ использовался, в частности, при проектировании в 1994 г. выборочного обследования перевозочной деятельности предпринимателей,
проводимого и в настоящее время. Объект наблюдения отграничивался на
основе выделения типа автомобилей (в данном случае обследовались только
владельцы грузовых автомобилей).
С целью правильной организации статистического наблюдения важно
обоснованно определить единицу наблюдения и единицу отбора. Решение
данного вопроса тесно связано с выделением изучаемого объекта. Четкое
отделение единицы наблюдения позволяет отграничить единицы друг от
друга, исключить из наблюдения те единицы, которые не должны входить в
состав обследуемой совокупности согласно определению объекта.
Чем сложнее исследуемое с помощью выборочного метода явление,
тем труднее определить объект и единицу наблюдения, но вместе с тем и
более необходимо. Это касается в частности, изучения совокупностей, единицы которых отличаются высокой подвижностью, например, совокупностью посетителей выставок, пассажиров на транспорте и т.п.
В процессе подготовки выборочного наблюдения следует стремиться к
обеспечению определенного соотношения между единицей отбора и
единицей наблюдения. Оно заключается в том, что единица отбора не была
меньше, чем единица наблюдения. В противном случае возникает угроза
возникновении систематической ошибки.
Одним из главных вопросов подготовки наблюдения является вопрос о
его программе.
Использование принципов выборочного метода в исследовании социальных явлений открывает широкие перспективы сбора информации по более обширной программе, чем при сплошном наблюдении.
Содержание программы определяется, прежде всего, сущностью
изучаемого объекта. Особенности изучаемых явлений и процессов
предъявляют повышенные требования к предварительному анализу
сущности и основных свойств объекта выборочного исследования. На
содержание программы влияют также цель конкретного обследования,
потребность в определенных данных о социальных явлениях для
государственного управления, хозяйственного руководства и научных
исследований.
Правильно составленная программа призвана обеспечить получение
таких сведений, которые бы по возможности полно и всесторонне
характеризовали изучаемое явление или процесс. Для этого программа
должна быть достаточно подробной.
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В то же время имеется целый ряд факторов, ограничивающих ее объем.
Наиболее важными из них являются: размер средств, выделенных на
проведение обследования; требуемая срочность получения данных и др. В
случае если, организация выборочного наблюдения не дает возможность
получения достоверных сведений по широкой программе, то лучше
ограничить круг исследуемых вопросов, обеспечив сбор небольшого по
объему, зато хорошего с точки зрения качества материала.
Для проектирования выборочного наблюдения социальных явлений это
особенно важно, т.к. программы многих проводимых в данной области
обследований содержит большое число вопросов, от нескольких десятков, до
сотни и более вопросов.
Наличие большого количества вопросов еще не гарантирует получения
подобной характеристики изучаемого объекта. Оно может стать причиной
отказа части опрашиваемых от участия в наблюдении или получения
непродуманных, а, следовательно, недостаточно объективных ответов из-за
отсутствия времени на осмысление каждого вопроса.
При разработке программы выборочных обследований необходимо
иметь в виду, что она должна включать наиболее существенные признаки.
Эти признаки должны по возможности непосредственно отражать изучаемое
явление, его тип, основные черты, свойства. Второстепенные вопросы осложняют проведение наблюдения, а в дальнейшем – обработку и анализ
данных. В программу не следует также включать вопросы, по которым вряд
ли можно рассчитывать на достоверные ответы.[12]
Программа наблюдения находит свое отражение в его формуляре.
Основным принципом построения формуляра является как можно более
краткая, ясная и четкая формулировка вопросов. Их понимание не должно
вызывать затруднений и должно быть одинаковым как у опрашиваемых, так
и у проводящих выборочное обследование работников.
В бланках выборочных обследований помимо собственно вопроса,
часто необходимо приводить перечень статистических подсказов. Они, с
одной стороны, уточняют вопрос, а с другой – ограничивают возможную
интерпретацию ответов. Информация, полученная на основе вопросов с
подсказами, требует меньших затрат времени, она проще в обработке.
Иногда в формуляр наблюдения нужно включать так называемые
контрольные вопросы. Они помогают на основе арифметического и
логического контроля выявить ошибки наблюдения и тем самым
способствуют повышению достоверности его данных. Контрольный вопрос
ставится с целью проверки правильности ответа на один из основных
вопросов. В функции контрольных вопросов не входит получение какойлибо дополнительной информации.
При использовании контрольных вопросов необходимо иметь в виду,
что в формуляре их не должно быть много, по крайней мере, по двум
причинам. Во-первых, обилие контрольных вопросов «перегружает»
формуляр сведениями, не несущими дополнительной информации, и
повышает затраты на проведение обследования. Во-вторых, злоупотребление
23
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
контрольными вопросами часто вызывает раздражение у опрашиваемых,
которые, со своей точки зрения, вполне справедливо полагают, что не имеет
смысла неоднократно спрашивать то, что не имеет особого смысла или не
является необходимым.
Что касается внешнего вида формуляра, то стоит по возможности
избегать больших по размеру бланков. С ними сложно работать,
представляет трудность их хранение. Желательно также не пользоваться
бланками, состоящими из нескольких не связанных между собой листов.
Обычно вместо двух и более листов лучше воспользоваться обеими
сторонами одного и того же листа или карточки.
Составление инструкции для выборочного наблюдения социальных
явлений в основном базируется на тех же принципах, что и для статистического наблюдения вообще. Она должна быть как можно более краткой, указания – ясными и четкими.
Как бы хорошо с точки зрения организаторов не был спроектирован
инструментарий выборочного наблюдения, фактическая работа по
проведению обследования не всегда будет совпадать с составленным заранее
планом. Отсюда вытекает необходимость проверки статистического
инструментария на основе пробного обследования, подобно тому, как это
делается, например, перед проведением переписей населения.
3.2 Оценка исходной информации
формирования выборочной совокупности
и
определение
основы
Качество результатов статистического исследования в значительной
степени зависит, от уровня подготовки его первой стадии – процесса
наблюдения. Среди проблем, связанных с подготовкой выборочного
наблюдения, важное место занимает проблема получения исходной
информации об объекте исследования.
Выделение объекта исследования и сбор необходимой информации о
нем являются предварительными условиями его статистического изучения.
Без возможно более подробной характеристики объекта на основе собранной
о нем информации трудно правильно спроектировать выборочное наблюдение и обеспечить репрезентативность его данных.
Сущность проблемы исходной информации заключается в том, что при
планировании выборочного наблюдения такая информация либо совсем
отсутствует, либо в случае исследования нового объекта является недостаточно точной и полной, либо является настолько разнородной, что не позволяет составить целостного представления об исследуемом объекте.
Причиной отсутствия информации может быть исследование какоголибо нового объекта, ранее никогда не подвергавшегося статистическому
изучению. Основной причиной неточности и неполноты исходной информации являются погрешности, возникающие в процессе ее получения.
Под этими погрешностями подразумеваются ошибки, характерные для любого статистического наблюдения, в том числе и выборочного. Неполнота
24
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
данных об изучаемом объекте может быть связана также с изменением методики отбора, в частности с образованием выборочной совокупности по
признаку, который отсутствует в исходной информации. Такая информация
может не удовлетворять организаторов наблюдения и потому, что расширение задач социально-экономических исследований требует более подробной
характеристики совокупности, из которой затем предстоит произвести отбор.
Причины разнородности исходной информации следует искать, прежде
всего, в разнообразии ее источников. Источниками первичной информации
для подготовки выборочного наблюдения могут служить как материалы
органов государственной статистики (отчетность, данные единовременного
наблюдения и др.), так и иные источники (результаты социологических
исследований, кадровая информация, сведения, полученные из избирательных комиссий и т.п.). Обращение организаторов обследований к
дополнительным данным, степень достоверности которых уступает точности
данных государственной статистики, вызвано, прежде всего, тем, что в ряде
случаев у органов государственной статистики нет необходимых данных для
формирования представительной выборочной совокупности.
Наличие исходной информации определяет работу по образованию
выборочной совокупности и как предварительный этап – построение основы,
т.е. перечня единиц отбора. Составление такого перечня на практике часто
бывает одной из самых главных задач подготовки выборочного наблюдения.
К настоящему времени сложились представления об основе, которая
могла бы удовлетворить принципам научной организации выборки. Они
нашли свое отражение в ряде требований, предъявляемых к основе. В общем
виде, по мнению Гусынина А.Б., Венецкого И.Г., эти требования сводятся к
следующему: основа выборки должна быть
1) полной;
2) точной;
3) не содержащей дублирования;
4) соответствующей задачам конкретного обследования;
5) как можно более оперативной;
6) удобной в работе. [2,4]
Под полнотой подразумевается представленность всех типов или групп
данной генеральной совокупности в основе выборки. Если в качестве
исходной информации для формирования выборочной совокупности используется список, то в нем обязательно присутствие всех единиц, образующих те или иные типы (группы). В противном случае исходная информация является неполной, что может привести к серьезным ошибкам, особенно когда не включенные в выборочную совокупность единицы представляют достаточно многочисленные группы в генеральной совокупности.
Точность основы выборки предполагает, что сведения о
перечисляемых в основе единицах и используемые при организации процесса
отбора, не должны содержать каких-либо неточностей. Подобные неточности
встречаются в списках избирателей. В них иногда отсутствуют лица, вновь
прибывшие в данный населенный пункт, или, наоборот, остаются лица,
25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
изменившие свое место жительства, умершие и т.п.
Если те или иные единицы генеральной совокупности включаются в
основу более одного раза, это может привести к их повторению в выборке и,
как следствие, − к двойному счету или дублированию. Он возникает, например, в том случае, когда человек переезжает из одного района в другой и
заносится в новый список раньше, чем исключается из старого. Причиной
погрешностей такого рода являются недостатки в организации учета механического движения населения.
Соответствие исходной информации задачам проводимого исследования означает, что она должна быть пригодна для реализации конкретных
целей изучения ограниченного во времени и пространстве объекта. Одна и та
же информация, адекватная для решения одних задач, может быть
неадекватной для других.
По мнению Сажина Ю. В., полный список работающих на предприятии
может стать хорошей основой для выборочного исследования
производительности труда на данном предприятии. Но если целью является
производительность труда не всех работников, а их части (скажем,
работников цеха, бригады и т.п.), то полный список в «чистом виде » здесь не
пригоден. Он может служить лишь для образования новой основы,
относящейся к указанному подразделению или группе. [12]
Существенное значение для формирования выборочной совокупности
имеет оперативность информации, содержащейся в основе. Основа выборки, которая в момент ее построения удовлетворяет требованиям полноты,
точности, целям и задачам конкретного исследования, может уже не быть
таковой ко времени, когда ею нужно будет пользоваться. Использование устаревшей информации о составе, структуре, основных характеристиках объекта, ведет к тому, что результаты выборочного наблюдения характеризуют
совокупность, существовавшую в прошлом.
Понятно, что чем больше период, отделяющий время применения данных о генеральной совокупности от времени, на которое эти данные
составлялись, тем меньше вероятность получить характеристику
современного состояния изучаемого объекта.
Одним из условий, влияющих на процесс отбора, является удобство
работы с исходной информацией. Оно предполагает возможность быстро
получить сведения о генеральной совокупности; с полной определенностью
идентифицировать
их;
систематизировать
собранные
данные
(пронумеровать, ранжировать, объединить в группы и т.д.). Удобство работы
предполагает также наличие определенного порядка хранения и обращения
информации.
Неточность основы, если она будет характерна для отобранных единиц,
может быть автоматически обнаружена при анализе выборочной
совокупности и в ходе самого обследования.
В этом случае отдельные неточности в сведениях о попавших в
выборку единицах генеральной совокупности могут быть исправлены. И хотя
погрешности исходной информации, безусловно, отразятся на точности
26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
результатов наблюдения, их влияние поддается контролю. В процессе
корректировки данных оно может быть уменьшено.
В отличие от неточности неполнота основы при проведении
обследования не обнаруживается. Следовательно, в той мере, в которой
основа является неполной, население или какой-либо другой изучаемый
объект не будут подвергаться обследованию. Данный недостаток является
тем более серьезным, что часто причина неполноты заключается в
сознательном исключении из основы единиц, обладающих особенностями по
сравнению с остальными. Поэтому такие единицы будут представлены
недостаточно в выборочной совокупности. Это ставит под сомнение
правомерность распространения полученных результатов на всю
совокупность социальных явлений, которые, как правило, характеризуются
неоднородностью.
К недостаточной репрезентативности выборки приводит и повторный
счет, содержащийся в исходной информации. Единицы отбора, дважды
учтенные в ней, имеют соответственно больше шансов попасть в
выборочную совокупность. Однако в то время как при анализе основы
определить или исправить ее неполноту нельзя, повторный счет исправить и
устранить можно, хотя это требует дополнительных расчетов и проверки
качества исходной информации.
Несоответствие основы целям и задачам обследования обычно
выясняется еще до его начала. Предварительный анализ исходной
информации позволяет сопоставить ее с задачами, которые планируется
решить. Выявленные расхождения могут быть устранены путем создания
дополнительной основы. При этом вспомогательная основа либо создается из
имеющейся выделением частной основы, либо расширением существующей
за счет дополнительной информации строится новая основа.
При подготовке обследования важно тщательно рассмотреть любую
основу, которую возможно использовать, а при необходимости – изучить
возможность уточнения имеющихся данных. Только после этого можно
приступать к следующему этапу – к процессу формирования выборочной
совокупности.
3.3 Тесты и задачи
3.3.1 Несопоставимость данных возникает при выборочном
обследовании:
а) когда неверно составлена программа выборочного обследования;
б) в момент распространения результатов на генеральную
совокупность;
в) когда неверно определен объем выборки.
3.3.2 Несопоставимость, возникающая из-за проведения обследования
в различные периоды времени, является:
а) территориальной;
27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
б) моментной;
в) хронологической;
г) статистической;
д) выборочной.
3.3.3 Несопоставимость, возникающая из-за проведения обследования
на различных территориях, является:
а) территориальной;
б) моментной;
в) хронологической;
г) статистической;
д) выборочной.
3.3.4 Наличие или представленность всех типов или групп данной
генеральной совокупности в основе выборки называется:
а) сопоставимостью;
б) полнотой;
в) основой;
г) точностью;
д) единством.
3.4 Вопросы для самопроверки и повторения
1 Какие требования предъявляются к цели выборочного наблюдения?
2 Назовите факторы, ограничивающие объем программы наблюдения.
3 С какой целью в формуляре ставится контрольный вопрос?
4 Назовите причины отсутствия исходной информации.
5 Перечислите и раскройте требования, предъявляемые к основе
выборки.
4 Способы отбора единиц из генеральной совокупности
Применение выборочного метода наблюдения включает следующие
этапы: определение генеральной совокупности и единиц наблюдения,
обладающих первичной информацией, необходимой для решения задач
обследования; создание основы выборки; формирование выборочной
совокупности путем отбора элементов основы; распространение собранных
по выборке данных на генеральную совокупность.
Последний этап зависит от примененного способа отбора элементов в
выборку и используемой формулы оценивания характеристик генеральной
совокупности по данным выборки.
В статистической практике выборки извлекаются из конечных
списочных основ. Однако единица основы, единица отбора и единица
наблюдения могут отличаться. Например, это обычная ситуация при
28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
обследованиях населения и сельскохозяйственного сектора.
При рассмотрении любой схемы извлечения выборки должны быть
учтены два фактора:
а) использовалась или нет вероятностная процедура;
б) наличие или отсутствие объективности в действиях специалиста,
формирующего выборку.
Смысл объективности ясен и однозначен: любой специалист,
производящий отбор, получил бы ту же самую выборку с теми же самыми
свойствами. Субъективность означает, что специалисту, производящему
отбор, позволено опираться на собственное суждение или интуицию
относительно того, что является «хорошей» выборкой.
Рассматривая каждый из этих факторов на двух уровнях, можно
выделить четыре типа выборок, представленных в таблице 1.[17]
Таблица 1 – Типы выборок
Роль, которую
играет специалист,
осуществляющий
отбор
Объективная
Субъективная
Процедура отбора
Вероятностная
Выборки,
сформированные
вероятностным
(случайным)
образом
Выборки,
сформированные
квазислучайным
образом
Невероятностная
Выборки,
сформированные
на основе
направленного
отбора
Выборки,
сформированные
на основе
суждения эксперта
В статистической практике используются все четыре типа выборок.
Однако обычно отдают предпочтение вероятностным (случайным) выборкам
как наиболее объективным, поскольку имеется хорошо обоснованная теория,
позволяющая понимать поведение таких выборок и оценивать их свойства
отображения характеристик всей совокупности. Свойства и объективная
ценность других выборок известны в меньшей мере.
Имеются два типа выборок, основывающихся на вероятностном
способе отбора: выборки, отбираемые по объективным правилам
вероятностного (случайного) отбора, и выборки, отбираемые, строго говоря,
не по этим правилам (квазислучайные). Одно из наиболее ценных качеств
вероятностных выборок состоит в том, что можно оценить точность
получаемых результатов по данным самой выборки.
29
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4.1 Вероятностные выборки
В теории выборочных обследований рассматриваются выборки,
извлеченные из совокупностей (основ выборки), содержащих некоторое
конечное число единиц N . Эти единицы различимы между собой и число
различных выборок объема n , которые могут быть извлечены из списка N
единиц, равно числу сочетаний CNn .
В выборочных статистических обследованиях в целях расчета
параметров совокупности основное внимание направлено на изучение
определенных свойств единиц, которые измеряются и фиксируются в
процессе наблюдения для каждой единицы, включенной в выборку. Эти
свойства называются признаками.
Хотя выборка используется для многих целей, обычно представляют
интерес четыре характеристики совокупности:
1) Y – среднее значение признака (например, среднее число занятых на
одном предприятии);
2) Y – суммарное значение признака (например, выпуск продукции
предприятиями промышленности);
3) отношение двух суммарных или средних значений (например,
отношение стоимости ликвидных активов к общей стоимости активов);
4) доля единиц в совокупности, относящихся к некоторой
определенной группе (например, доля промышленных предприятий,
оказывающих платные услуги населению) или обладающих определенным
значением признака.
4.1.1 Простой случайный отбор
Развитие современной теории выборочного наблюдения началось со
случайной выборки. Лежащие в основе простой случайной выборки понятия
и категории являются исходными при разработке других форм выборочного
наблюдения.
При простой случайной выборке отбор производится из всей массы
единиц генеральной совокупности без предварительного расчленения ее на
какие-либо группы, и единицы отбора совпадают с единицами наблюдения.
Наиболее просто случайный отбор единиц можно организовывать для
совокупностей, учитываемых по состоянию на данный момент и
включающих в себя счетное множество единиц. В таких случаях есть
возможность заранее составить пронумерованный список единиц
генеральной совокупности. Случайная выборка может осуществляться с
помощью жеребьевки либо по таблице случайных чисел. В первом случае
отбор из списка единиц может быть произведен путем жеребьевки. Во
втором случае производится выбор случайных чисел, которые образуют
порядковые номера для отбора. Числа в таблицах обычно печатаются в виде
блоков цифр, чтобы сделать таблицы более удобными для чтения по
сравнению с не разбитой на блоки массой цифр, причем эти объединения в
30
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
блоки не имеют статистического значения.
Ниже, в таблице 2, представлены формулы, применяющиеся для
оценки параметров при проведении простого случайного отбора.[17]
Таблица 2 – Формулы оценивания при простом случайном отборе
Статистические
показатели
Суммарное значение
признака
Среднее значение
признака
Дисперсия признака
Дисперсия оценки
суммарного значения
признака
Дисперсия оценки
среднего значения
признака
Стандартная ошибка
оценки суммарного
значения признака
Стандартная ошибка
оценки среднего
значения признака
Коэффициент
вариации оценки
Истинное значение
Оценка
n
N
€= N y
Y
n i =1 i
Y = ∑ yi
‡”
i =1
Y =
S2 =
1 N
∑ yi
N i =1
1 N
∑ ( yi − Y )2
N − 1 i =1
y=
s2 =
2 2
€ )= N S ( N n )
V( Y
n
N
V ( y) =
S2 N − n
(
)
N
n
KV =
S
N −n
(
)
N
n
€)
S(Y
S( y)
*100%=
*100%
Y
Y
1 n
∑ ( yi − y )2
n − 1 i =1
2 2
€ )= N s ( N n )
v( Y
n
N
v( y ) =
€ )= NS ( N n )
S( Y
N
n
S ( y) =
1 n
∑ yi
n i =1
s2 N − n
(
)
N
n
€ )= Ns ( N n )
s( Y
N
n
s( y ) =
kV =
s
N −n
(
)
N
n
€)
s( Y
s( y)
*100%=
*100%
€
y
Y
При простом случайном отборе для получения выводов о параметрах
совокупности используют выборочное среднее в качестве оценки среднего
значения признака совокупности, а дисперсию признака по выборке – для
оценки дисперсии признака совокупности. Для простой случайной выборки
усредненные выборочные средние и дисперсии точно равны среднему и
дисперсии признака совокупности.
Формулы для долей получаются, если в качестве признака y взять
индикатор со значениями 0 или 1 принадлежности элемента к
интересующему классу совокупности.
В зависимости от выбора единиц различают:
− повторный;
− бесповторный отбор.
Повторный метод отбора применяется в тех случаях, когда характер
исследуемого явления предполагает возможность повторной регистрации
единиц. Такая возможность в практике работы органов государственной
31
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
статистики, прежде всего, может иметь место в изучении масштабов теневой
экономики, а также в различных выборочных обследованиях населения.
При повторном отборе вероятность попадания каждой отдельной
единицы в выборку остается постоянной, т.к. после отбора она снова
возвращается в совокупность и снова может быть выбранной.
Из возможных результатов простой случайной выборки наиболее
вероятны такие, при которых величина выборочной средней будет близка к
величине генеральной средней, и, следовательно, разность между
выборочной и генеральной средней будет близка к нулю. Таким образом, чем
больше величина случайной ошибки выборки, тем менее вероятно появление
такой ошибки.
В отдельных выборках значения выборочных средних не будут точно
совпадать с величиной генеральной средней, но если рассчитать среднюю из
всех возможных значений выборочной средней, то величина этой средней
будет совпадать с величиной генеральной средней:
k
x=
∑ ~x f
j
j =1
k
∑f
j =1
j
.
j
Другими словами, при простой случайной выборке средняя
арифметическая является несмещенной оценкой генеральной средней.
Всегда существует предел расхождения между выборочной и
генеральной средней. Чем больше величина случайной ошибки, менее
вероятно появление такой ошибки.
В математической статистике доказывается, что величина средней
квадратической стандартной ошибки (средней ошибки выборки)простой
случайной повторной выборки может быть определена по формуле:
µx =
σ2
n
.
Предельная ошибка выборки вычисляется по формуле:
∆x = tµ x , то есть она равна t-кратному числу средних ошибок выборки.
Где t – это коэффициент доверия.
Средняя квадратическая ошибка доли выборки определяется по
формуле:
µw =
w(1 − w)
.
n
Предельная ошибка доли:
∆ w = tµ w .
Численность выборки для простого случайного отбора определяется:
n=
t2 ⋅σ 2
.
∆2x
При определении по материалам выборки доли признака объем
32
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
выборочной совокупности определяется:
n=
t 2ω (1 − w)
.
∆2w
Для случая, когда частость даже приблизительно неизвестна можно
произвести примерный расчет численности выборки, введя в расчет
максимальную величину дисперсии доли, равную 0,25:
n=
t2
. [14]
4∆2w
Применение простой случайной выборки на практике весьма
ограничено. Прежде всего, практически нецелесообразно, а иногда
невозможно повторное наблюдение одних и тех же единиц, а поэтому
однажды обследованная единица повторному учету не подвергается.
Бесповторный отбор означает, что каждая отобранная единица (или
серия) не возвращается в генеральную совокупность и не может
подвергнуться вторичной регистрации, а поэтому для остальных единиц
вероятность попасть в выборку увеличивается.
Применение случайного бесповторного отбора взамен повторного
диктуется также требованием повышения степени репрезентативности
выборки (особенно при недостаточно больших n).
Средняя квадратическая ошибка случайной бесповторной выборки
определяется по формулам:
− для средней арифметической
µx =
− для доли
µw =
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
w(1 − w) ⎛
n⎞
⎜1 − ⎟ .
n
⎝ N⎠
При сопоставлении повторного и бесповторного отборов получается,
что применение бесповторного отбора взамен повторного приводит к
уменьшению стандартной ошибки выборки. В тех случаях, когда
численность генеральной совокупности N очень велика по сравнению с
n
числом отобранных единиц n, величина ⎛⎜1 − ⎞⎟ будет близка к единице, а
⎝
N⎠
поэтому ею можно пренебречь. Тогда ошибку случайного бесповторного
отбора определяют по формуле простой случайной повторной выборки, что
повышает надежность оценок генеральных характеристик по выборочным
данным.
Из формул для расчета средней ошибки выборки следует, что ошибка
выборки практически не зависит от доли отбора, так как поправка на
n
конечность совокупности ⎛⎜1 − ⎞⎟ проявляется только при больших долях
⎝
N⎠
отбора. С увеличением абсолютной численности выборки ошибка
уменьшается пропорционально корню квадратному из n, причем сначала
33
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
быстро, а затем все более медленно.
Предельные ошибки выборки находятся по формуле:
− для средней арифметической
∆ ~x = tµ x = t
− для доли
∆ p = tµ p = t
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
w(1 − w) ⎛
n⎞
⎜1 − ⎟ .
n
⎝ N⎠
Предельная ошибка выборки показывает насколько выборочная
средняя (доля) может отличаться от генеральной средней (доли) в большую
или меньшую сторону.[14]
Пределы для среднего арифметического определяются: ~x ± ∆ ~x ; для доли:
p ± ∆w .
4.1.2 Механическая выборка
Механическая выборка состоит в том, что отбор единиц в выборочную
совокупность из генеральной, разбитой по нейтральному признаку на равные
интервалы (группы), производится таким образом, что из каждой такой
группы в выборку отбирается лишь одна единица. Чтобы избежать
систематической ошибки, отбираться должна единица, которая находится в
середине каждой группы.
Другими словами, все единицы генеральной совокупности нумеруются
числами от 1 до N, после чего отбираются каждые (N/n)-е объекты для
выборки, находящиеся на равном расстоянии друг от друга. Величина N/n
называется шагом или интервалом отбора. Например, если для 2000 единиц
требуется создать 10%-ную выборку, соответственно объемом 200 единиц, то
в нее попадет каждый 10-й элемент, отобранный механически через
определенный интервал совокупности (2000/200=10).
Существует два способа формирования основы механической выборки:
по неранжированным (по отношению к изучаемым признакам) данным и по
ранжированной генеральной совокупности.
В первом случае результаты механического отбора, по сути, будут
являться реализацией случайного бесповторного отбора, так как единицы
наблюдения располагаются в случайном порядке. Усилить эту «случайность»
можно, выбрав начальную точку отсчета случайным образом из интервала,
соответствующего первому шагу отбора. В этом случае, например, при 2%ном выборочном обследовании качества продукции отбирают по мере
изготовления каждое 50-е изделие. [12]
Во втором случае единицы генеральной совокупности предварительно
располагаются в определенном порядке (например, по алфавиту,
местоположению, в порядке возрастания или убывания значений какого-либо
показателя), т.е. упорядочиваются (ранжируются) по величине изучаемого
34
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
или коррелирующего с ним признака, после чего отбирают заданное число
единиц механически, через определенный интервал. При этом размер
интервала в генеральной совокупности равен обратному значению доли
выборки. Так, при 2 %-ной выборке отбирается и проверяется каждая 50-я
единица (1:0,02), при 5%-ной выборке – каждая 20-я единица (1:0,05).
Интервал можно определить и как N/n. Из каждой группы с заданным шагом
отбирается только одна единица, и после регистрации значений признака в
генеральную совокупность не возвращается. Подобный подход имеет свое
логическое объяснение: если взять начальную единицу из этого интервала, то
получим заниженную оценку генерального среднего, если последнюю –
завышенную. При этом, чем сильнее коррелируют друг с другом единицы
отбора на интервалах, представляющих последовательные шаги отбора, тем
эффективнее данный вид выборки.
В данном случае механический отбор из ранжированной совокупности
приобретает характер направленного отбора, так как отдельные части
совокупности оказываются представленными в выборке пропорционально их
численности во всей совокупности, т. е. отбор направлен на то, чтобы
сделать выборку представительной. [13]
Механический отбор прост в реализации и широко применяется во
времена массового отсутствия средств вычислительной техники, так как
вручную при большом объеме генеральной совокупности его провести
значительно легче, чем случайный. В теории он считается более
эффективным, чем простая случайная выборка. Действительно, если
генеральную совокупность каким-то образом упорядочить по отношению к
изучаемому признаку, что на практике в случае многомерных наблюдений и
неполноты исходной информации не всегда доступно, то можно значительно
повысить репрезентативность извлеченной выборки. Однако, по мнению
Венецкого И.Г., при использовании этого метода может возникнуть большая
опасность совпадения шага отбора с размером циклической или
периодической компоненты. В этом случае выборка нерепрезентативна. Так,
при наблюдениях городского населения, когда используется 25%-ная
выборка, существует реальная опасность отобрать лишь один тип квартир,
если обследуются жилые дома с четырехквартирными площадками. Тогда
целесообразно использовать принципы аритмичных отборов. Например, если
из первой группы отбирать, допусти, первую по счету единицу, из второй –
вторую и т.д., то можно устранить действие периодичности.[2]
При достаточно большой совокупности механический отбор по
точности результатов близок к собственно-случайному. Поэтому для
определения средней ошибки механической выборки используют формулы
собственно-случайной бесповторной выборки.
Дисперсия среднего значения при механическом отборе определяется
по формуле:
V ( ysy ) =
N − 1 2 k (n − 1) 2
S −
S wsy ,
N
N
где N − объем генеральной совокупности;
35
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
S 2 − истинное значение дисперсии признака;
k − шаг отбора;
n − объем выборочной совокупности;
2
S wsy
− дисперсия единиц, принадлежащих одной и той же механической
(систематической) выборке ( wsy − от английского «within» - внутри и
«systematic» - систематический):
2
S wsy
=
k
n
1
( yij − yi ) 2 ;
∑∑
k (n − 1) i =1 j =1
yij − значение
j = 1, 2, ..., n,
признака
j − го
члена
i − механической
выборки,
i = 1,2,..., k ;
yi − среднее значение признака i − й выборки. [17]
4.1.3 Типический отбор
Типический (стратифицированный, расслоенный, районированный)
способ отбора используется в тех случаях, когда все единицы генеральной
совокупности можно разбить на несколько типических групп. При
обследованиях населения такими группами могут быть, например, районы,
социальные, возрастные или образовательные группы, при обследовании
предприятий – отрасль и подотрасль, форма собственности и т.п. Типический
отбор предполагает выборку единиц из каждой типической группы
собственно-случайным или механическим способом.
Данная выборка дает более точные результаты по сравнению с другими
способами отбора единиц в выборочную совокупность. Поскольку в
выборочную совокупность в той или иной пропорции обязательно попадают
представители всех групп, типизация генеральной совокупности позволяет
исключить влияние межгрупповой дисперсии на среднюю ошибку выборки,
которая в этом случае определяется только внутригрупповой вариацией.
Предположим, что генеральная совокупность объектов разбита на k
групп, тогда:
N1 + N 2 + ... + N k = N
Объем извлекаемых единиц из каждой типической группы зависит от
принятого способа отбора, их общее количество образует необходимый
объем выборки:
n1 + n2 + ... + nk = n
Отбор единиц в типическую выборку может быть организован либо
пропорционально объему типических групп, либо пропорционально
внутригрупповой дифференциации признака.
Расслоение может дать выигрыш в точности при оценивании
характеристик всей совокупности. Часто неоднородную совокупность
удается расслоить на подсовокупности (слои), каждый из которых внутренне
однороден. Если каждый слой однороден в том смысле, что результаты
измерений в нем мало изменяются от единицы к единице, то можно получить
36
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
точную оценку среднего значения для любого слоя по небольшой выборке в
этом слое. Затем эти оценки можно объединить в одну точную оценку для
всей совокупности. В таблице 3 представлены формулы для оценки
параметров. [17]
Таблица 3 – Формулы оценивания при типическом (расслоенном) отборе
Статистические
показатели
Суммарное
значение
признака
Среднее значение
признака
Дисперсия оценки
суммарного
значения
признака
Дисперсия оценки
среднего значения
признака
Стандартная
ошибка
оценки суммарного
значения признака
Стандартная
ошибка
оценки среднего
значения признака
Коэффициент
вариации оценки
Истинное значение
Оценка
L
Y = ∑ Yh
€ =
Y
st
h =1
Y =
€ )=
V(Y
L
h (Nh n h )
h =1
V ( y) =
yst =
S2h
nh
S h2
1 L
(
−
)
N
N
n
∑ h h h n
N 2 h =1
h
L
‡”N
h =1
S ( y) =
h (Nh n h )
h
€ )=
V(Y
st
1 L
∑ N h yh
N h =1
L
‡”N
h (Nh n h )
h =1
V ( yst ) =
s 2h
nh
sh2
1 L
(
−
)
N
N
n
∑ h h h n
N 2 h =1
h
€ ) = NS( y ) =
S(Y
st
st
€ ) = NS( y) =
S(Y
=
h
h =1
1 L
∑ N hYh
N h =1
‡”N
L
‡”N y
S2h
nh
S h2
1 L
∑ N h ( N h − nh ) n
N 2 h =1
h
€)
S( y )
S(Y
KV =
*100%=
*100%
Y
Y
L
=
‡”N
h =1
S ( yst ) =
h (Nh n h )
s 2h
nh
sh2
1 L
∑ N h ( N h − nh ) n
N 2 h =1
h
€ )
s( Y
s( y )
k V = € st *100% = st *100%
yst
Yst
В таблице 3, в которой представлены формулы оценивания при
типическом отборе, использованы следующие обозначения:
L − число слоев;
h − номер слоя;
Yh − суммарное значение признака y в h − м слое генеральной
совокупности;
N h − объем h − го слоя генеральной совокупности;
yh − среднее значение признака y в h − м слое выборки;
N − объем генеральной совокупности;
y в h − м слое генеральной
Yh − среднее значение признака
совокупности;
37
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
nh − объем h − го слоя выборки;
S h2 − истинное значение дисперсии для h − го слоя:
N
h
1
S =
∑ ( yhi − Yh )2 ;
N h − 1 I =1
2
h
i − номер элемента внутри слоя;
yhi − значение признака у i − го элемента слоя h ;
sh2 − несмещенная оценка дисперсии для h − го слоя:
n
1 h
s =
∑ ( yhi − yh )2 .
nh − 1 I =1
2
h
При выборке, пропорциональной объему типических групп, число
единиц, подлежащих отбору из каждой группы, определяется следующим
образом:
ni = n ⋅
Ni
,
N
где N i - объем i-й группы (слоя);
ni - объем выборки из i-й группы.
Средняя ошибка для средней такой выборки находится по формулам:
σ2
µ=
µ=
где σ
2
∑σ n
=
∑n
2
i i
n
- повторный отбор;
σ2 ⎛
n⎞
⋅ ⎜1 − ⎟ - бесповторный отбор,
n ⎝
N⎠
- средняя из внутригрупповых дисперсий.
i
При выборке, пропорциональной дифференциации признака, число
наблюдений по каждой группе рассчитывается по формуле:
ni = n
σ i Ni
∑σ i Ni
где σ i - среднее квадратическое отклонение признака в i-й группе.
Средняя ошибка такой выборки находится по формулам:
µ=
µ=
1
N
∑
1
N
∑
σ i2 N i2
ni
- повторный отбор;
σ i2 N i2 ⎛
ni
n ⎞
⎜⎜1 − i ⎟⎟ - бесповторный отбор.[4]
⎝ Ni ⎠
С методологической точки зрения отбор, пропорциональный
дифференциации (вариации) признака, является наиболее корректным и дает
лучшие результаты. Действительно, ошибка репрезентативности тем больше,
чем
значительнее
неоднородность
генеральной
совокупности.
Следовательно, для выравнивания по стратам (группам) величины ошибки
репрезентативности необходимо увеличить в составе выборочной
совокупности объем тех групп, в которых выше дисперсия. Главное
38
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
преимущество этого способа отбора заключается в том, что использование
переменной доли отбора, прямо пропорциональной вариации признака
внутри типических групп, позволяет уменьшить общий объем выборки при
сохранении заданной точности. Однако, на практике применение данного
метода затруднено вследствие трудности получения сведений о вариации до
проведения выборочного наблюдения.
Средняя ошибка выборки для доли (в случае альтернативного
признака):
µw =
wi (1 − wi )
- повторный отбор;
n
wi (1 − wi ) ⎛
n⎞
⎜1 − ⎟ - бесповторный отбор,
n
⎝ N⎠
∑ wi (1 − wi )ni
µw =
где wi (1 − wi ) =
∑n
- дисперсия доли, исчисляемая как средняя
i
арифметическая взвешенная из внутригрупповых дисперсий.
Типическая выборка в статистической практике применяется гораздо
чаще, чем все остальные способы выборочного наблюдения. Данный вид
отбора обычно применяется при изучении сложных статистических
совокупностей. Например, при выборочном обследовании семейных
бюджетов рабочих и служащих в отдельных отраслях экономики,
производительности
труда
рабочих
предприятия,
представленных
отдельными группами по квалификации.
4.1.4 Серийный отбор
В отличие от типического отбора, когда выделенные группы
систематически различаются между собой, серийный отбор базируется на
том предположении, что количество единиц в группах является случайным,
несистематическим и при изучении основных тенденций и закономерностей
этим отличием можно пренебречь.
Серийная выборка предполагает случайный отбор из генеральной
совокупности не отдельных единиц, а их равновеликих групп (гнезд, серий) с
тем, чтобы в таких группах подвергать наблюдению все без исключения
единицы. Преимущество отбора сериями состоит в том, что достигается
значительная экономия затрат на обследование благодаря более компактному
размещению обследуемых объектов в пространстве. Существенным
достоинством отбора сериями является возможность исследования
взаимосвязей и процессов, действующих в пределах серии. Ценность отбора
значительно снижается из-за резкого увеличения по сравнению с отбором
единицами величины репрезентативности, что приходится компенсировать
увеличением объема выборки.
Данный способ отбора удобен в тех случаях, когда единицы
совокупности объединены в небольшие группы или серии. В качестве таких
39
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
серий могут рассматриваться упаковки с определенным количеством готовой
продукции, партии товара, студенческой группы, бригады и другие
объединения. Сущность серийной выборки заключается в собственнослучайном либо механическом отборе серий, внутри которых производится
сплошное обследование единиц.
В практике центрального статистического органа страны Росстата
серийная выборка нашла довольно широкое применение при обследованиях
сельскохозяйственного производства, в статистике населения, где сериями
(гнездами) часто служат определенные территориальные образования,
извлекаемые на случайной бесповторной или механической основе из всей
совокупности территорий. При этом, если обследуются территориально
близкие серии, то материальные и финансовые затраты, как правило,
сокращаются.
Широкое применение серийного отбора в статистической практике
обусловлено двумя основными причинами.
Первая из них заключается в том, что для обследования может не
существовать основы выборки (списка элементов совокупности), а ее
составление или невозможно, или обошлось бы очень дорого. Например, эта
ситуация имеет место, когда для обследования населения нет полных и
неустаревших его списков. Однако по картам подлежащие обследованию
районы могут быть разделены на территориальные участки с легко
идентифицируемыми границами. Относясь к таким участкам как сериям,
возможно решить задачу построения списка единиц отбора.
Вторая причина состоит в том, что, даже если имеется списочная
основа элементов, экономические соображения могут диктовать выбор более
крупных единиц отбора.
Поскольку внутри групп (серий) обследуются все без исключения
единицы, средняя ошибка серийной выборки (при отборе равновеликих
серий) зависит от величины только межгрупповой (межсерийной) дисперсии.
Среднюю ошибку выборки для средней количественного признака при
серийном отборе определяют по следующим формулам:
µ ~x =
δ x2
- повторный отбор;
r
µ ~x =
δ x2 ⎛
r⎞
⎜1 − ⎟ - бесповторный отбор,
r ⎝ R⎠
где r- число отобранных серий,
R- общее число серий.
(~x − ~x )
∑
=
2
δ
2
x
i
r
- межгрупповая дисперсия серийной выборки,
где ~xi - средняя i-серии;
~
x - общая средняя по всей выборочной совокупности.
Средняя ошибка выборки для доли (альтернативного признака):
µw =
40
δ w2
r
- повторный отбор,
µw =
δ w2 ⎛
r⎞
⎜1 − ⎟ - бесповторный отбор,
r ⎝ R⎠
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
∑ (w − w )
2
δ w2 =
i
r
- межгрупповая дисперсия доли серийной выборки,
где wi - доля признака в i-серии;
w - общая доля признака во всей выборочной совокупности.
Таблица 4 – Формулы оценивания при серийном отборе
Статистичекие
Истинное значение
показатели
Суммарное
M
Y = ∑ Ti
значение
i =1
признака
Среднее
1 M
значение
T =
∑ Ti
признака по
M i =1
сериям
Среднее
Y
Y =
значение
N
признака
Дисперсия
оценки
m 1 1 M
V (Y€) = M 2 (1 − )
суммарного
∑ (Ti − T )2
M m M − 1 i =1
значения
признака
Дисперсия
оценки
1
m 1 1 M
V (Y€) = 2 [ M 2 (1 − )
∑ (Ti − T ) 2 ]
среднего
N
M m M − 1 i =1
значения
признака
Стандартная
ошибка
m 1 1 M
оценки
S (Y€) = M 2 (1 − )
∑ (T − Ti )2
M m M − 1 i =1
суммарного
значения
признака
Стандартная
ошибка
1
m 1 1 M
оценки
S (Y€) =
M 2 (1 − )
(T − Ti ) 2
∑
среднего
N
M m M − 1 i =1
значения
признака
КоэффициS (Y€ )
S (Y€)
ент вариа* 100% =
* 100%
KV =
Y
Y
ции оценки
Оценка
m
€ =M T
Y
m i =1 i
‡”
m
1
T€ =
T
m i =1 i
‡”
€
€= Y
Y
€
N
m 1 1 m
v(Y€) = M 2 (1 − )
∑ (Ti − T€) 2
M m m − 1 i =1
1
m 1 1 m
v(Y€) = 2 [ M 2 (1 − )
∑ (Ti − T€ ) 2 ]
N
M m m − 1 i =1
m 1 1 m
s (Y€) = M 2 (1 − )
∑ (Ti − T€i )2
M m m − 1 i =1
1
S (Y€) =
N
M 2 (1 −
m 1 1 m
)
∑ (Ti − T€i )2
M m m − 1 i =1
s (Y€ )
s (Y€ )
kV =
* 100% =
* 100%
Y€
Y€
41
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В таблице 4, в которой представлены формулы оценивания при
серийном отборе, использованы следующие обозначения:
i − номер серии;
M − количество серий;
Ti − суммарное значение признака в i − й серии;
m − количество выбранных серий;
N − объем генеральной совокупности;
€ оценка объема генеральной совокупности.[17]
N
Основное применение серийного отбора – технологическая статистика
и контроль качества продукции (упаковки готовой продукции, упаковки
товара и т.д.). В практике работы органов государственной статистики
применение серийного отбора может быть оправдано при выборочном
обследовании инвестиций физических лиц в индивидуальное строительство
дачных и садовых домов, где в качестве серий будут рассматриваться
садовые товарищества и дачные кооперативы.
4.1.5 Комбинированный отбор
В практике статистических обследований помимо рассмотренных выше
способов отбора применяется их комбинация.
Комбинированный отбор широко применяется в практической
статистике и представляет собой сочетание разных методов отбора,
например, типического и механического. В этом случае генеральная
совокупность разбивается на типические группы на основе ранее выбранного
группировочного признака, внутри которых единицы наблюдения
упорядочиваются,
устанавливается
шаг
отбора,
соответствующий
необходимой численности выборки, после чего происходит извлечение
единиц наблюдения из типических групп на основе механического отбора.
Подобная комбинация методов обеспечивает представительство в выборке
всех типов единиц наблюдения и сохраняет структуру типических групп по
группировочным признакам, обеспечиваемую механическим отбором.
Так, например, можно комбинировать типическую и серийную
выборки, когда серии отбираются в установленном порядке из нескольких
типических групп. Возможна комбинация серийного и собственнослучайного отборов, при которой отдельные единицы отбираются внутри
серии в собственно-случайном порядке. Ошибка такой выборки определяется
ступенчатостью отбора.
В тех случаях, когда генеральная совокупность достаточно велика и
изначально разбита на равновеликие и многочисленные серии, целесообразно
применять комбинированный отбор. Он предполагает случайный отбор
серий, из которых потом также на основе жеребьевки производится отбор
отдельных единиц наблюдения. В данном случае вид отбор сочетает в себе
серийный отбор с собственно-случайным. В связи с этим формулы средней
ошибки комбинированной выборки включают в себе слагаемые,
42
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
напоминающие соответствующие элементы формул средней ошибки
собственно-случайной и серийной выборок.
Особенности комбинированной выборки заключаются в том, что после
отбора серий на основе обследования входящих в их состав единиц
наблюдения определяются дисперсии изучаемого признака внутри
отобранных серий – серийные дисперсии. Затем для ряда серийных
дисперсий вычисляется средняя дисперсия, а на основе этих результатов
рассчитывается межсерийная дисперсия.
Средние ошибки выборки при комбинированной выборке с
равновеликими сериями приведены в таблице 5.
Таблица 5 – Формулы расчета средних ошибок
комбинированной выборке с равновеликими сериями
Метод отбора
выборки
при
Средняя ошибка
выборочной доли
выборочной средней
σ w2
повторный
бесповторный
выборки
n
σ
2
w
n
(1 −
+
δ w2
σ x2
r
δ
n
r
) + (1 − )
nr
r
R
2
w
n
σ
2
x
n
(1 −
+
δ x2
r
δ2
n
r
) + x (1 − )
nr
r
R
В таблице 5 nr − общее число единиц в отобранных сериях ( nr =
N
);
R
n − выбранное число единиц, подвергающихся обследованию, из отобранных
серий.
Использование комбинации методов предполагает получение выборки
более высокой репрезентативности по сравнению с другими видами.[12]
4.1.6 Многоступенчатый, многофазный отбор
Многоступенчатая выборка получила значительное распространение в
современной практике выборочных обследований, что обусловлено
большими
объемами,
сложной
структурой
и
территориальной
рассредоточенностью генеральной совокупности. В целях сокращения затрат
на проведение работ и удобства обследования выборочная совокупность
формируется в несколько этапов (ступеней). На всех ступенях, кроме
последней отбор производится сериями. На каждой последующей ступени
единицей отбора выступает более мелкая серия, а на последней ступени
единицей отбора может быть единица совокупности либо более мелкая
серия, чем на предыдущей ступени.
В данном случае каждая ступень имеет свою единицу отбора, при этом
проводится непосредственно наблюдение лишь единиц последней ступени.
Точность многоступенчатой выборки, как правило, меньше, чем
одноступенчатой. Это объясняется тем, что дополнительный отбор на каждой
43
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ступени влечет за собой и дополнительные ошибки репрезентативности.
Ошибка многоступенчатой выборки может быть представлена как:
xk − µ = ( xk − xk −1 ) + ... + ( x2 − x1 ) + ( x1 − µ ) .
Она складывается из ошибок отдельных ступеней, поэтому на практике
используется не более 2-3 ступеней.
Воспользуемся следующими обозначениями: при отборе, например, n1
крупных групп из генеральной совокупности средняя ошибка выборки – µ1 ;
при оборе n2 мелких групп из крупных средняя ошибка выборки – µ2 ; при
отборе n3 отдельных единиц совокупности средняя ошибка выборки – µ3
σ x21 − дисперсия признака
x
по совокупности «крупных» единиц;
σ x22 − дисперсия признака x в каждой из отобранных «крупных» единиц.
Средняя ошибка выборки при двухступенчатом отборе рассчитывается
по формуле:
µx =
σ x21
n1
m
σ x22
1
n1n2
+∑
.
Так, при использовании трехступенчатого отбора среднюю ошибку
выборки определяют по формуле:
µобщ = µ12 +
µ22
n1
+
µ32
n1n2
,
где µ1 , µ2, µ3 − средние ошибки выборки, рассчитанные на каждой ступени;
n1, n2 − численность извлекаемых на каждой ступени единиц.
Например, чтобы провести отбор домохозяйств при изучении
потребления населением крупного города, легче произвести сначала отбор
территориальных ячеек, жилых домов, потом квартир или домохозяйств,
зачет респондента. Такая выборка называется многоступенчатой, при
которой из генеральной совокупности сначала извлекаются укрупненные
группы, потом – более мелкие и так до тех пор, пока не будут отобраны те
единицы, которые подвергаются обследованию. На каждой ступени
используются разные единицы отбора: более крупные – на начальных
ступенях, на последней ступени единица отбора совпадает с единицей
наблюдения.
Допустим, выборочная совокупность населения может быть
сформирована в следующей последовательности: первая ступень – отбор
субъектов РФ, (единица отбора – серия – субъект РФ), вторая ступень – в
каждом отобранном субъекте РФ производится отбор муниципальных
образований, т.е. административных районов (единица отбора – серия –
район), третья ступень – в каждом отобранном районе производится отбор
населенных пунктов или микрорайонов в крупных городах (единица отбора –
серия – населенный пункт), четвертая ступень – отбор необходимого числа
жителей в отобранных населенных пунктах (единица отбора соответствует
единице совокупности – человек).
Многофазными являются такие выборки, в результате организации
44
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
которых из исходной выборки составляют определенные подвыборки для
последующих обследований по более расширенной программе.[13]
Многофазная выборка не получила сколько-нибудь значительного
распространения в практике статистических работ, поскольку требует весьма
тонкого методического аппарата, высокого профессионализма разработчиков
и исполнителей и предназначена для особо сложных по своим задачам и
технике исполнения исследовательских проектов. Принцип многофазной
выборки состоит как бы в совмещении нескольких обследований по одной
проблеме. На первой фазе предусматривается большой объем выборки при
краткой программе обследования. На второй фазе из отобранных на первой
фазе единиц проводится «подвыборка» и предусматривается существенное
расширение программы наблюдения, которая обязательно включает вопросы
программы первой фазы. Таким же образом формируются последующие
фазы. При такой методике удается совместить два альтернативных принципа
– детализации программы обследования и экономии затрат на проведение
работ. Компромисс достигается благодаря тому, что детальная информация,
полученная на последних фазах, последовательно распространяется на более
широкую совокупность единиц, обследованных на предшествующих фазах.
В отличие от многоступенчатой многофазная выборка предполагает
сохранение одной и той же единицы отбора на всех этапах его проведения,
при этом отобранные на каждой стадии единицы подвергаются
обследованию (на каждой последующей стадии отбора программа
обследования расширяется). Такая выборка включает определенное
количество фаз, каждая из которых отличается подробностью программы
наблюдения. Например, 25 % всей генеральной совокупности обследуются
по краткой программе, каждая 4-я единица из этой выборки обследуется по
более полной программе и т.д.
Средняя и предельная ошибки многофазной выборки рассчитываются
отдельно на каждой фазе в соответствии с заданными параметрами выборки.
4.2 Квазислучайные выборки
В выборках квазислучайного типа предполагается наличие
вероятностного отбора на том основании, что специалист, рассматривающий
выборку, считает это допустимым (т.е. предполагается, обстоятельства
таковы, что возможно рассматривать выборку как вероятностную).
Примером использования квазислучайной выборки в статистической
практике является «Выборочное обследование малых предприятий по
изучению социальных процессов в малом предпринимательстве»,
проведенное в 1996 г. в некоторых регионах России. Единицы наблюдения
(малые предприятия) отбирались экспертно с учетом представительства
отраслей экономики из уже сформированной выборки обследования
финансово-хозяйственной деятельности малых предприятий (форма № МП
«Сведения об основных показателях финансово-хозяйственной деятельности
малого предприятия»). При обобщении выборочных данных предполагалось,
45
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
что выборочная совокупность сформирована методом простого случайного
отбора.
В случае отбора невероятностным способом также имеются два типа
выборок: сформированных на основе направленного отбора и
сформированных на основе суждения эксперта. Отнесение выборки к тому
или иному типу зависит от того, является ли процедура отбора объективной
или нет.
Прямое использование суждения эксперта является наиболее общим
методом намеренного включения единиц в выборку. Примером такого
способа отбора является монографический метод, предполагающий
получение информации только от одной единицы наблюдения, являющейся
типичной по мнению организатора обследования − эксперта.
По сравнению с вероятностными, выборки, построенные на основе
суждения эксперта, наилучшим образом проявляют себя там, где:
а) выборка мала;
б) исследуемая совокупность весьма невелика и обозрима, или известна
организатору наблюдения;
в) исследуемое свойство элементов общей совокупности существенно
варьирует;
г) специалист, формирующий выборку, является большим и
признанным мастером своего дела.
Выборки, сформированные на основе направленного отбора,
извлекаются с помощью объективной процедуры, но без использования
вероятностного механизма. Существует значительное число разнообразных
способов направленного отбора.
Широко известен метод основного массива, при котором в выборку
включаются наиболее крупные (существенные) единицы наблюдения,
обеспечивающие основной вклад в показатель, например, суммарное
значение признака, представляющего основной интерес обследования.
В заключение можно отметить, что выборки, сформированные на
основе направленного отбора, несколько разочаровывают своими
результатами по сравнению с вероятностными выборками, однако при
работе с малыми выборками имеет смысл рассматривать
виды отбора,
приводящие к формированию таких выборок.
Также в мировой статистической практике существуют факты,
свидетельствующие о том, что при очень небольших объемах выборки на
основе
суждения
могут иметь преимущества перед,
например,
простыми случайными выборками.
Квазислучайные выборки нельзя сравнить с остальными тремя типами
выборок каким-либо простым и удовлетворительным способом. Каждая
квазислучайная выборка может оказаться уникальной. Можно сделать только
единственное обобщение − такими выборками следует пользоваться крайне
осторожно и обоснованно.
46
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4.3 Другие виды выборок
При периодическом повторении выборочных обследований с целью
изучения динамики явлений применяются либо независимые выборки – через
определенные промежутки времени отбор каждый раз производится
независимо от предыдущих выборок; либо фиксированные выборки – в этом
случае повторные обследования проводятся по одной и той же выборке. В
связи с тем, что в фиксированной выборке могут происходить изменения,
практикуют
периодическую
адаптацию
фиксированной
выборки
происходящим изменениям. Чаще для целей изучения динамики
используется промежуточный вариант – ротационная выборка или
частичное замещение, при этом нужно следовать определенному плану
замещения.
Как особый вид выборки, выделяется метод моментных наблюдений,
сущность которого состоит в периодической фиксации состояний
наблюдаемых единиц в отобранные моменты времени. Этот вид выборочного
наблюдения применяется при изучении использования производственного
оборудования, либо рабочего времени.
4.4 Тесты и задачи
4.4.1 Средняя ошибка выборки при случайном бесповторном отборе
определяется по формуле:
а) µ =
б) µ =
в) µ =
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
σ
;
n
δ2
;
r
г) µ = 1 −
σ2
n
.
4.4.2 Необходимый объем выборки при собственно-случайном
бесповторном и механическом отборе определяется по формуле:
а) n =
б) n =
в) n =
t2 ⋅σ 2
;
∆2
t 2σ
∆
2
2
;
Nt 2σ
2
N∆ + t 2σ
2
2
.
4.4.3 Дисперсия доли единиц, обладающих данным признаком в
47
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
выборочной совокупности, определяется по формуле:
а) σ w2 = σ i2 + δ x2 ;
б) σ
2
w
∑ (x − x)
=
i
n
2
в) σ w = w(1 − w) ;
г) σ w 2 =
∑σ n
∑n
2
i i
2
;
.
i
4.4.4 При 2 %-ной механической выборке отбирается и проверяется
каждая:
а) 20-тая единица;
б) 30-тая единица;
в) 40-ая единица;
г) 50-тая единица.
4.4.5 Отбор единиц в выборочную совокупность из генеральной,
разбитой на качественно однородные группы, называется:
а) механическим;
б) собственно-случайным;
в) типическим;
г) серийным.
4.4.6 В порядке бесповторной типической выборки в фермерских
хозяйствах области обследовано 625 га посева озимой пшеницы сорта А и
625 га - сорта Б. В результате обследования установлено, что процент зимней
гибели пшеницы сорта А 10 % и сорта Б – 20 %. Обследованная площадь
составляет 19 % всей площади, засеянной этими сортами пшеницы.
Определите ошибку выборки с вероятностью 0,954.
4.4.7 По данным 2 %-ного выборочного обследования шести
специализированных
и
десяти
неспециализированных
магазинов
2
товарооборот в среднем на 1 м площади торгового зала составил: в
специализированных магазинах - ~х =1500 р. при дисперсии 8200, в
неспециализированных - ~х =1100 руб. при дисперсии 5320. Определите
ошибку выборки для среднего товарооборота на 1 м площади торгового зала
с вероятностью 0,954.
4.4.8 Среди выборочно обследованных 1000 семей региона по уровню
душевого дохода (выборка 2 %-ная, механическая) малообеспеченных
оказалось 300 семей. Требуется с вероятностью 0,997 определить пределы
для доли малообеспеченных семей.
100
48
4.4.9 На машиностроительном предприятии рабочие распределены по
производственным бригадам. Численности рабочих в бригадах
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
одинаковые. Методом бесповторной выборки отобрали 36 бригад. По
данным выборки средний производственный стаж рабочих – семь лет.
Межсерийная дисперсия равна 9. Определите ошибку выборки с
вероятностью 0,954.
4.9.10 Из партии семян, разбитой на 40 равных по величине серий,
методом случайного бесповторного отбора было проверено 8 серий на
всхожесть. В результате обследования установлено, что доля взошедших
семян составляет 75 %. Межсерийная дисперсия равна 900. Определить
необходимую численность выборки, чтобы с вероятностью 0,683 ошибка
выборки не превышала 10 %.
4.9.11 При обследовании дневной загрузки продавцов магазинов
отбирался каждый десятый среди продовольственных магазинов и каждый
пятый среди непродовольственных. Какой способ отбора в данном случае
применялся?
а) серийный;
б) механический;
в) типический.
4.5 Вопросы для самопроверки и повторения
1 Какие способы отбора единиц из генеральной совокупности
применяются при проведении выборочного наблюдения?
2 В чем состоит случайный отбор?
3 Чему равна средняя ошибка выборки в случае использования
собственно случайной выборки?
4 В чем отличие механического отбора от случайного?
5 В каком случае механический отбор дает те же результаты, что и
случайный? Поясните почему.
6 Какой из способов выборочного наблюдения позволяет получить
наиболее репрезентативную выборочную совокупность?
7 Какие преимущества имеет типический отбор по сравнению со
случайным?
8 В чем преимущество типического отбора, проведенного
пропорционально дифференциации признака?
9 В чем заключается серийный отбор? Назовите области применения
серийной выборки.
10 В чем отличие многоступенчатой и многофазной выборки?
11 Назовите области применения многофазной и многоступенчатой
выборок.
12 Приведите пример использования квазислучайной выборки.
13 В каких случаях выборки, построенные на основе суждения
эксперта, проявляют себя наилучшим образом?
49
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5 Методология выборочного наблюдения
5.1 Основные этапы выборочного наблюдения
Выборочное наблюдение проводится в несколько этапов:
1
Обоснование
целесообразности
применения
выборочного
наблюдения исходя из задач статистического исследования, трудовых,
материальных и денежных затрат.
2 Разработка программы выборочного наблюдения и организационного
плана его проведения.
3 Проектирование бланков анкет, создание инструкции по проведению
наблюдения и заполнению статистических формуляров.
4 Решение организационных вопросов наблюдения, в том числе
подготовка квалифицированного персонала.
5 Определение состава единиц генеральной совокупности.
6 Выбор способа отбора единиц из генеральной совокупности и
реализация отбора.
7 Измерение и регистрация значений изучаемых признаков единиц
выборочной совокупности.
8 Решение вопросов, связанных с обработкой неответов, если они
имеются.
9 Расчет обобщающих характеристик выборочной совокупности.
10 Распространение обобщающих выборочных характеристик на
генеральную совокупность с учетом ошибок выборочного наблюдения.
11 Выводы и рекомендации на основе полученных результатов
выборочного наблюдения.
Выделяют три основные задачи, при решении которых используется
выборочный метод:
1 Определение численности выборки n , обеспечивающей заданную
точность результатов (предельную ошибку ∆ ) при заданной достоверности
результата (вероятность Р).
2 Определение возможного предела ошибки репрезентативности,
гарантированного с заданной вероятностью, и сравнение его с величиной
допустимой погрешности.
3 Определение вероятности того, что ошибка выборки не превысит
допустимой погрешности.
Все эти задачи решаются на основе теоремы Чебышева. Решение
перечисленных задач зависит от того, какие величины заданы, а какие нужно
найти.
5.2 Определение необходимого объема выборки
При проектировании выборочного наблюдения возникает вопрос о
необходимой численности выборки. Эта численность может быть определена
на базе допустимой ошибки при выборочном наблюдении исходя из
50
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
вероятности, на основе которой можно гарантировать величину
устанавливаемой ошибки и на базе способа отбора.
Объем выборки рассчитывается на стадии проектирования
выборочного обследования.
Так как ∆ = t ⋅
σ2
t 2σ 2
, то n = 2
∆
n
(1)
Генеральная дисперсия σ 2 , как правило, неизвестна. В этом случае
можно воспользоваться приблизительными значениями. Для приближенной
оценки σ 2 используются следующие способы:
− дисперсия определяется на основе результатов проведения
«пробного» обследования (обычно небольшого объема). По данным
нескольких пробных обследований выбирается наибольшее значение
дисперсии;
− дисперсия принимается из предыдущих исследований;
− по правилу «трех сигм» общий размах вариации R укладывается в 6
сигм, среднее квадратическое отклонение принимается равным σ =
R
. Для
6
большей точности размах делится на 5;
− если хотя бы приблизительно известна средняя величина изучаемого
1
3
признака, то σ ≈ x ;
− при изучении альтернативного признака (изучении доли), если нет
даже приблизительных сведений о доле единиц, обладающих заданным
значением этого признака, принимается максимально возможная величина
дисперсии, равная 0,25.
При расчете n не следует гнаться за большими значениями t и малыми
значениями ∆ , т.к. это приведет к увеличению объема выборки, а
следовательно, к увеличению затрат средств, труда и времени, вовсе не
являющемуся необходимым.
Формула (1) не учитывает бесповторности отбора и дает максимальную
величину выборки, которую можно скорректировать «на бесповторность».
Так как
∆=t
σ2 ⎛
n⎞
⎜1 − ⎟ , то на основе формулы (1) получаем
n ⎝
N⎠
выражение скорректированного объема выборки:
n=
где n0 =
n0
,
n0 + ( N − 1)
N
(2)
t2 ⋅σ 2
.[14]
∆2x
При больших размерах генеральной совокупности скорректированный
объем выборки незначительно отличается от n0 .
При любом виде проектируемой выборки расчет объема выборки
начинают по формуле повторного отбора (1). Если в результате расчета n
доля отбора превысит 5 %, проводят второй вариант расчет по формуле
51
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
бесповторного отбора, либо по формуле (2), либо как
n=
Nt 2σ 2
.
N∆2 + t 2σ 2
Если доля отбора меньше 5 %, к формуле бесповторного отбора не
переходят, т.к. это не скажется существенно на величине n.
Формулы расчета необходимого объема выборки для некоторых
способов формирования выборочной совокупности приведены в таблице 6.
Таблица 6 – Расчет необходимого объема выборки
Вид выборочного
наблюдения
Собственно-случайная
выборка:
а) при определении
среднего размера признака;
Повторный
отбор
Бесповторный
отбор
t 2σ ~х
n=
2
∆ ~х
Nt 2σ ~х
n=
2
2
N∆ ~х + t 2σ ~х
б) при определении доли
признака.
n=
Механическая выборка
а) при определении
среднего размера признака;
б) при определении доли
признака.
Типическая
выборка:
а) при определении
среднего размера признака;
б) при определении доли
признака.
Серийная выборка:
а) при определении
среднего размера признака;
б) при определении доли
признака.
52
2
2
t 2W (1 − W )
2
∆W
n=
t 2 ⋅ W (1 − W ) ⋅ N
2
N∆W + t 2 ⋅ W (1 − W )
Nt 2σ ~х
n=
2
2
N∆ ~х + t 2σ ~х
2
-
t 2σ ~х
n=
2
∆ ~х
n=
Nt 2σ ~х
n=
2
2
N∆ ~х + t 2σ ~х
2
2
t 2 ⋅ W (1 − W )
n=
2
∆W
n=
t 2 ⋅ δ ~2
r= 2x
∆ ~x
t 2 ⋅ Wr (1 − Wr )
r=
∆2W
t 2 ⋅ W (1 − W ) ⋅ N
2
N∆W + t 2 ⋅ W (1 − W )
t 2 ⋅ W (1 − W ) ⋅ N
2
N∆W + t 2 ⋅ W (1 − W )
r=
r=
t 2 ⋅ δ ~x2 ⋅ R
∆2~x ⋅ R + t 2 ⋅ δ ~x2
t 2 ⋅ Wr (1 − Wr ) ⋅ R
∆2W ⋅ R + t 2 ⋅ Wr (1 − Wr )
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Выборка должна быть такой, чтобы выборочные показатели по всем
основным характеристикам были репрезентативны. Поэтому численность
выборки рассчитывают многократно исходя из допустимых ошибок разных
показателей, значения которых в генеральной совокупности известны.
Т.к. репрезентируемые признаки могут иметь разную размерность, то
допустимая погрешность для каждого из них задается в виде относительной
величины ( ∆ : x ). В этом случае вместо дисперсии в формуле (1) берется
квадрат коэффициента вариации.
Вычислив значение n, на основе каждой из характеристик, необходимо
взять максимальное. При резких различиях необходимых объемов выборки
для разных вопросов программы проводится многофазный отбор.
По мнению ряда авторов (Венецкий И.Г., Кокрен У, Деев Г.И.),
многофазный отбор, как правило, довольно сложно организовать, может
быть нарушен принцип случайности отбора. Поэтому для обеспечения
репрезентативности выгоднее затратить больше средств на учет большего
числа единиц совокупности. Многофазный отбор целесообразно применять,
если соотношение между рассчитанными объемами выборки по крайней
мере 1:6.
Поскольку расчет необходимой численности выборки основан не на
точных, а на предположительных данных о колеблемости в совокупности,
следует соблюдать следующие рекомендации: абсолютную величину n
округлять только верх; долю отбора – только вниз, т.е. из предосторожности
планировать несколько больший объем выборки, чем показывают расчеты.
Объем многоступенчатой выборки рекомендуется увеличивать не
менее чем на 10 % от рассчитанной численности, т.к. многоступенчатость
отбора увеличивает ошибку выборки. [2,5,11]
5.3 Определение вероятности того, что ошибка выборки не
превысит допустимой погрешности
Чаще всего делают заключение об удовлетворительности выборки,
сопоставляя пределы ошибок выборочных показателей с величинами
допустимых погрешностей. Может получиться, что предел ошибки,
рассчитанный с заданной вероятностью, окажется выше допустимого
размера погрешности. В этом случае, определяют вероятность того, что
ошибка выборки не превзойдет допускаемую погрешность. Решение этой
задачи заключается в отыскании F (t ) на основе формулы предельной ошибки
выборки: ∆ = t ∗ µ , тогда t =
∆
µ
. По таблице распределения вероятностей
находим значение F (t ) , соответствующее коэффициенту доверия t . Затем
определяется вероятность того, что среднее значение признака меньше, чем
допустимое по формуле: 1 −
1 + F (t )
, то есть рассчитывается так называемая
2
«вероятность риска». Аналогично можно определить вероятность того, что
предельная ошибка доли не превысит допускаемую погрешность доли.
53
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Оценки надежности выборочных показателей позволяют принять
обоснованные решения в отношении генеральной совокупности.[12]
5.4 Информационная несопоставимость статистических данных
при проведении выборочного обследования
Очень часто при анализе статистических данных первоочередной
задачей является задача преодоления несопоставимости данных.
Несопоставимость данных возникает прежде всего в ситуациях, когда
неверно составлена программа выборочного обследования, которая может не
содержать в себе все классы исследуемых признаков. В этом случае
различные объекты исследования могут характеризоваться либо различным
набором признаков, либо вообще иметь пропуски данных. Кроме того,
несопоставимость может возникать из-за проведения обследования в
различные периоды времени (некоторые признаки могут отсутствовать или
появляется новый набор признаков, связанный с какими-либо объективными
обстоятельствами). В этом случае речь идет о хронологической
несопоставимости информации. Проведение выборочного обследования на
различных
территориях
может
привести
к
территориальной
несопоставимости признаков.
В условиях развития и становления рыночных отношений в России
несопоставимость информации может возникать также в связи с тем, что
малые и частные предприятия очень быстро возникают и также быстро
прекращают свое существование, что отражается как на структуре
выборочных данных, так и на их количестве. Кроме того, при обследовании
коммерческих фирм и финансовых корпораций существует понятие –
коммерческая тайна. Наличие этого факта также приводит к тому, что
выборка может изменить свою структуру и объем. Следовательно, можно
сделать вывод, что информационная несопоставимость возникает вследствие:
отсутствия ряда данных в результатах выборочного обследования, различий
в наборе признаков выборочного обследования, проведенного по одной и той
же программе, которая либо в различных регионах, либо в различные
периоды времени частично была изменена вследствие наличия явно
выделяющихся объектов наблюдения.
Надо сказать, что практически во всех статистических исследованиях
имеются ситуации, когда не удается собрать полную информацию обо всех
отобранных в выборочную совокупность единицах. «Например, при
обследованиях малых предприятий органами государственной статистики
получают по некоторым показателям до 40 % неответов, при обследованиях
домашних хозяйств — от 7 до 30 %. Проблема недополучения информации
при проведении выборочного наблюдения (как, впрочем, и сплошного)
существует практически во всех статистических исследованиях и за
рубежом. Эта проблема входит в разряд самых актуальных, ею занимаются
виднейшие ученые и практики мировой статистики.» [Басова В.А.]
К сожалению, анализ неполных данных малоэффективен, приводит к
54
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
различию статистических выводов, сделанных при наличии неответов
(пропусков информации) и при их отсутствии, за исключением очень редко
встречающихся ситуаций, когда структура неполной выборки вполне
соответствует структуре генеральной совокупности. Таким образом, одной из
главных задач при проведении любого статистического наблюдения является
предупреждение получения неответов.
Статистики-практики называют очень много причин возникновения
неполных данных, например, на вопросы о размере дохода, как правило,
отвечают очень неохотно или вообще не отвечают; при обследованиях,
связанных с многократными опросами, отобранная единица часто
прекращает давать ответы уже после первых этапов опроса. Каждому
наблюдению присущи свои нюансы и специфические стороны, приводящие к
пропускам информации (например, среди причин недополучения
информации при обследованиях малых предприятий — временная
приостановка их деятельности, реорганизация и присоединение к головному
предприятию, изменение фактических адреса и телефона, в связи с чем
предприятие просто невозможно найти и т.д.).
Различают два типа неответов: полный и частичный. Полный неответ
представляет собой ситуацию, когда респондент не ответил ни на один
вопрос анкеты, частичный предполагает получение ответа лишь на
некоторые пункты используемой анкеты. В связи с этим применяют тот или
иной метод восстановления данных:
• метод перевзвешивания (при полных неответах);
• методы замещения недостающих величин:
а) логический метод (при частичных неответах);
б) заполнение средними значениями (при полных и частичных
неответах);
в) метод случайного подбора донора для замещения (при полных
неответах);
г) последовательное замещение (при частичных неответах);
д) прогнозирование с помощью регрессионной модели (для частичных
неответов);
е) замена единиц наблюдения.
Метод перевзвешивания данных применяется, прежде всего, для
полных неответов, когда не удалось получить информацию по всем
исследуемым у объекта признакам.
Основная идея метода — увеличить вес ответивших единиц, который
учитывается при распространении данных выборочного наблюдения на
генеральную совокупность, т.е. если при типической выборке (а она чаще
всего используется на практике) из j-й группы с N j единицами в генеральной
совокупности извлекают n j объектов с вероятностью pj то каждый
извлеченный объект представляет N j / n j объектов совокупности и ему
присваивается вес ( p j ) −1 при распространении результатов на генеральную
совокупность. При наличии пропусков информации этот вес увеличивается,
55
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
и каждая ответившая единица представляет в j-й типической группе
N j / (n j − m j ) единиц
генеральной совокупности (где
m j − количество
полученных неответов в j-й группе).
Например, пусть j-я группа содержит в генеральной совокупности
N j = 100 единиц. В результате 10 %-ного отбора из нее извлекают n j = 10
единиц. Тогда каждая отобранная единица должна представлять 10 единиц
( N j / n j = 100 / 10). Если не ответили четыре единицы, то при распространении
выборочных данных вес ответивших единиц увеличивается, и они
представляют
уже
приблизительно
17
единиц
(
Nj
nj − mj
=
100
)
10 − 4
j-той
типической группы генеральной совокупности. [13]
Методы замещения представляют собой заполнение пропущенных
значений у каждого некомплектного наблюдения (т.е. наблюдения,
содержащего пропуски хотя бы в одной из переменных) в отличие от
методов перевзвешивания, когда происходит увеличение весов по каждой
переменной. Таким образом, основная идея методов этой группы - заменять
отсутствующие данные «допустимыми» значениями.
Логический метод заключается в том, чтобы найти ответ внутри самой
анкеты. Ярким примером может служить ситуация, когда опрашиваемому 15
лет и он не дал ответ на вопрос о семейном положении. В таком случае
можно заключить: «Не женат». Следовательно, данный метод использует
всевозможные логические взаимосвязи показателей и часто применяется в
процессе редактирования данных.
Заполнение средними значениями — самый простой вид заполнения.
Оценку отсутствующих значений получают исходя из средних, вычисленных
по присутствующим значениям переменной. При этом, если в совокупности
известны наряду с общим средним по присутствующим объектам их
групповые средние, то заполнение предпочтительнее проводить по
последним, что позволяет несколько снизить смещенность конечных
выводов об общей совокупности объектов.
Метод заполнения средними значениями реализуется просто, но он
обладает некоторыми нежелательными свойствами. Во-первых, правильные
оценки дисперсий нельзя получить с помощью обычных формул для
дисперсии, примененных к заполненным данным. Реально объем выборки
занижен из-за отсутствия ответов, поэтому обычные формулы приводят к
заниженной оценке истинной дисперсии в результате заполнения пропусков
значением в центре распределения. Во-вторых, подстановка средних
искажает эмпирическое распределение значений, что важно при
исследовании данных по гистограммам или другим графикам. Аналогичная
проблема возникает при группировке таких данных.
Метод случайного подбора донора для замещения базируется на том,
что в качестве недостающих данных берут соответствующие значения
отобранной случайным образом ответившей единицы. Отбор может
проводиться как из всей совокупности присутствующих объектов, так и из
56
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
соответствующих типических групп, что является более предпочтительным.
При этом используется как повторная, так и бесповторная схема отбора.
При последовательном замещении недостающие данные заполняются
значениями по предыдущей ответившей единице, для чего все наблюдения
ранжируются. В этих условиях становится особо важным выбор
группировочного признака. Кроме того, возникает проблема, если
заполнения требует первая единица наблюдения в составленном списке
объектов.
Прогнозирование с помощью модели регрессии заключается в
заполнении
пропусков
значениями,
определяемыми
регрессией
пропущенных для данного объекта переменных на присутствующие, которая
вычисляется обычно по полностью заполненным объектам.
Замена – метод обработки пропусков на этапе сбора данных при
обследовании. Он состоит в замене объекта с отсутствием ответа на другой
объект, не включенный в выборку. Например, если предприятие не ответило
на вопросы анкеты, то можно обследовать другое предприятие,
первоначально не попавшее в выборочную основу. Однако было бы
неверным рассматривать получаемую таким образом выборку как полную,
поскольку ответы тех, кто отвечает на вопросы анкеты, могут
систематически отличаться от тех, кого не удается опросить. Поэтому при
анализе это следует учитывать.
Аналогичным образом поступают и при наличии явно выделяющихся
наблюдений. Если несопоставимость возникает вследствие несоответствия
набора признаков в одной и той же программе выборочного обследования,
то, прежде всего, необходимо проанализировать основные классы признаков,
по которым проводились обследования. Если основные классы признаков в
программах обследования совпадают, а различия наблюдаются только за счет
различного количества признаков или за счет их смысловой интерпретации
внутри каждого класса, то вопрос ликвидации информационной
несопоставимости решается при помощи многомерных статистических
методов (метод главных компонент). Метод главных компонент (МГК)
позволяет выявить внутренние факторы, объясняющие все признаки, которые
используются для описания исследуемого объекта. Кроме того, наличие этих
факторов описывает различные объекты одним и тем же набором признаков
и количество этих признаков может быть существенно меньше, чем
количество признаков, включенных в первоначальные программы
обследования. Однако, необходимо заметить, что прежде, чем использовать
МГК, необходимо провести предварительный анализ исследуемых признаков
с целью отсеивания несущественных параметров. В противном случае
использование этого метода может привести к фальсификации данных
выборочного обследования.
57
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5.5
Методы
распространения
результатов
обследования на генеральную совокупность
выборочного
Заключительным
этапом
выборочного
наблюдения
является
распространение его результатов на генеральную совокупность, т.е.
характеристика генеральной совокупности на основе данных, полученных по
выборке. При этом исходят из того, что все средние и относительные
показатели, полученные по выборке, являются несмещенными и
эффективными характеристиками генеральной совокупности. Однако часто
при статистическом изучении социально-экономических явлений этому
процессу предшествует оценка результатов наблюдения с точки зрения
самой возможности распространения.
Вывод о возможности распространения в значительной степени зависит от качества основы выборки, прежде всего от ее полноты. Неполнота основы может привести к нарушению представительности выборки и, как следствие, к неправильным выводам при анализе данных наблюдения.
Однако не следует обосновывать возможность распространения выборочных данных только анализом качества исходной информации для отбора.
Более точной основой суждения о возможности распространения представляет расчет относительной ошибки:
∆ ~х
⋅ 100 % ;
Х
∆
∆ % = W ⋅ 100 % ,
p
для средней: ∆ % =
для доли:
где X - генеральная средняя,
p - генеральная доля.
Если величина относительной ошибки не превышает заранее установленного для данного обследования предельного значения, то данные
выборочного наблюдения являются представительными и могут быть
распространены на генеральную совокупность. В противном случае следует
попытаться восстановить исходные пропорции генеральной совокупности.
Процесс восстановления пропорций выборки на основе исходной
информации о таких пропорциях в генеральной совокупности принято
называть корректировкой выборки.
Собранные в результате выборочного наблюдения и при
необходимости
откорректированные данные распространяются на
генеральную
совокупность.
Существуют
два
основных
метода
распространения – прямой пересчет и способ коэффициентов.
Сущность способа прямого пересчета заключается в умножении среднего значения признака, найденного в результате выборочного наблюдения,
на объем генеральной совокупности. Практические расчеты при этом не
вызывают серьезных затруднений. Например, на основании выборочного
наблюдения 1000 молодых семей требуется оценить потребность в местах в
детских яслях. С помощью метода прямого пересчета это можно сделать
следующим образом. Известно, что ясли могут посещать дети в возрасте до 3
58
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
лет. По материалам выборочного обследования следует вычислить среднее
число детей этого возраста. Предположим, что оно составляет 1,3 человека.
Умножив это число на численность генеральной совокупности, получим, что
в детских яслях потребуется выделить 1300 мест.[4]
В условиях существования большого числа факторов, влияющих на
точность данных выборочного наблюдения, использование точечной оценки
при распространении выборочных характеристик на генеральную
совокупность в социальных исследованиях нецелесообразно. Во всех
случаях, когда это возможно, правильнее пользоваться интервальной
оценкой, позволяющей учесть размер предельной ошибки выборки,
рассчитанной для средней или доли признака.
Способ коэффициентов целесообразно применять в тех случаях, когда
выборочное наблюдение проводится с целью проверки и уточнения данных
сплошного наблюдения, в частности численности учтенных единиц
совокупности.
При этом используется следующая формула:
Y1 = Y0
y1
,
y0
где Y1 – численность совокупности с поправкой на недоучет;
Y0 – численность совокупности без этой поправки;
у0 – численность совокупности в контрольных точках по первоначальным данным;
у1 – численность совокупности в тех же точках по данным контрольных
мероприятий.
Цели исследования многих явлений могут быть достигнуты только путем сплошного наблюдения. Поэтому способ проверки результатов сплошного наблюдения на основе коэффициентов успешно применяется в социальной и экономической статистике.
При уточнении данных сплошного наблюдения на основе контрольных
выборочных мероприятий определяется поправка на недоучет. Метод ее
расчета наиболее широко применяется в обследованиях относительно небольших совокупностей, когда их объем не превышает несколько сотен или
тысяч единиц.
Применение метода коэффициентов связано с использованием
выборочного наблюдения с целью проверки данных сплошного наблюдения.
Однако это приводит к сознательному ограничению области применения
данного метода. Метод коэффициентов можно использовать для проверки
данных выборочного наблюдения, когда необходима очень высокая точность
результатов и выборочная совокупность имеет большой объем – порядка
нескольких тысяч или десятков тысяч единиц. В таких случаях списки
единиц обследованной выборочной совокупности служат основой для отбора
единиц в «контрольную» выборку, т.е. производится выборка из выборки.
Способ поправочных коэффициентов целесообразно использовать для
распространения данных выборочного наблюдения в случаях, если его
результаты значительно уступают в точности данным статистической
59
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
отчетности или точность собранного статистического материала вызывает
сомнение.
5.6 Малая выборка
В процессе оценки степени представительности данных выборочного
наблюдения важное значение приобретает вопрос об объеме выборочной
совокупности n. От него зависит не только величина пределов, которые с
данной вероятностью не превзойдет ошибка выборки, но и способы
определения этих пределов.
Необходимый объем выборки определяется исходя из заданной
исследователем величины выборочной ошибки, доверительной вероятности
и способа отбора. Однако в некоторых случаях извлечение требуемого числа
единиц невозможно (например, при проверке качества продукции, которое
влечет за собой ее уничтожение) или нецелесообразно из-за больших
финансовых и трудовых затрат.
При большом числе единиц выборочной совокупности (n>100)
распределение случайных ошибок выборочной средней в соответствии с
теоремой А.М. Ляпунова нормально или приближается к нормальному по
мере увеличения числа наблюдений. Вероятность выхода ошибки за
определенные пределы оценивается на основе таблиц интеграла Лапласа.
Расчет ошибки выборки базируется на величине генеральной дисперсии σ ген 2
так как при больших n коэффициент
n
, на который для получения
n −1
генеральной умножается выборочная дисперсия, большой роли не играет.
В практике статистического исследования в условиях рыночной
экономики все чаще приходится сталкиваться с небольшими по объему так
называемыми малыми выборками. Под малой выборкой, по словам
Гаспарова Д.В., понимается такое выборочное наблюдение, численность
единиц которого не превышает 30. В настоящее время малая выборка
используется более широко, чем раньше, прежде всего за счет
статистического изучения деятельности малых и средних предприятий,
коммерческих банков, фермерских хозяйств и т.д. Их количество в
определенных случаях, особенно при региональных исследованиях, а также
величина характеризующих их показателей (например, численность занятых)
часто незначительны. Поэтому хотя общий принцип выборочного
обследования (с увеличением объема выборки повышается точность
выборочных данных) остается в силе, иногда приходится ограничиваться
малым числом наблюдений. Наряду со статистическим изучением рыночных
структур эта необходимость возникает при выборочной проверке качества
продукции, в научно-исследовательской работе и в ряде других случаев.[3]
Разработка теории малой выборки была начата английским
статистиком В.С. Госсетом (печатавшимся под псевдонимом Стьюдент) в
1908 году. Он доказал, что оценка расхождения между средней малой
выборки и генеральной средней имеет особый закон распределения.
60
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При оценке результатов малой выборки величина генеральной
дисперсии в расчетах не используется. Для определения возможных пределов
σ ошибки пользуются так называемым критерием Стьюдента:
~
x−x
t=
где
µ МВ =
σ
n −1
−
µ МВ
,
мера случайных колебаний выборочной средней в малой
выборке.
Величина σ вычисляется на основе данных выборочного наблюдения и
равна:
∑ (x − ~x )
2
σ =
i
n
.
Данная величина используется лишь для исследуемой совокупности, а
не в качестве приближенной оценки σ в генеральной совокупности. При
небольшой численности выборки распределение Стьюдента отличается от
нормального: большие величины критерия имеют здесь большую
вероятность, чем при нормальном распределении.[3]
Предельная ошибка малой выборки определяется по формуле:
∆ МВ = t ⋅ µ МВ .
Но в данном случае величина t иначе связана с вероятной оценкой, чем
при большой выборке. Согласно распределению Стьюдента, вероятная
оценка зависит как от величины t, так и от объема выборки в случае, если
предельная ошибка не превысит t-кратную среднюю ошибку в малых
выборках.
Расчет ошибок в малой выборке мало отличается от аналогичных
вычислений в большой выборке. Различие заключается в том, что при малой
выборке вероятность несколько меньше, чем при большой выборке. Однако
это не означает, что можно использовать малую выборку тогда, когда нужна
большая выборка. Во многих случаях расхождения между найденными
пределами могут достигать значительных размеров, что вряд ли
удовлетворяет исследователей. Поэтому малую выборку следует применять в
статистическом исследовании социально-экономических явлений с большой
осторожностью, при соответствующем теоретическом и практическом
обосновании.
Выводы по результатам малой выборки имеют практическое значение
лишь при условии, что распределение признака в генеральной совокупности
является нормальным или асимптотически нормальным. Необходимо также
принимать во внимание и то, что точность результатов выборки малого
объема все же ниже, чем при большой выборке.
61
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5.7 Общие понятия и схема статистической проверки гипотез
Результаты выборочных наблюдений широко используются в
статистике для проверки предположений, выдвигаемых в отношении
характера или параметров распределения случайной величины в генеральной
совокупности. Такие предположения, которые планируется проверить с
помощью
специальных
статистических
методов,
называются
статистическими гипотезами.
Поверка статистической гипотезы заключается в том, чтобы оценить,
можно ли считать случайным расхождение между выдвинутой гипотезой и
результатами выборочного обследования. Такая оценка всегда носит
вероятностный характер. Если расхождения между эмпирическими и
теоретическими значениями не выходит за пределы случайной ошибки, то
можно считать, что с заданной вероятностью выдвинутая гипотеза не
опровергается. При этом справедливость самой гипотезы не доказывается, а
лишь делается вывод о том, можно ли ее считать допустимой или
необходимо отвергнуть.
Проверяемая гипотеза называется основной и обозначается через
H 0 : x ≤ x0 . Суть проверки – убедиться в отсутствии систематической ошибки
между исследуемым параметром генеральной совокупности и заданным его
значением, т.е. проверяется гипотеза о нулевом расхождении между ними,
поэтому основную гипотезу называют также нулевой.
Гипотеза, альтернативная основной, обозначается через H 1 : x > x0 .
Выдвигаемые гипотезы могут быть простыми и сложными. Простая
гипотеза однозначно характеризует оцениваемый параметр генеральной
совокупности. Сложная гипотеза определяет область возможных значений
исследуемого параметра.
Поскольку при проверке гипотезы используются данные выборочного
наблюдения, вывод о ее допустимости носит вероятностный характер, т.е. не
исключена возможность ошибки. При этом могут возникать следующие
ошибки:
• ошибка первого рода – проверяемая гипотеза является в
действительности верной, но результаты проверки приводят к отказу от
нее;
• ошибка второго рода – проверяемая гипотеза в действительности
является ошибочной, но результаты проверки приводят к ее принятию.
Для того чтобы сделать вывод о соответствии результатов выборочного
наблюдения выдвинутой гипотезе, необходимо принять определенный
критерий, т.е. правила, в соответствии с которыми устанавливается, при каких
результатах выборочного обследования основная гипотеза не может быть
отклонена, а при каких от нее необходимо отказаться. Например, при проверке
гипотезы о среднем значении признака в генеральной совокупности
H 0 : x = a в качестве критерия ( θ ) можно использовать среднее значение
признака в выборке ~x , отклонение выборочной средней от a (т.е. ~x − a ), а
62
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
также нормированное отклонение t =
~
x −a
µ
.
Из множества значений статистического критерия необходимо
выделить такое их подмножество, при попадании в которое выборочной
характеристики основная гипотеза должна быть отклонена. Это
подмножество
называется
критической
областью.
Ее
границы
устанавливаются таким образом, чтобы вероятность попадания в нее
значений выборочной характеристики при условии справедливости
выдвинутой гипотезы была величиной достаточно малой. Напомним, что
указанная вероятность называется уровнем значимости критерия и
обозначается через α . Если значение критерия попадает в критическую
область при верной нулевой гипотезе, то эта гипотеза должна быть
отвергнута, т.е. будет допущена ошибка первого рода, вероятность которой
равна α . Уменьшая уровень значимости, мы снижаем вероятность
появления ошибки первого рода. Однако если основная гипотеза неверна,
то, уменьшая α , мы увеличиваем область допустимых значений и,
соответственно, вероятность появления ошибки второго рода. Устанавливая
уровень значимости, необходимо стремиться к минимизации возможных
потерь, связанных с возникновением этих ошибок. Обычно уровень
значимости принимается равным 0,05; 0,01; 0,005; 0,001. Если нулевая
гипотеза верна, то вероятность ее принятия равна (1 − α ).
Точка, разделяющая критическую область и область принятия нулевой
гипотезы, называется критической.
Обозначив вероятность ошибки второго рода через β , можно
определить вероятность того, что при использовании для оценки гипотезы
определенного критерия неверная гипотеза не будет принята. Эта
вероятность определяет мощность критерия, и она равна (1 − β ).
Стремление увеличить мощность критерия при неизменном объеме
выборки приводит к расширению критической области, т.е. повышает
вероятность ошибки первого рода. Снизить вероятность их появления можно,
лишь увеличив объем выборки, что практически не всегда возможно.
При заданном уровне значимости критическая область может быть
определена как односторонняя или двусторонняя в зависимости от
сформированной альтернативной гипотезы.
Предположим, что проверке подлежит гипотеза о среднем значении
признака в генеральной совокупности H 0 : x = a , а в качестве критерия θ
принята выборочная средняя.
Альтернативная гипотеза может быть представлена следующим
образом: H1 : x < a, H1 : x > a , или H1 : x ≠ a .
1 H1 : x < a . В таком случае критическая область является
левосторонней (рисунок 1).
63
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Критическая область
θ1
a
(критическая точка)
Рисунок 1 – Левосторонняя критическая область
При достаточно большом объеме выборки распределение возможных
значений выборочной средней приближается к нормальному распределению.
При случайном расхождении между выборочной и генеральной средней они
должны быть сгруппированы около величины x = a . Если же среднее
значение признака, полученное на основе выборки, значительно меньше,
чем а, то выдвинутая гипотеза должна быть отклонена.
2 H1 : x > a . Критическая область при такой альтернативной гипотезе
является правосторонней (рисунок 2).
Критическая
область
(критическая точка)
Рисунок 2 – Правосторонняя критическая область
При α = 0,05 вероятность P( ~x > a + tµ ) = 0,05, т.е.
t
t2
−
1
1
P( ~
x > a + tµ ) = −
e 2 dt = 0,05.
∫
2
2π 0
t
t2
−
1
Из этого следует, что
e 2 dt = 0,45 .
∫
2π 0
3 H1 : x ≠ a . При такой формулировке альтернативной гипотезы
строится двусторонняя критическая область, вероятность попадания в
которую при α = 0,05 равна сумме двух вероятностей:
P( ~
x < θ1 ) + P ( ~
x > θ 2 ) = 0,05 .
Для того чтобы на основе одного уравнения найти две неизвестные
критические точки, вероятности попадания в правую и левую ветви
критической области принимаются равными (рисунок 3), т.е.
0,05
P( ~
x < θ1 ) = P( ~
x > θ2 ) =
= 0,025.
2
64
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Следовательно, критические точки θ1 и θ 2 должны располагаться на
равном расстоянии от величины а, т.е. θ1 = a − tµ , θ 2 = a + tµ. . В таком случае
для нахождения t-статистики можно использовать значение интеграла
вероятностей Лапласа в пределах от − t до +t:
1
P( ~
x − a > tµ ) = 1 −
2π
Следовательно,
1
2π
+t
∫e
t2
−
2
+t
∫e
−
t2
2
dt = 0,05.
−t
dt = 0,95 .[13]
−t
Полученные значения t при α = 0,05 справедливы лишь в том случае,
если объем выборочной совокупности достаточно велик. Если же выборка
малая, то для нахождения t-статистики при заданном уровне значимости α
необходимо использовать распределение Стьюдента.
Критическая
область
Критическая
область
θ1
(критическая точка)
a
θ2
(критическая
θ
точка)
Рисунок 3 – Двусторонняя критическая область
Общий порядок проверки статистических гипотез таков:
• формулируется основная (проверяемая) и альтернативная гипотезы;
• выбирается статистический критерий для проверки справедливости
гипотезы;
• определяются критическая область и область допустимых значений,
значения критерия в критических точках;
• проводится выборочное обследование, по результатам которого
рассчитывается фактическое значение выбранного критерия;
• на основе сравнения фактического и критического значений
критерия делается вывод о правдоподобности или необходимости
отклонения выдвинутой гипотезы.
В зависимости от вида проверяемых гипотез (о среднем значении,
законе распределения, взаимосвязи признаков и т.д.) выбираются разные
критерии (t-статистика (или коэффициент доверия), t-статистика Стьюдента,
χ 2 - критерий Пирсона; F-критерий Фишера и др.), которые подразделяются
на параметрические и непараметрические. Для проведения оценки с
использованием параметрических критериев необходимо знать закон
распределения генеральной совокупности. Непараметрические критерии
могут применяться при любом законе распределения, но при этом сохраняется главное условие — независимость испытаний при формировании
65
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
выборочной совокупности, на основе которой проверяется выдвинутая
гипотеза.
5.8 Проверка гипотез о средней и о доле
5.8.1 Гипотезы о средней
В статистической практике наиболее часто проверяются два вида
гипотез о средних величинах:
• гипотеза о равенстве средней величины установленному нормативу;
• гипотеза о равенстве средних значений признака двух
совокупностей.
При проверке гипотезы о равенстве среднего значения признака в
генеральной совокупности некоторой величине H 0 : x = a , в качестве
критерия целесообразно использовать нормированное отклонение
выборочной средней от заданной величины:
t=
~
x −a
µ
,
где µ − средняя квадратическая ошибка выборочной средней, т.е. средняя
ошибка выборки.
При большом объеме выборки ( n ≥ 30 ) средняя ошибка выборки µ
рассчитывается по формуле µ =
σ2
n
, а при n < 30 − по формуле µ =
σ2
n −1
.
Если полученное по результатам обследования фактическое значение tстатистики меньше табличного, т.е. tфакт < t , то гипотеза не отклоняется. В
противном случае нулевую гипотезу следует отклонить.
Пример – При оценке влияния изменений в налоговой политике на
платежеспособность предприятий одного из регионов установлено, что до
указанных изменений средний коэффициент покрытия по этим предприятиям
соответствовал нормативу, равному 2. После внесения изменений в
действующую налоговую систему было проведено выборочное обследование
49 предприятий региона, в результате которого установлено, что средний
коэффициент покрытия на них составил 1,7 при среднем квадратическом
отклонении 0,6.[14]
Выдвигаемая нулевая гипотеза состоит в том, что изменения в
проводимой налоговой политике существенно не повлияли на
платежеспособность предприятий региона, т.е. коэффициент покрытия
остался на прежнем уровне: H 0 : x = 2. В качестве альтернативной может быть
рассмотрена гипотеза о том, что указанные изменения повлияли на степень
платежеспособности предприятий H1 : x ≠ 2.
Для проверки выдвинутой гипотезы примем уровень значимости
α = 0,05. Так как вероятность P ( ~x − 2 ≥ tµ ) = 0,05 , а n > 30 , то для значения
66
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1
2π
интеграла вероятностей Лапласа
+t
∫e
−
t2
2
dt = 0,95 находим табличное
−t
значение t-статистики: t = 1,96.
Фактическое значение t-статистики равно:
tфакт =
~
x −a
µ
=
~
x −a
σ2
=
1,7 − 2
n
0,36
49
= 3,5.
Так как tфакт > t , то выдвинутая гипотеза отклоняется, т.е. изменения в
налоговой системе повлияли на платежеспособность предприятий региона.
Для того чтобы сделать более определенный вывод о характере этих
изменений, альтернативную гипотезу сформулируем следующим образом:
изменения в налоговой системе привели к снижению платежеспособности
предприятий региона, т.е. H1 : x < 2.
Зададим для этого случая уровень значимости α = 0,01. вероятность
P( x < 2 − tµ ) = 0,01 , следовательно, значение интеграла вероятностей Лапласа в
пределах от − t до 0 равно
1
2π
0
∫e
−t
−
t2
2
1
dt = − 0,01 = 0,49 , а в пределах от − t до
2
+ t соответственно 0,98. По таблице распределения Лапласа находим для
заданной вероятности значение t-статистики: t = 2,33. Так как tфакт > t , то
нулевая гипотеза должна быть отклонена, т.е. с вероятностью 0,99 можно
считать, что изменения в налоговой системе привели к снижению
платежеспособности предприятий региона.
Если для проверки выдвинутой гипотезы используется малая выборка,
то значение t-статистики определяется с помощью распределения Стьюдента.
При этом степень обоснованности вывода зависит от того, насколько
распределение генеральной совокупности соответствует нормальному
закону.
Гипотеза о равенстве средних значений признака двух совокупностей
выдвигается часто для того, чтобы проверить влияние какого-либо фактора на
среднюю. Обозначим среднее значение признака в этих совокупностях
через x1 и x2 , а дисперсии в генеральных совокупностях — соответственно
σ r21 и σ r22 . В таком случае нулевая гипотеза может быть представлена
следующим образом: H 0 : x1 = x2 . Для ее проверки проводится выборочное обследование, при котором объем выборки из первой совокупности
составляет n1 а из второй − n2 . Обозначим соответствующие значения
средних в этих выборках через ~x1 и ~x2 , а дисперсии − σ 12 и σ 22 . В качестве
критерия при проверке этой гипотезы принимается t-статистика, фактическое
значение
которой
по
результатам
выборочного
обследования
рассчитывается по формуле:
67
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
~
x1 − ~
x2
tфакт =
µ ~x − ~x
1
где µ ~x − ~x =
1
2
σ r21
n1
+
σ r22
n2
,
2
− стандартная ошибка разности выборочных средних.
Предположим, что дисперсии в двух совокупностях равны, т.е.
σ = σ r22 = σ r2 . Следовательно,
2
r1
σ r2 (n1 + n2 )
µ ~x − ~x =
1
n1n2
2
.
Если дисперсии в выборочных совокупностях известны, то они могут
быть использованы для оценки общей дисперсии. Расчет проводится по
формуле средней арифметической взвешенной, где в качестве весов
выступает число степеней свободы в каждой выборке (ν = п − 1):
σ =
2
r
Так как σ
2
1
∑ (x
=
i1
σ 12 (n1 − 1) + σ 22 (n2 − 1)
(n1 − 1) + (n2 − 1)
−~
x1 )
2
, а σ
n1 − 1
σ
2
r
∑ (x
=
i1
2
2
∑ (x
=
i2
=
σ 12 (n1 − 1) + σ 22 (n2 − 1)
n1 + n2 − 2
−~
x2 )
n2 − 1
2
, то
2
2
−~
x1 ) + ∑ ( xi 2 − ~
x2 )
n1 + n2 − 2
.
n1σ 12 + n2σ 22
=
.
n1 + n2 − 2
В результате, подставив полученное выражение в формулу для tфакт ,
получим:
tфакт =
~
x1 − ~
x2 n1 + n2 − 2 n1n2
n1σ 12 + n2σ 22 n1 + n2
.
Сравнивая фактическое значение t-статистики, рассчитанное по
последней формуле, с табличным при заданном уровне значимости, можно
сделать вывод о необходимости согласиться с выдвинутой гипотезой или
отклонить ее.
5.8.2 Гипотезы о доле
Аналогичные два вида гипотез могут быть проверены и для доли:
• гипотеза о равенстве доли единиц, обладающих определенным
признаком, нормативу;
• сравнение долей единиц, обладающих определенным признаком, в
двух совокупностях.
Порядок проверки гипотез первого вида аналогичен порядку,
приведенному для средней, т.е. проверяется гипотеза H 0 : р = a , где р - доля
68
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
единиц, обладающих изучаемым признаком в генеральной совокупности, а−
норматив. Альтернативными могут быть гипотезы трех видов:
1) H1 : р ≠ a ;
2) H1 : р > a ;
3) H1 : р < a .
В качестве критерия также может быть принято значение t-статистики.
Фактическое значение величины t рассчитывается по формуле:
tфакт =
w−a
µ
,
где w − доля изучаемого признака в выборке;
µ − средняя ошибка выборки для доли.
Для выборки большого объема
µ=
w(1 − w)
,
n
µ=
w(1 − w)
.
n −1
для
малой выборки
Табличное значение t-статистики, как и для средней, находится на
основе интеграла вероятностей Лапласа или распределения Стьюдента (для
малой выборки).
При сравнении долей единиц, обладающих определенным признаком,
в двух совокупностях применяется схема, аналогичная приведенной ранее
для проверки соответствующей гипотезы о средней. В качестве критерия
можно использовать t-статистику. Фактическое значение критерия в этом
случае рассчитывается по формуле:
tфакт =
w1 − w2
µw − w
1
где
.
и
w1
µw − w
1
2
,
2
доля единиц, обладающих изучаемым признаком, в
сравниваемых выборках;
− стандартная ошибка разности выборочных долей.
w2 −
Стандартная ошибка выборки может быть рассчитана по формуле:
µw − w =
1
2
⎛1 1⎞
p (1 − p )⎜⎜ + ⎟⎟ ,
⎝ n1 n2 ⎠
где p − доля признака в генеральной совокупности;
n1 и n2 − объем каждой их двух выборок.
Эта формула справедлива, если величина р в двух сравниваемых
генеральных совокупностях одинакова. Так как при проверке нулевой
гипотезы величина р неизвестна, в формуле для µ w − w можно использовать ее
оценку, полученную по результатам выборочного обследования:
1
p=
2
m1 + m2 w1n1 + w2 n2
=
,
n1 + n2
n1 + n2
где m1 и m2 − частота изучаемого признака в каждой из двух выборок.
69
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сравнение фактического и табличного значений t-статистики
позволяет отклонить или не отклонить выдвинутую гипотезу. Для сравнения
двух долей можно использовать также χ 2 - критерий Пирсона.
5.9 Тесты и задачи
5.9.1 Расчет объема выборки (n) осуществляют по
бесповторного отбора, если в результате расчета n доля отбора:
а) превысит 5 %;
б) будет меньше 5 %;
в) будет равна 5 %.
формуле
5.9.2 При распространении результатов выборочного наблюдения на
генеральную совокупность, исходят из того, что все средние и
относительные показатели, полученные по выборке, являются:
а) смещенными и эффективными характеристиками генеральной
совокупности;
б) несмещенными характеристиками генеральной совокупности;
в) несмещенными и эффективными характеристиками генеральной
совокупности;
г) эффективными характеристиками генеральной совокупности.
5.9.3 При уточнении данных сплошного наблюдения на основе
контрольных выборочных мероприятий поправка на недоучет наиболее
широко применяется в обследованиях относительно совокупностей, когда их
объем не превышает:
а) нескольких десятков единиц;
б) нескольких тысяч единиц;
в) нескольких единиц;
г) несколько сотен единиц.
5.9.4 Исследуемая партия состоит из 5 тыс. деталей. Предполагается,
что партия деталей содержит 8 % бракованных. Определите необходимый
объем выборки, чтобы с вероятностью 0,997 установить долю брака с
погрешностью не более 2 %:
а) 1650;
б) 1244;
в) 1300;
г) 1444.
5.9.5 В крае 268 тыс. семей. Из них 163 тыс. семей рабочих, 77 тыс.
семей сельских жителей, 28 тыс. семей служащих. С целью определения доли
многодетных семей предлагается провести типическую выборку с
пропорциональным отбором. Отбор внутри типов механический. Какое
количество семей необходимо отобрать, чтобы с вероятностью 0,997 ошибка
70
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
выборки не превышала 10 %? Дисперсия типической выборки равна 2700.
а) 241,4 тыс.;
б) 201,4 тыс.;
в) 803,7 тыс.;
г) 141,5 тыс.
5.9.6 На заводе, имеющем 200 бригад, проектируется серийная выборка
для установления доли рабочих завода, выполняющих норму выработки.
Требуется определить необходимую численность выборки, чтобы с
вероятностью 0,954 предельная ошибка выборки не превышала 5 %, если
межсерийная дисперсия доли 225.
а) 50 бригад;
б) 40 бригад;
в) 30 бригад;
г) 20 бригад.
5.9.7 В городе проживает 100 тыс. человек. Какова должна быть
численность выборки для определения доли населения со среднедушевыми
денежными доходами до 1500 р. в месяц, чтобы с вероятностью 0,997 ошибка
выборки не превышала 2 %, если на основе предыдущих обследований
известно, что дисперсия равна 0,24?
5.9.8 С целью определения средних затрат времени при поездках на
работу населения города планируется выборочное обследование на основе
случайного повторного отбора. Сколько людей должно быть обследовано,
чтобы с вероятностью 0,954 ошибка выборочной средней не превышала 1
минуты при среднем квадратическом отклонении 15 минут?
5.9.9 Исследуемая партия состоит из 5 тыс. деталей. Предполагается,
что партия деталей содержит 8 % бракованных. Определите необходимый
объем выборки, чтобы с вероятностью 0,997 установить долю брака с
погрешностью не более 2 %.
5.9.10 При оценке результатов малой выборки в расчетах не
используется величина:
а) генеральной средней;
б) генеральной дисперсии;
в) коэффициента доверия;
г) выборочной средней.
5.9.11 При малой выборке вероятная оценка:
а) несколько больше, чем при большой выборке;
б) несколько меньше, чем при большой выборке;
в) такая же, как и при большой выборке;
г) зависит от случая.
71
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
5.9.12 Точность результатов выборки малого объема по сравнению с
выборками большого объема:
а) ниже;
б) выше;
в) равна.
5.9.13 Несопоставимость данных возникает при выборочном
обследовании:
а) когда неверно составлена программа выборочного обследования;
б) в момент распространения результатов на генеральную
совокупность;
в) всегда;
г) когда неверно определен объем выборки.
5.9.14 Ошибкой I рода называется:
а) вероятность того, что нулевая гипотеза будет отвергнута, в то время,
когда она в действительности должна быть принята;
б) вероятность того, что нулевая гипотеза будет принята, в то время,
когда в действительности она должна быть отвергнута;
в) вероятность того, что нулевая гипотеза в любом случае будет
отвергнута;
г) вероятность того, что нулевая гипотеза в любом случае будет
принята.
5.9.15 Ошибкой II рода называется:
а) вероятность того, что нулевая гипотеза будет отвергнута, в то время,
когда она в действительности должна быть принята;
б) вероятность того, что нулевая гипотеза будет принята, в то время,
когда в действительности она должна быть отвергнута;
в) вероятность того, что нулевая гипотеза в любом случае будет
отвергнута;
г) вероятность того, что нулевая гипотеза в любом случае будет
принята.
5.10 Вопросы для самопроверки и повторения
1 Назовите этапы выборочного наблюдения.
2 Какие способы применяются для определения приближенного
значения дисперсии?
3 На какую величину рекомендуется увеличивать объем
многоступенчатой выборки по отношению к рассчитанной численности?
4 Назовите методы распространения результатов выборочного
наблюдения на генеральную совокупность.
5 В чем заключается метод прямого пересчета?
6 В каком случае используется поправка на недоучет?
72
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7 Назовите методы восстановления данных.
8 Что такое полный неответ?
9 В чем состоит метод замены единиц наблюдения?
10 На чем базируется метод случайного подбора донора для
замещения?
11 Назовите критерий, применяющийся для определения возможных
пределов σ ошибки в малой выборке.
12 По какой формуле определяется мера случайных колебаний
выборочной средней в малой выборке?
13 При каком условии выводы по результатам малой выборки имеют
практическое значение?
14 В каком случае для расчета средней ошибки выборки используют
формулу µ =
σ
n −1
?
15 Что такое критическая область? Какие критические области
выделяют в зависимости от сформулированной альтернативной гипотезы?
16 Какие критерии применяются при проверке статистических гипотез?
17 В каком случае могут применяться непараметрические критерии?
18 Назовите два вида гипотез о средних величинах, которые наиболее
часто проверяются в статистической практике.
19 Какие критерии могут применяться для сравнения двух долей?
20 С какой целью часто выдвигается гипотеза о равенстве средних
значений признака двух совокупностей?
6 Области применения выборочного
социально-экономических исследованиях
наблюдения
в
6.1 Прикладные задачи выборочного наблюдения
Переход к рыночной экономике в значительной мере способствует
расширению сферы использования выборочного наблюдения.
Проблемы применения конкретных видов выборочного наблюдения
для решения тех или иных теоретических или прикладных задач решаются с
учетом их специфики.
Такие авторы как Дружинин Н.К., Басова В.А., Елисеева И.И.,
отмечают, что выборочное наблюдение широко используется для:
1) статистического оценивания и проверки гипотез;
2) решения производственных и управленческих задач;
3) социально-экономических исследований.[1,8,14]
Первая группа задач чаще всего связана с решением
общетеоретических проблем, проведением исследований и экспериментов
для получения информации о генеральной совокупности на основе
выборочного наблюдения. Такие исследования могут решать два основных
73
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
вида задач:
− поиск наилучших выборочных параметров (оценок) для отображения
интересующих нас свойств генеральной совокупности.
− выдвижение и формирование определенных гипотез о тех или иных
свойствах генеральной совокупности и их последующая проверка с помощью
результатов выборочного наблюдения.
Вторая группа задач связана с практическими интересами и
приобретает все большее значение в области управления технологическими
процессами, качеством продукции и работ.
К основным этапам статистического управления качеством относятся:
а) измерение параметров и создание системы показателей качества,
контролируемых в производственном процессе;
б) установление номинального (производственного, технологического)
режима, отклонение от которого должно статистически оцениваться и иметь
следствием принятие определенных решений;
в) поиск оптимального режима, способов совершенствования процесса,
альтернативных технологий на базе анализа производимых замеров;
г) управление по номиналу и допускам. Оно чаще всего
осуществляется на основе так называемых карт Шухарта или кумулятивных
сумм, разрабатываемых на основе стандартов, специальных таблиц и
номограмм.
Выборочный приемочный и текущий контроль качества продукции
подчас выступает единовременно возможным, т.к. в ряде случаев
подразумевает утрату потребительских свойств определенных видов
продукции (например, при контроле продолжительности горения или
устойчивости на перепады напряжения электрических лампочек).
Третья группа задач, проводимых с использованием выборочного
наблюдения, чаще всего решается с помощью системы органов отраслевого
управления и государственной статистики. В промышленности – это
изучение использования оборудования, рабочего времени, эффективности
новых технологий; в сельскохозяйственном секторе – анализ продуктивности
скота, урожайности, качества кормов; в торговле – выборочные исследования
спроса на отдельные товары и степени его удовлетворения.
Совершенствование теории и практики выборочного наблюдения, все
более широкое применение различных сочетаний комбинированного,
многоступенчатого отбора, современных компьютерных технологий
информационной обработки в значительной мере расширяют области
использования, скорость получения и качество результатов выборочного
наблюдения.
6.2 Применение выборочного наблюдения в переписи населения
Большой опыт накоплен отечественной и зарубежной статистикой в
области выборочного обследования населения. Выборочное наблюдение
позволяет значительно расширить программу переписей населения,
74
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
используется для предварительных итогов переписей, при контроле качества
заполненных переписных листов и других контрольных мероприятиях. В
отечественной практике широкое распространение получают национальные
выборочные социально-демографические обследования (1985, 1994 и 2002
гг.), которые позволяют получить ряд важнейших социально-экономических
характеристик в межпереписные периоды. [12]
Всероссийская перепись населения имеет важное социальнополитическое значение. Основное назначение переписи населения России –
отразить социальные и экономические сдвиги, происшедшие в численности и
составе населения страны со времени проведения предыдущей переписи,
показать характерные особенности и масштабы внутренней миграции,
отразить значительные изменения в сфере занятости, демографической
ситуации и демографического поведения населения.
Однако полная реализация программы переписи населения при
всеобщем (сплошном) ее характере была бы затруднена из-за значительных
финансовых и материальных затрат. Поэтому в рамках проекта переписи
значительно место отводится выборочному наблюдению, направленному на
получение более углубленной, детальной и экономической информации по
проблемам занятости, использованию трудовых ресурсов, миграции,
изменению демографической ситуации.
Таким образом, в переписи населения были получены по ряду вопросов
сведения по всему населению (сплошная перепись), а по ряду других
вопросов – только определенной части населения (выборочная перепись).
Применение выборочного наблюдения в переписях населения достаточно
широко практикуется и в нашей стране, и за рубежом. При этом чаще всего
выборочная перепись населения проводится одновременно со сплошной
переписью, что обусловлено более низкими затратами на получение
необходимых сведений.
Выборочные методы, применяемые при проведении переписи
населения, могут использоваться на следующих этапах:
ƒ обработка процедур переписи (до проведения переписи), включая
апробацию переписных листов и методов переписи;
ƒ сбор сведений по дополнительным вопросам (помимо данных,
получаемых методом сплошного учета) и их обработка для включения в
итоговые таблицы;
ƒ контроль качества проведения переписи и оценка результатов.
Цель предварительных, или пробных, переписей заключается в том,
чтобы установить практическую осуществимость намеченных мероприятий
по проведению основной переписи. Для таких проверок можно использовать
целенаправленные выборки. Случайные выборки применяются только для
обработки методов выборочного наблюдения. Полученные при проведении
пробной переписи итоговые показатели и статистические данные об
ошибках, возникающих на различных этапах сборов и обработки исходной
информации, используются при формировании результатов основной
переписи населения, например, с помощью расчета поправочных
75
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
коэффициентов.
Оценки генеральной совокупности, полученные на основе выборок,
зависят не только от ошибок, связанных с применением выборочных
методов, но и, так же как и при сплошном учете, от полноты и достоверности
данных, содержащихся в переписных листах, от ошибок, возникающих при
их кодировке, распознавании при сканировании и формировании базы
данных.
В переписях населения выборочный метод, прежде всего, требует
обоснования объема выборочной совокупности, т.е. доли населения, в
которой должен проводиться опрос, для того, чтобы результаты выборки
точнее отражали характеристики генеральной совокупности.
В целом относительно международного опыта в части использования
выборочного наблюдения в переписи населения можно отметить следующее:
1) при планировании выборок в рамках переписи населения
используются вероятностные схемы отбора, обеспечивающие получение
достоверной информации;
2) в целях уменьшения затрат на подготовку и проведение выборочного
наблюдения в качестве единиц отбора используют переписные единицы
(переписные участки, статистические районы, жилые помещения и т.п.), что
обусловлено наличием готовой основы выборки;
3) объем выборки определяется на основе известных теоретических
соотношений или в зависимости от степени точности получаемых
результатов или с учетом функции расходов;
4) наиболее распространенным способом включения единиц в выборку
является систематический (механический) отбор, при котором начало отбора
определяется по таблице случайных чисел или по способу жеребьевки;
Не исключается также проведение и полностью случайного отбора,
если в процессе подготовки к переписи населения технологически
предусмотрена запись информации на технических носителях и выделены
средства на программное обеспечение процедур формирования выборки.
В нашей стране выборочные переписи населения (25 %-ная выборка)
проводились неоднократно и, как правило, одновременно со сплошной
выборкой.
Практика наших переписей, когда в выборку включают 25 %
населения, дает возможность отразить при помощи выборочного
обследования все население района, имеющего 10 000 жителей. «Для
районов с населением свыше 10 000 человек отбор 25 % жителей
нецелесообразен. Так как большинство административных районов имеет
большое население, для выборочной переписи надо долю единиц в них
сократить, обследуя соответственно 12,5 или 10 % населения. Таким образом,
можно вести выборочную перепись дифференцированно в зависимости от
численности населения района. Для этого следует разделить районы по
численности населения на 2 группы: до 25 тысяч и свыше 25 тысяч жителей.
Для первых сохранить 25 %-ную выборку, для вторых установить 12,5 %ную, т.е. проводить в первой группе районов обследование каждой
76
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
четвертой, а во второй – каждой восьмой семьи (квартиры, дома). [9]
При углубленном изучении населения целесообразно применять
двухступенчатые выборки. Для этой цели некоторой части отобранного для
выборочного обследования населения необходимо задать дополнительно 3-4
вопроса, уточняющих или расширяющих программу. Каждому четвертому из
отобранных лиц ставить еще новые вопросы. Для расширения программы
переписи всегда найдется множество вопросов, требующих немедленного
освещения.
Одним из эффективных методов оценки ошибок, связанных с охватом
населения и содержанием данных переписи в переписных листах, является
метод независимого послепереписного контрольного обследования (ППО).
Применение выборочного метода позволяет получить данные, пригодные для
сопоставления их с показателями, полученными в процессе сплошной
переписи. Важно, чтобы проведение ППО было завершено в течение
нескольких месяцев после переписи населения.
Источники сведений о населении должны быть постоянными.
Поскольку их надо получать часто.
Для составления основы выборки целесообразно использовать жилую
единицу, указанную отдельной строкой в записной книжке переписчика и
проверяемую им в процессе предварительного обхода всех помещений.
Расположение жилых помещений в записных книжках переписчиков можно
рассматривать как случайное, что позволяет получить в целом случайную
выборку.
6.3 Выборочное наблюдение бюджетов домашних хозяйств
Одним из основных видов выборочного наблюдения, проводимого в
России, как и в других странах, является обследование бюджетов домашних
хозяйств.
Целью исследования выступает получение данных:
1) о доходах семьи по их источникам (зарплата, оплата за работу в
колхозе, выплаты и льготы за счет общественных фондов потребления –
пенсии, стипендии, различные пособия, дотации на содержание детей в садах
и яслях и др., доходы от личного подсобного хозяйства);
2) о расходах семьи по их назначению (покупка продовольственных и
непродовольственных товаров);
3) об обеспеченности семьи жилищем и предметами культуры и быта;
4) о составе семьи, занятости и образовании ее членов;
5) для исчисления весовых показателей индекса потребительских цен;
6) для составления счетов сектора домашних хозяйств в системе
национальных счетов.
Принципы организации проведения выборочных обследований
бюджетов домашних хозяйств сложились в России в 50-х годах. Так, с 1950 г.
основным документом в этом деле был «Бюджет семьи», который заполнялся
ежемесячно экономистом на основании текущих записей, ведущихся в
77
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
обследуемых семьях. Он включал более 2 тыс. показателей (о составе семьи,
занятости, доходах и расходах, покупках, обороте и потреблении продуктов
питания, наличия скота и т.п.).
В 1996 г. в силу новых экономических реалий, а также учитывая
международную практику выборочных обследований домашних хозяйств и
возможность задействования электронной техники, первичные документы, и
особенно программа разработки данных . коренным образом изменились.
Проводимые с 1996 года обследования домашних хозяйств имеют
принципиальные отличия от аналогичных обследований, проводимых ранее,
как с позиции формирования выборочной совокупности, так и с точки зрения
методов проведения наблюдения.
До 1996 г. выборочная совокупность домашних хозяйств строилась на
основе территориально-отраслевого принципа. Выборка проводилась по
регионам и отраслям пропорционально общей численности занятых в общественном производстве. Для создания отраслевой выборки применялась типическая выборка с механическим отбором единиц внутри групп. Единицами
отбора на первой ступени являлись предприятия внутри отрасли, анна второй
ступени – лица внутри предприятия. Главным показателем отбора являлась
среднемесячная заработная плата, составлявшая более 80 % доходов трудящихся, что делало вполне оправданным типический отбор на ее основе. Отбор обеспечивал пропорциональную представительность в выборочной совокупности работающих с разным уровнем заработной платы. Допустимая предельная ошибка выборки бралась на уровне ± 5 % и показывала отклонение
средней заработной платы всех работающих от выборочной средней заработной платы. В условиях стабильной социально-экономической ситуации и
господства государственного сектора в экономике страны такой отбор позволял решать задачи, стоявшие перед обследованием домашних хозяйств.
Изменившаяся социально-экономическая ситуация (появление новых
социальных групп – предпринимателей, фермеров, безработных и др; падение доли заработной платы в структуре доходов; возрастание дифференциации населения по уровню доходов и т.д.) сделала невозможным применение
старых принципов отбора из-за появления недопустимо большой ошибки
выборки. По ряду основных показателей фактическая ошибка выборки стала
превышать допустимую более, чем в 3 раза. Потребовался принципиально
новый подход к формированию выборочной совокупности. На государственном уровне было принято решение о полномасштабном реформировании выборочной совокупности домашних хозяйств с применением аппарата вероятностной выборки.
В качестве базы формирования выборочной совокупности были приняты материалы микропереписи населения 1994 г., в информационном массиве которой были отражены все типы домашних хозяйств, кроме коллективных (лиц, находящихся в домах-интернатах для престарелых и т.д.).
Конечной единицей отбора является домашних хозяйств – совокупность
лиц, проживающих в одном жилом помещении или его части, как связанных,
так и не связанных отношением родства, совместно обеспечивающих себя
78
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
пищей и всем необходимым для жизни, т.е. полностью или частично объединяющих и расходующих свои средства. Домохозяйство может состоять их
одного человека, живущего самостоятельно.
Одним из критериев выбора варианта объема и распределения выборочной совокупности явилась установка на то, что ожидаемая ошибка выборки не должна превышать 10 %.[17]
Наиболее приемлемыми и отвечающими задачам наблюдения признаны модели многомерных выборок, построенных по территориальному
принципу с учетом структуры показателей, влияющих на результаты наблюдения.
Для формирования выборочной совокупности домашних хозяйств была
применена двухступенчатая выборка, обеспечивающая получение представительной выборки. В качестве группировочных признаков для обследования
домашних хозяйств приняты размер, тип и принадлежность жилого помещения, наличие (отсутствие) в пользовании земельного участка; для обследованных лиц – пол, возраст, уровень образования, национальность, источник
средств существования, проживание в домохозяйстве определенного размера.
Основой выборки являются:
• на
первой ступени – совокупность сформированных папок
микропереписи на уровне регионов, каждая из которых имеет свой номер и
соответствующую принадлежность к определенному административному
району;
• на второй ступени – совокупность бланков микропереписи,
составленных на отдельные домашние хозяйства в пределах счетного
участка.
Единицей отбора на первой ступени является счетный участок
микропереписи населения. Число отбираемых участков H j определяется
отдельно по городскому и сельскому населению с учетом объема выборки и
нагрузки интервьюера (установленная нагрузка на одного интервьюера – 25
домашних хозяйств):
Hj =
mj
25
,
где m j − объем выборки в региональном разрезе отдельно по городской
( j = 1 ) и сельской ( j = 2 ) местности.[17]
Сформированные на первой ступни выборки массив счетных участков
является информационной основой выборки домашних хозяйств на второй
ступени. Таким образом, единицей отбора на второй ступени является
домохозяйство внутри счетного участка. На каждом отобранном счетном
участке формируется выборка из 25 домашних хозяйств. Для формирования
выборочной совокупности, как на первой, так и на второй ступенях применяется случайная выборка. Отбор производится из типизированных основ
выборки, составленных по сочетанию выделенных структурных соотношений группировочных признаков. Алгоритм формирования выборки построен
79
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
таким образом, что совокупность характеристик элементов единиц (счетных
участков домашних хозяйств), отобранных на каждой из ступеней отбора,
представляет
максимально
возможное
количество
подслоев,
сформированных в соответствии с выделенной системой признаков (включая
и имеющих сравнительно низкий удельный вес в основе выборки). Это
позволяет обеспечить в представленной выборке различные типы домашних
хозяйств по их размеру и составу (социально-экономическую и
демографическую структуру).
Единицы типизированных основ выборки размещаются в двух
комбинационных таблицах.
В первой таблице размещаются элементы бланка микропереписи по
сочетанию четырех показателей. В ней размещается ровно столько номеров
бланков переписи, сколько содержится лиц в данной совокупности
домашних хозяйств.
Во второй таблице размещаются номера бланков микропереписи,
соответствующие определенному домашнему хозяйству. Она составляется из
оставшихся показателей обследования.
Включение единиц отбора на каждой ступени формирования
выборочной совокупности домашних хозяйств производится случайно.
Характерным для формирования выборки на второй ступени является
то, что эквивалентные номера на этапах первого цикла в выборку не
включаются, а возвращаются обратно в основу, из которой отбор снова
осуществляется на следующем цикле.
Таким образом, для построения выборки домашних хозяйств
используется несколько циклов, количество которых зависит от численности
отобранных эквивалентных номеров.
Формирование выборочной совокупности, как правило, связано со
множеством проблем, прежде всего, с трудностью вхождения в контакт с
домашним хозяйством, нежеланием населения давать информацию о своих
доходах и расходах.
Организация и проведение обследования осуществляется на трех
уровнях:
• федеральном;
• региональном;
• полевом.
Данное обследование проводятся органами Государственной статистики ежегодно в соответствии с Федеральной программой статистических
работ с охватом около 50 тыс. домашних хозяйств. Основой обследования
домашних хозяйств являются дневниковые записи, которые ведутся по методике, утверждаемой органами Государственной статистики.
Каждое из обследуемых домашних хозяйств дважды в течение квартала
ведет однонедельные дневниковые записи, которые представляют собой учет
денежных средств, затраченных на покупку продуктов питания, непродовольственных товаров и оплату услуг. В дневниковых записях фиксируется
также количество потребленных продуктов питания за счет поступления
80
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
продукции собственного производства, безвозмездной помощи из других источников, а также расходы на питание вне дома.
В промежутке между дневниковыми обследованиями члены домашних
хозяйств ведут журнальные записи, представляющие учет покупок непродовольственных товаров и средств, затраченных на оплату услуг. Журнальные
записи осуществляются каждые две недели месяца до или после проведения
дневниковых обследований и полный месяц, в течение которого, дневник не
заполняется.
По окончании каждого месяца работники статистических органов посещают домашние хозяйства и собирают дневники и журналы. Одновременно для получения дополнительных сведений о расходах проводится промежуточный месячный опрос домашних хозяйств. В конце квартала осуществляется ежеквартальный опрос всех членов домашних хозяйств, включающий демографические характеристики, сферу приложения труда, доступ к
системе социальной защиты каждого челна домашнего хозяйства.
Раз в год проводится годичный опрос домашних хозяйств о жилищных
условиях, наличии предметов длительного пользования, обороте скота в личных подсобных хозяйствах, уровне образования членов домашних хозяйств.
6.4 Выборочное
населения
обследование
потребительских
ожиданий
Выборочное обследование потребительских ожиданий населения
проводится во многих странах и позволяет проанализировать и спрогнозировать основные тенденции развития экономических процессов. В России территориальные органы статистики приступили к данному наблюдению в 1998
г. В результате обследования изучается мнение населения о динамике общей
экономической ситуации, динамике личного материального положения,
рынка товаров, услуг и сбережений, а также осуществляется расчет частных
и обобщающих показателей потребительских ожиданий; проводится
исследование потребительского поведения и потребительских предпочтений
населения, а также анализ особенностей потребительских ожиданий отдельных социально-демографических групп населения.
Обследование проводится в каждый второй месяц каждого квартала;
объектом наблюдения является население в возрасте 16 лет и старше, единица наблюдения – отдельный человек. Данные собираются путем персонального формализованного интервью по месту жительства респондентов.
Применяется территориальная двухступенчатая выборка на основе сети
для выборочного обследования домашних хозяйств. Объем выборочной
совокупности – 5000 респондентов по 88 субъектам РФ.
На первой ступени в случайном порядке отбираются домашние
хозяйства. В каждом домашнем хозяйстве на второй ступени опрашивается
только один человек, определяемый «методом последнего дня рождения»,
т.е. в опросе участвует тот взрослый член домохозяйства, чей прошедший
день рождения был ближайшим ко дню проведения опроса.
81
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Опросный лист обследования потребительских ожиданий населения
состоит из трех основных блоков: А – вводный блок; В – блок-вопросник; С –
блок социально-демографических характеристик.
Вводный блок включает обращение к респонденту и 9 идентификационных кодов обследования, которые позволяют определить: кто, когда и где
был опрошен по данному опросному листу.
Блок-вопросник опросного листа обследования включает 27 вопросов,
которые можно объединить в три группы по основным аспектам мнения потребителей: вопросы об общей экономической ситуации; вопросы о личном
материальном положении; вопросы о конъюнктуре рынка товаров и рынка
сбережений. На основе 12 вопросов блока-вопросника рассчитываются частные индексные показатели, отражающие различные аспекты потребительских мнений и ожиданий населения, шесть из которых применяются для расчета обобщающих показателей. Признаки всех вопросов – качественные, при
этом признаки 15 из них измерены по ранговой шкале, остальных – по номинальной.
В блок социально-демографических характеристик респондентов
включены показатели, по которым проводится анализ данных о потребительских ожиданиях населения. Он включает 12 вопросов. Два вопроса, признаки
которых измерены по номинальной шкале, заполняются самим интервьюером (пол респондента и тип населенного пункта его проживания). Все вопросы этого блока являются открытыми, дизъюнктивными (допускающие
только один вариант ответа). Признаки 5 вопросов – количественные (дискретные), остальных – качественные, измеренные по номинальной шкале.
Вопросы 3 блока:
1) Собственно-демографические характеристики респондента:
• пол;
• возраст;
• образование.
2) Характеристика занятости респондента:
• основное занятие;
• дополнительная работа.
Для работающих респондентов:
• тип предприятия;
• профессиональный статус.
3) Характеристика места проживания:
• типа населенного пункта.
4) Характеристика домашнего хозяйства респондента:
• среднедушевой доход;
• общее число членов домашнего хозяйства;
• число детей в возрасте до 16 лет в домашнем хозяйстве;
• число неработающих пенсионеров в домашнем хозяйстве.[17]
Выходные данные обследования формируются на федеральном уровне
и приводятся в сводных таблицах. Опросный лист обследования потребительских ожиданий населения позволяет рассчитать коэффициенты, приме82
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
няемые для изучения мнения потребителей и прогнозных оценок поведения
населения в странах Европейского союза и др., по наиболее распространенным в мировой практике методикам: по методике, применяемой для расчета
показателей, публикуемых Европейской комиссией (рассчитываются один
обобщающий и 11 частных показателей); по методике, разработанной в Институте социальных исследований Университета штата Мичиган, США (рассчитываются 3 обобщающих и 12 частных показателей).
Обе методики расчетов индексов по результатам опросов потребителей
в целом совпадают:
• частные индексы, позволяющие изучать динамику мнения населения
по отдельным социально-экономическим аспектам общественной жизни,
рассчитываются по относительным показателям распределения ответов респондентов. В расчетах используется разница между процентом положительных ответов и процентом отрицательных ответов;
• обобщающие индексы рассчитываются как средние арифметические
определенных частных индексов;
• при анализе обобщающих и частных показателей потребительских
ожиданий населения наибольшее значение имеет динамика индексов, а не их
абсолютная величина. Увеличение значения индекса означает рост оптимизма у населения, а уменьшение – рост пессимизма.
Опыт ряда зарубежных стран показывает, что использование индекса
мнения потребителей как индикатора эффективности проводившейся экономической политики и ориентира для формирования новой политики в сочетании с другими макроэкономическими показателями позволит разработать и
внедрить в практику модели краткосрочного прогнозирования, бюджетного
планирования, оценки вариантов экономического развития.
По мере накопления статистических материалов по результатам обследования потребительских ожиданий населения можно разработать социально-экономические рекомендации по стратификации общества, по уточнению состава экономико-географических районов, по типологизации регионов
и населенных пунктов.
Результаты обследования потребительских ожиданий населения, организуемого органами государственной статистики позволят:
• проводить анализ экономического развития России путем сравнения
динамики индексных показателей потребительских ожиданий населения с
динамикой основных экономических показателей на макроуровне;
• объяснять социально-экономические процессы с учетом специфики
поведения определенных групп населения, основываясь на том, что
индексные показатели потребительских ожиданий отражают не только
экономические, но и социальные, политические и другие факторы жизни
общества;
• принимать прогнозные решения исходя из того, что изменения в
проведении потребителей через определенное время отражаются в
изменениях в экономике;
83
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
участвовать в международных сравнениях оценок потребительского
мнения;
• решать практические коммерческие вопросы (например, определять
возможные направления инвестиций);
• анализировать динамику потребительских настроений населения по
каждому субъекту РФ.
•
6.5
Выборочное
предпринимательства
наблюдение
за
субъектами
малого
Важнейшим элементом рыночной экономики является малое
предпринимательство, включающее совокупность малых предприятий,
крестьянские (фермерские) хозяйства и индивидуальных предпринимателей.
В условиях рыночной экономики перед специалистами, исследующими
статистические показатели деятельности предприятий, встает ряд
методологических, технологических и организационных трудностей,
обусловленных следующими причинами:
• большое число элементов исследуемой совокупности, финансовые
ограничения и трудности процесса сбора и обработки первичной
информации;
• динамичность совокупности малых предприятий, так как в ней
постоянно происходят демографические процессы создания, ликвидации,
изменения видов деятельности и масштаба предприятий;
• предприятий могут официально входить в одно объединение,
использовать одну бухгалтерию, или их активы могут быть объединены в
одну финансовую систему;
• скошенность распределений наблюдаемых признаков предприятий,
т.е. небольшое их число производит преобладающую долю продукции;
• искажение оценок по показателям и неполучение ответов от
респондентов;
• зачастую весьма низка степень корреляционной связи между
признаками.[12]
Статистическое изучение малых предприятий начинается с определения
перечней прошедших государственную регистрацию коммерческих организаций.
Такая информация по юридическим лицам имеется в Едином государственном
регистре предприятий и организаций (ЕГРПО). ЕГРПО является системой учета
юридических лиц, их обособленных подразделений и индивидуальных
предпринимателей и ведется органами статистики России.
Из перечней, содержащихся в ЕГРПО и БД БОО (система описания
финансово-хозяйственной деятельности юридических лиц и их обособленных
подразделений на основе бухгалтерской отчетности организаций), выбираются
фактически действующие юридические лица. Полученное в результате такого
отбора множество юридических лиц образует генеральную совокупность объектов
статистического наблюдения.
Проведение сплошных или выборочных статистических наблюдений
84
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
осуществляется только на основе указанной генеральной совокупности. Для ее
формирования используются различные источники информации. В частности,
считаются фактически действующими и включаются в состав генеральной
совокупности все организации, которые представили в органы государственной
статистики годовую бухгалтерскую отчетность за предыдущий год, а также новые
организации, зарегистрированные в текущем году. Организации, являющиеся
субъектами малого предпринимательства и имеющие численность работников
менее 15 человек, могут применять упрощенную систему налогообложения, учета
и отчетности. Такие малые предприятия не составляют бухгалтерскую отчетность,
и сведения о них могут вноситься в генеральную совокупность объектов
статистического наблюдения из административных регистров других ведомств,
например, по данным Министерства по налогам и сборам.
В системе государственной статистики постепенно сформировались
методологические основы учета деятельности малого бизнеса, ядро которых
составил выборочный метод.
Выборочное наблюдение за субъектами малого предпринимательства
(бизнес-наблюдение) проводится, начиная с 1996 года. Целью проведения
статистического наблюдения за деятельностью малых предприятий является
формирование показателей деятельности малых предприятий в разрезе
регионов, отраслей экономики и промышленности, форм собственности.
Анализ результатов обследования позволяет выявить особенности развития
малого предпринимательства в экономике России, определить его долю в
основных макроэкономических показателях.
Выборочное наблюдение малых предприятий проводится по форме федерального государственного статистического наблюдения № ПМ «Сведения
об основных показателях деятельности малого предприятия». В данной
отчетности сведения предоставляются ежеквартально нарастающим итогом
за период с начала отчетного года и за соответствующий период прошлого
года. Сроки представления отчетов: 29 апреля, 29 июля, 29 октября и 29
января. Бланк обследования состоит из 4 разделов, содержащих показатели,
данные по которым заполняются по результатам деятельности предприятия
за квартал нарастающим итогом.
В I раздел включены показатели, характеризующие среднюю численность, фонд начисленной заработной платы и выплаты социального характера по работникам.
II раздел содержит основные экономические показатели производственной деятельности предприятия (выпуск, отгрузка товаров, объем платных
услуг населению, инвестиции в основной капитал и т.д.) и его финансовые
результаты (выручка, прибыль или убыток).
В III разделе предусмотрено заполнение данных по видам произведенной продукции, оказанных населению платных услуг, проданных товаров.
В IV разделе отражается перечень оказанных услуг в стоимостном характере.
Объектами наблюдения являются юридические лица – субъекты малого
предпринимательства, к которым в соответствии с Федеральным законом «О
85
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
государственной поддержке малого предпринимательства в РФ» от 14.06.95
№ 88-ФЗ относятся коммерческие организации, в уставном капитале которых
доля участия РФ, субъектов РФ, общественных и религиозных организаций,
благотворительных и других фондов не превышает 25 %; доля, принадлежащая одному или нескольким юридическим лицам, не являющимися субъектами малого предпринимательства, не превышает 25 %; и в которых средняя
численность работников за отчетный период не превышает следующих предельных уровней: в промышленности, строительстве и на транспорте – 100
человек, в сельскохозяйственной и научно-технической сфере – 60 человек; в
оптовой торговле – 50 человек, в розничной торговле и бытовом
обслуживании населения – 30 человек, в остальных отраслях – 50 человек.
Работы по организации и проведению выборочного наблюдения
включают следующие этапы:
1 Формирование генеральной совокупности малых предприятий на основе ЕГРПО, бухгалтерской отчетности с последующим ее уточнением из
других источников (проведенных обследований, данных Пенсионного фонда,
МВД России и др.).
Генеральная совокупность формируется на региональном уровне по состоянию на 1 января и фиксируется на весь год. Ее численность составляет
примерно 1 млн. предприятий и организаций.
2 Формирование выборочной совокупности малых предприятий.
3 Сбор первичной информации от малых предприятий, ее ввод, контроль, корректировка, хранение.
4 Распространение данных, получаемых при выборочном наблюдении,
на генеральную совокупность и расчет характеристик точности получаемых
результатов.
5 Формирование итогов обследования в целом по России, в разрезе
субъектов РФ, видов экономической деятельности, форм собственности.
Выборочное наблюдение осуществляется с помощью пакета
прикладных программ – ППП «Методы несплошного статистического
наблюдения» (ППП МНСН).
Выборочная совокупность создается на основе планово-обоснованного
подхода – многомерного расслоенного (типического) случайного отбора с
простой оценкой показателей по среднему в слое на единицу.
Выборочная совокупность сформируется один раз и используется в течение всего года. Первым этапом формирования выборочной совокупности
является расслоение (стратификация, группировка).
При расслоенном случайном отборе с неизменным объемом выборки
«n» дисперсия оценки суммарного значения признака минимальна, если:
nh =
N h Sh
,
H
∑N S
i =1
h
h
где nh - число единиц наблюдения, выбираемых из h-слоя;
h – номер слоя;
86
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
N h - объем слоя h;
S h2 - дисперсия слоя h;
H –число слоев;
2
Nh
1
( yhi − yh ) ,
S =
(N h − 1) ∑
i =1
2
h
где yhi - базовое значение признака i-единицы наблюдения h-слоя (выручка);
yh - среднее значение признака по слою h.[17]
Расслоение единиц наблюдения генеральной совокупности осуществляется по 4 признакам:
1) территория (на основе кодов ОКАТО) – 79 слоев;
2) вид экономической деятельности ( на основе кодов ОКОНХ) – 63
слоя;
3) форма собственности (ОКФС) – 4 слоя;
4) объем выручки – 5 слоев.
Число единиц наблюдения – малых предприятий, подлежащих
обследованию (объем выборки) – по субъектам РФ определяется исходя из
того, что значение коэффициента вариации оценки по признаку размещения
«выручка» не должно превышать 5 %.
В целом по России число единиц наблюдения не превышает 20 %
генеральной совокупности всех малых предприятий.
Технологический цикл планирования выборки, выполняемый в регионах в
автоматическом режиме, включает ряд последовательных процедур:
ƒ формирование основы выборки – «базовой выборки» − путем выгрузки
из территориального раздела Генеральной совокупности объектов статистического наблюдения текущего года всех малых предприятий (по сочетанию
кодов ОКОПФ и ОКФС);
ƒ из базовой выборки исключаются предприятия, не представлявшие
отчетность последние два года подряд;
ƒ по каждому включенному в базовую выборку предприятию выгружаются из территориального раздела Генеральной совокупности следующие
реквизиты: код ОКПО, Краткое наименование предприятия, код ОКАТО и т.д.;
ƒ редактирование массива информации, присвоение каждой единице
базовой совокупности случайного индивидуального номера;
ƒ составление четырех «настроечных» таблиц (параметров массивов и
слоев, параметров формирования выборки, характеристик предприятий базовой
совокупности, характеристик слоев базовой совокупности);
ƒ на основании настроечной таблицы параметров массивов и слоев
производится разграничение базовой совокупности на три массива: массив
нетипичных предприятий, основной массив предприятий, массив предприятий,
по которым отсутствуют сведения о выручке (предприятия не сдали
87
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
отчетность);
ƒ рассчитываются статистические характеристики по каждому из трех
сформированных массивов на основе трех признаков – среднесписочная
численность работников, выручка, выпуск товаров и услуг. По каждому признаку вычисляют четыре обобщающих показателя: суммарное значение признака,
среднее значение признака, среднее квадратическое отклонение признака,
коэффициент вариации признака;
ƒ формирование слоев осуществляется в следующем порядке: определяется число слоев в соответствии с данными настроечной таблицы «Параметры
формирования выборки», формируются границы слоев;
ƒ расчет необходимого объема выборки по каждому массиву двумя
способами;
ƒ для пропорционального размещения и для оптимального размещения
(расчет для оптимального размещение производится по методу Неймана, при
котором число единиц наблюдения, выбираемых из массива (слоя),
определяется по признаку «выручка» пропорционально произведению числа
единиц наблюдения в массиве (слое) на квадратный корень из дисперсии
признака в массиве (слое);
ƒ расчет объема выборки
в каждом слое двумя способами - для пропорционального и оптимального (по Нейману) размещения выборки;
ƒ размещение выборки (отбор единиц – формирование списка подлежащих обследованию единиц).
После завершения процесса заполнения формуляров наблюдения осуществляется в централизованном порядке формирование сводных итогов обследования малых предприятий, включающее следующие операции:
1) ввод первичных отчетов;
2) кодирование ответов;
3) контроль первичных данных; проводится постстратификация, т.е.
распределение организаций по фактическому виду деятельности (которое
может не совпадать с данными регистра), полученному по результатам выборочного обследования;
4) обработка «неответов». Для обработки полных неответов совокупность неответивших организаций разделяется на три группы, к каждой группе применяется свой метод коррекции и восстановления данных;
5) агрегированный контроль - выявление нетипичных единиц;
6) формирование сводных итогов;
7) контроль сводных итогов (контроль нарастающих итогов, контроль
соотношения показателей, балансовый контроль итогов, контроль динамики
показателей;
8) формирование выходных таблиц;
9) корректировка сводных итогов с помощью поправочных
коэффициентов.
Для обработки полных неответов респондентов совокупность не ответивших организаций разделяется на 3 следующие группы, при этом к каждой
группе полных неответов применяется свой метод коррекции и восстановле88
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ния данных.
1 группа – малые предприятия, данные по которым не восстанавливаются. К ним относятся организации, прекратившие или приостановившие
свою деятельность в силу различных причин.
2 группа – предприятия, о которых достоверно известно, что они, несмотря на отсутствие отчета, активны, ведут финансово-хозяйственную деятельность.
Для восстановления данных по предприятиям 2 группы применяется
метод перевзвешивания (заполнению по среднему в слое). Не ответившему
малому предприятию присваивается среднее значение ответивших в данном
слое.
3 группа – малые предприятия, по которым не получена объективная
информация о том, действующие они или нет.
Для восстановления данных по 3 группе применяется метод заполнения
случайным подбором в классах замещения. Для этого выборочная совокупность малых предприятий (как функционирующих и представивших отчет,
так и ликвидированных) делится на классы по отраслям экономики. Не ответившим организациям приписываются значения признака выбранного случайным образом предприятия-донора из соответствующего класса замещения.
6.6 Выборочное наблюдение
промышленных предприятий
деловой
активности
малых
Выборочное наблюдение за деловой активностью малых предприятий
промышленности проводится ежеквартально по форме федерального
государственного статистического наблюдения № ДАП-ПМ "Обследование
деловой активности малого предприятия промышленности".[17]
Цель проведения обследований деловой активности – оперативное
получение данных о краткосрочных экономических изменениях, мониторинг
и прогнозирование циклов экономической активности малых промышленных
предприятий.
Организация работы по обследованию деловой активности малых
промышленных предприятий направлена на выявление основных тенденций
ожидаемой деловой активности, позволяющей определить развитие малого
предпринимательства.
Программа обследования промышленных предприятий, разработанная
с учетом мировой практики проведения подобных работ, в частности,
европейской гармонизированной системы, основывается на опросе и
обобщении мнений руководителей об основных направлениях деятельности
малого предприятия. В отличие от традиционной статистики обследование
деловой активности основано на изучении общественного мнения. Такой тип
информации не требует специальных расчетов, носит обобщающий
качественный характер. Собранная информация отражает особенности
функционирования и степень адаптации промышленных предприятий
89
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
крыночным условиям хозяйствования, их намерения на ближайшую
перспективу и оценку предпринимателями политики федеральных и местных
органов в области экономики. Кроме того, в отличие от традиционной
статистики обследования деловой активности обобщают более широкий
диапазон информации, включая ежеквартальные оценки использования
производственных
мощностей,
факторов,
ограничивающих
рост
производства, оценки общей экономической ситуации.
При
проведении
обследования
руководителям
предприятий
предлагаются вопросы с тремя вариантами ответов:
ƒ ниже нормального;
ƒ нормальное;
ƒ выше нормального.
Вопросы направлены на анализ тенденций активности предприятий,
оценку их текущего состояния и прогноз на ближайшие 3-4 месяца. Такими
вопросами оценивают спрос на продукцию, остатков готовой продукции, цен
на реализуемую продукцию, занятости.
В этом случае ответы на вопросы имеют следующую форму:
"увеличение" ("повышение"), "без изменения", "уменьшение" ("снижение").
Такие вопросы используются для оценки спроса на продукцию, остатков
готовой продукции, цен на реализуемую продукцию, занятости.
Для вопросов о загрузке производственных мощностей и о факторах,
ограничивающих рост производства, предлагается более трех вариантов ответов. Так, для оценки загрузки производственных мощностей используется
шкала с шагом 10, начиная со значения 30 %. Для оценки факторов, ограничивающих рост производства, используются предварительно подготовленные
ответы, и респонденты отмечают одну или несколько причин, оказывающих,
по их мнению, негативное влияние на рост производства.
При обработке полученных от респондентов анкет по вопросам
качественного характера подсчитывается относительная частота каждого
варианта ответа в процентах. Далее рассчитывается разница относительных
частот положительных и отрицательных ответов на вопросы,
представляющая собой индекс изменений и называемая "балансом".
Положительный знак индекса свидетельствует о подъеме экономической
активности, отрицательный – о ее снижении.
Полученные балансы могут агрегироваться. В частности, индекс предпринимательской уверенности определяется как среднее арифметическое
"балансов" оценок ожидаемого выпуска продукции, фактического спроса
(имеющихся заказов) и остатков готовой продукции (последний с обратным
знаком). Агрегирование результатов обследования деловой активности промышленных организаций осуществляется в отраслевом разрезе (по 14 крупным отраслям промышленности).
Оценка экономических изменений на малых промышленных
предприятиях проводится по следующим направлениям:
ƒ индекс предпринимательской уверенности и его составляющие;
ƒ использование производственных мощностей;
90
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ƒ
численность занятых и прогноз ее изменения в ближайшие 3-4
месяца;
фактические и ожидаемые ценовые тенденции и уровень колебаний в
запасах сырья и материалов, готовой продукции;
ƒ финансовая деятельность предприятий;
ƒ факторы, ограничивающие рост производства;
ƒ инновационная деятельность;
ƒ оценка общей экономической ситуации.
Для облегчения заполнения бланка обследования респондентами
показатели деловой активности сгруппированы в однородные группы (блоки
показателей).
Для формирования выборочной совокупности используется двухфазная
выборка (двойной отбор). Первой фазой отбора является формирование
методом расслоенного случайного отбора выборочной совокупности для
обследования малых предприятий по форме федерального государственного
статистического наблюдения № ПМ "Сведения об основных показателях
деятельности малого предприятия".
Перечень малых предприятий промышленности, подлежащих
статистическому наблюдению по форме № ПМ, принимается за основу
формирования выборки на второй фазе отбора. В качестве способа отбора
применяется систематическая (механическая) выборка из ранжированного
ряда.
Минимально достаточный объем выборки определяется с учетом
следующих положений:
ƒ главным расчетным показателем, который используется при анализе
тенденций деловой активности предприятий, является баланс. Требуемая
точность оценок показателей определяется из условия, что интервалы
достоверности для долей с увеличением и уменьшением признака не должны
пересекаться;
ƒ число неответов в среднем на один вопрос составляет около 20 %, а
для показателя "инвестиции в основной капитал" – до 70 %.
Минимально достаточным объемом выборки для обследования деловой
активности малых промышленных предприятий с учетом неответов является
выборка в 300−360 единиц наблюдения.
Для изучения деловой активности предприятия, относящиеся к
отраслям промышленности: электроэнергетика; топливная промышленность;
черная металлургия; цветная металлургия; стекольная и фарфорофаянсовая
промышленность; мукомольно-крупяная и комбикормовая промышленность;
медицинская
промышленность;
полиграфическая
промышленность,
обследуются по всему списку единиц наблюдения, сформированному для
выборочного наблюдения за деятельностью малых предприятий.
Для остальных отраслей промышленности производится отбор малых
предприятий со следующими долями отбора:
ƒ для химической и нефтехимической промышленности отбирается 50
% предприятий (каждое второе) из списка единиц наблюдения,
ƒ
91
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
сформированного для выборочного наблюдения за деятельностью
малых предприятий по форме № ПМ;
ƒ для машиностроения – 5 % предприятий;
ƒ для
лесной, деревообрабатывающей и целлюлозно-бумажной
промышленности – 10 %;
ƒ для промышленности строительных материалов – 25 %;
ƒ для легкой промышленности – 10 %;
ƒ для пищевой промышленности – 20 %.[17]
После сбора и редактирования первичной информации осуществляется
формирование
распространенных
сводных
итогов
средствами
специализированного программного обеспечения выборочного наблюдения.
Распространение выборочных данных обследования деловой
активности малых промышленных предприятий на генеральную
совокупность проводится как для отраслей промышленности, так и для
промышленности в целом.
Для распространения выборочных данных на генеральную
совокупность выполняется следующая процедура взвешивания полученных
от респондентов ответов:
1) каждому ответу респондента придается в качестве первого весового
множителя численность занятых на данном предприятии, указанная им в
бланке обследования;
2) каждому ответу респондента в качестве второго множителя
придается значение, обратное доле отбора предприятий данной отрасли в
регионе − 1 / f ij .
f ij =
nij
N ij
,
где fij − доля отбора малых промышленных предприятий i − той отрасли
промышленности в j − том регионе;
nij − число малых предприятий i − той отрасли промышленности,
попавших в выборку в j − том регионе;
N ij − общее число малых предприятий i − той отрасли промышленности в
j − том регионе.[17]
Таким образом, взвешивание ответов респондентов в регионе для
данной отрасли проводится по следующему алгоритму: ответ респондента
умножается на численность занятых на данном предприятии и делится на
долю отбора малых предприятий i − той отрасли промышленности в j − том
регионе.
Распространенные
итоги
обследования,
представленные
на
федеральный уровень, сопровождаются характеристиками точности, а также
результатами проведенного дорасчета на ненаблюдаемую часть исследуемой
совокупности. Сводные итоги в целом по России с целью последующего
анализа формируются на федеральном уровне в соответствии с макетами
92
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
выходных
таблиц,
разработанных
структурным
Федеральной службы государственной статистики.
подразделением
6.7 Применение выборочного метода в обследовании перевозочной
деятельности
Для
выборочного
обследования
перевозочной
деятельности
используются хозяйства, на балансе которых числится не менее 10 грузовых
автомобилей и осуществляющие грузоперевозки. По каждому объекту в
каталог заносятся обязательные реквизиты: код ОКПО, ОКВЭД, ОКОНХ,
ОКАТО, ОКОПФ, ОКФС и краткое наименование.
Статистическая основа для проведения обследования перевозочной
деятельности формируется территориальными органами государственной
статистики на базе регистра предприятий, отчитывающихся по форме №
1−ТР (автотранспорт). Данные предприятия заносятся в каталог предприятий
и образуют основу выборки отчитывающихся предприятий. Обновление
каталога производится, начиная со 2-го квартала по данным ф.№1−ТР
(автотранспорт) – год, за год, предшествующий отчетному. Основа выборки
формируется по каждому региону на начало отчетного года. [17]
Выборочная совокупность создается методом расслоенного случайного
отбора без возвращения.
В течение года в каждом регионе обследуется определенный процент
предприятий (организаций) от генеральной совокупности данного региона.
Величина годового процента выборки определяется следующим образом:
1) если количество предприятий генеральной совокупности N от 400 и
более предприятий включительно, то процент годовой выборки равен 20 %;
2) если количество предприятий генеральной совокупности N от 100
до 399 предприятий включительно (меньше 400), то процент годовой
выборки равен 50 %;
3) если количество предприятий генеральной совокупности N до 99
предприятий включительно (меньше 100), то процент годовой выборки равен
100 %, так как выборка квартальная, то квартальный объем выборочной
совокупности n = 0,25 ⋅ nобщ .
В случае если единицы распределены по слоям очень неравномерно,
можно прибегнуть к изменению границ слоев генеральной совокупности.
Другим способом устранения неравномерности распределения единиц по
слоям является проведение дополнительной работы по выявлению
нетипичных единиц и повторение расслоения. Этот способ является более
предпочтительным.
После расслоения совокупности по расслаивающему признаку
рассчитываются характеристики совокупности: количество предприятий,
суммарное значение признака, среднее значение признака, среднее
квадратическое отклонение признака, коэффициент вариации в процентах,
верхнюю и нижнюю границы слоев. При анализе этих показателей особое
внимание уделяется коэффициенту вариации признака: чем он меньше, тем
93
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
лучше проведено расслоение. Высокое значение коэффициента вариации
(более 100 %) может свидетельствовать о том, что в данном слое небольшое
число единиц (до 10). Если в слое более 10 предприятий, а значение
коэффициента вариации велико, то рекомендуется провести в данном слое
отбор нетипичных единиц и повторить расслоение.
Определение объема выборки или относительной предельной ошибки
для типических групп проводится по следующей схеме.
1 Если задан объем выборки или доля отбора из типической группы, то
рассчитывается относительная предельная ошибка ∆ отн типической группы
для пропорционального размещения либо для оптимального размещения (по
Нейману);
2 Если задана относительная предельная ошибка ∆ отн , то
рассчитывается абсолютная предельная ошибка ∆ и ее дисперсия. Затем
рассчитывается объем выборки из типических групп либо для
пропорционального размещения, либо для оптимального размещения.
После определения объема выборочной совокупности формируется
список предприятий выборки и проводятся соответствующие расчеты.
6.8 Выборочное обследование населения по проблемам занятости
В настоящее время выборочным обследованиям населения по
проблемам занятости, проводимым путем опроса населения, принадлежит
ведущая роль в организации статистического наблюдения за процессами на
рынке труда в России.
Обследование населения по проблемам занятости – это единственный
источник информации, позволяющий производить одновременно учет
занятых экономической деятельностью, безработных и экономически
активных лиц в соответствии с критериями Международной организацией
труда, оценить реальные размеры безработицы как в целом по стране, так и
по каждому субъекту Российской Федерации. Выборочное обследование
населения по проблемам занятости является основным источником
информации о качественном составе рабочей силы, размерах и структуре
фактической безработицы, причинах незанятости, способах поиска работы и
его продолжительности.
Обследование проводилось, начиная с 1992 г. с годовой
периодичностью. С 1999 г. обследования рабочей силы проводятся один раз в
квартал по состоянию на последнюю (критическую) неделю второго месяца
квартала, т.е. февраля, мая, августа, ноября, что позволяет проследить
сезонные колебания показателей занятости и безработицы. Обследование
населения по проблемам занятости проводится по состоянию на критическую
(обследуемую) неделю. Критическая неделя длится с понедельника по
воскресенье. В выборку отбирается 65 тыс. человек в возрасте 15-72 лет, что
составляет около 0,06 % численности населения данного возраста.
Основой выборки выступают материалы микропереписи населения
94
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1994г. Отбор единиц (домохозяйств) проводится на федеральном уровне на
основе вероятностных математических моделей по схеме случайного включения единиц в выборку из типизированной основы выборки, сгруппированной по семи признакам: пол, возраст, размер семьи, источник средств существования, образование, национальность, принадлежность жилого помещения. [12]
Из типизированной основы отбираются счетные участки переписи
(портфели); в этих участках случайно отбираются домашние хозяйства. Сбор
информации осуществляется по лицам в обследуемом возрасте путем опроса
членов домашних хозяйств. Программа опросного листа предусматривает
вопросы о наличии работы в обследуемую неделю, характере этой работы,
наличии дополнительной работы, отработанном времени, виде деятельности
и занятии, статусе занятых по основной и дополнительной работе.
При обработке материалов наблюдения производится распространение
полученных материалов на всю генеральную совокупность путем корректировочных коэффициентов, дифференцированных по полу, возрастным группам, субъектам РФ, городской и сельской местности.
6.9 Выборочное обследование о составе затрат на рабочую силу
Еще одним современным направлением является проведение
выборочного обследования организаций о составе затрат на рабочую силу.
Цель – получение информации об уровне, структуре, динамике затрат в
пользу работников по субъектам РФ, отраслям экономики и
промышленности и формам собственности.
Обследование проводится с 1992 г. во всех регионах Российской
Федерации на основе выборочного метода наблюдения с последующим
распространением итогов на всю численность населения обследуемого
возраста. Наблюдение, начиная с 1999 г., проводится раз в два года.
Объектами выборочного наблюдения выступают юридические лица со
среднесписочной численностью работников свыше 10 человек со средним
уровнем заработной платы выше минимального.
Обследование проводится путем опроса населения и записи сведений в
Анкету обследования населения по проблемам занятости. Анкета содержит
вопросы по учетным признакам обследования, которые задаются в
логической последовательности.
Основные учетные признаки анкеты содержат следующую
информацию:
а) сведения о респондентах: пол; возраст; семейное положение;
гражданство; уровень образования; общее число членов домохозяйства;
родственные отношения в домохозяйстве;
б) наличие оплачиваемой работы или доходного занятия: занятость в
обследуемую неделю, включая наличие работы, которая временно не
выполнялась;
в) признаки, характеризующие основную работу: вид экономической
95
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
деятельности; занятие (профессия, должность); классификация по статусу
занятых; количество привлекаемых наемных работников для работодателей;
постоянная, временная работа; региональное месторасположение основной
работы; нормальная и фактическая продолжительность рабочей недели;
причины работы меньше нормальной продолжительности рабочей недели
или временного отсутствия;
г) сведения о второй работе: наличие дополнительной работы;
классификация по статусу занятых; вид экономической деятельности;
занятие (профессия, должность); постоянная, временная работа; количество
фактически отработанного времени на дополнительных работах; поиск или
готовность к дополнительной занятости;
д) поиск работы: поиск работы лицами, не занятыми в обследуемую
неделю; способы поиска работы; готовность приступить к работе; характер
работы, к которой незанятый готов приступить; продолжительность поиска
работы; регистрация в службе занятости в качестве безработного; получение
пособия по безработице;
е) прошлая деятельность лиц, не занятых в обследуемую неделю:
наличие когда-либо ранее работы у незанятых; вид деятельности и занятие
(профессия, должность) по последнему месту работы; продолжительность
периода незанятости; причины, по которым незанятые оставили последнее
место работы; наличие специальности (профессии) у незанятых, не имеющих
опыта работы;
ж) сведения об экономически неактивных лицах: социальный статус;
причины отказа от поиска работы; причины неготовности приступить к
работе;
и) занятость производством товаров или услуг в домашнем хозяйстве:
занятость в обследуемую неделю производством продукции в личном
подсобном хозяйстве, включая производство продукции для собственного
потребления; основной вид производимой сельскохозяйственной продукции
и отработанное время в обследуемую неделю в личном подсобном хозяйстве;
занятость производством в домашнем хозяйстве промышленных товаров или
услуг для получения дохода или обмена; основной вид производимых в
домашнем хозяйстве промышленных товаров и услуг и отработанное время
на выполнении этих работ.[17]
В качестве информационной базы (основы) для формирования
выборочной совокупности домашних хозяйств используются материалы
Всероссийской переписи населения. Если между Всероссийскими
переписями населения проводится 5 %-ная микроперепись, то основа
выборки обновляется, и выборка домашних хозяйств формируется на базе
материалов микропереписи населения.
Выборка единиц наблюдения для квартальных обследований строится
таким образом, что для каждого последующего обследования все единицы
наблюдения отобранной совокупности предыдущего квартала заменяются
новыми. Единицы наблюдения могут повторно включаться в выборку по
истечении двух лет.
96
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Замена единиц наблюдения производится на основе специально
сформированных
выборок
в
соответствии
с
Методическими
рекомендациями, утверждаемыми Федеральной службой государственной
статистики.
Выборочная совокупность создается на основе многомерного
расслоенного случайного отбора, т.е. выборка типическая с собственнослучайным отбором. Расслоение генеральной совокупности – группировка,
стратификация – осуществляется на уровне каждой территории по трем
признакам: вид деятельности (31 слой или группы), форма собственности (2
слоя), среднесписочная численность работников (6 слоев). Исходные данные
ранжируются в группах по уровню среднемесячной заработной платы и
отбираются пропорционально численности единиц в слое и в зависимости от
варьируемого признака.
Обобщающими характеристиками выступают величина, состав,
структура расходов на рабочую силу по элементам затрат, средние затраты
на одного работника, на один отработанный и оплаченный человеко-час,
представленные в различных разрезах и группировках.
6.10 Выборочное наблюдение за ценами
Одними из основных показателей, характеризующих инфляционные
процессы в экономике России, являются индексы цен. Проблема
отображения движения цен на продукцию, товары и услуги как в
потребительском, так и в производственном секторах экономики в
статистической практике решается в комплексном варианте.
Выборочное наблюдение за ценами особенную актуальность приобрело
в 1992 году, с момента либерализации цен. Именно в этот период
Федеральная служба государственной статистики решает задачу построения
логической системы показателей статистики цен, характеризующих как
уровень, так и динамику цен (тарифов). Такая система позволяет в
достаточной степени осуществлять комплексный анализ ценовых процессов
не только внутри конкретной отрасли или сектора, но и экономики в целом.
Ключевым направлением при построении системы индексов цен
(тарифов) является создание единых методологических подходов при расчете
как средних цен, так и индексов цен.
Методологические подходы были сформулированы следующим
образом:
ƒ отбор базовых организаций для наблюдения за ценами (тарифами) на
товары (услуги);
ƒ формирование наборов товаров (услуг)-представителей с учетом
максимального сближения номенклатурных позиций (формирование
сквозной номенклатуры для всех секторов экономики);
ƒ организация наблюдения за ценами (тарифами) по выборочной
совокупности базовых организаций;
ƒ единые временные параметры регистрации цен (тарифов) на товары и
97
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
услуги (в конце отчетного месяца);
ƒ единые принципы формирования базисных весов с ежегодным их
пересмотром;
ƒ расчет индивидуальных, групповых, отраслевых, региональных
индексов цен и тарифов;
ƒ общая для всей системы индексов цен (тарифов) формула расчета;
ƒ построение всей системы индексов цен (тарифов) в разрезе субъектов
Российской Федерации.
Единые подходы при расчете системы индексов цен (тарифов)
позволяют максимально точно сопоставлять их динамику на товары (услуги)
во всех секторах экономики.
Наблюдение за уровнем и изменением цен осуществляется в различных
отраслях экономики по выборочной сети базовых организаций,
распределенных по субъектам РФ. Для регистрации цен и тарифов на товары
и услуги отобраны крупные, средние и малые предприятия, занимающие
соответствующие доли в производстве и реализации продукции и услуг.
Наблюдение проводится за предприятиями всех форм собственности и
организационно-правовых форм.
Набор товаров и услуг формируется на федеральном уровне и остается
постоянным в течение года. На региональном уровне отбираются несколько
видов товаров из набора, занимающих значительную долю в производстве
или на потребительском рынке данного региона. Регистрация цен на товары
и услуги проводится ежемесячно в конце отчетного месяца. На основании
первичных данных рассчитываются индивидуальные (по отдельному товару),
групповые, отраслевые, региональные и федеральные индексы цен и тарифов.
Важнейшими групповыми и отраслевыми индексами являются:
• индексы потребительских цен на товары и услуги;
• индексы цен на рынке жилья;
• индексы цен производителей промышленной продукции;
• индексы цен производителей на реализованную с/х продукцию;
• индексы цен в капитальном строительстве (строительно-монтажные
работы, оборудование, прочие капитальные работы);
• индексы тарифов на грузовом транспорте;
• индексы тарифов на услуги связи для юридических лиц;
• индексы цен на погрузочно-разгрузочные работы в речных портах;
• индексы
цен
на
приобретенные
сельскохозяйственными
организациями средства производства и услуг;
• индексы цен на приобретенные строительными организациями основные материалы, детали и конструкции.
В потребительском секторе проводится еженедельное наблюдение за
уровнем и динамикой цен на важнейшие продовольственные товары,
алкогольную и табачную продукцию, а также лекарственные препараты,
бензин.[17]
Основным принципом отбора товаров для регистрации цен является
98
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
представительность отобранных их видов для характеристики динамики цен
по товарным группам, подотраслям и отраслям экономики региона и России
в целом. В основу выборки товаров положено предположение, что изменения
цен на отобранные для наблюдения товары и на товары, не попавшие в
выборку, но являющиеся продукцией той же конкретной товарной группы,
близки по своему значению как в организации, участвующей в наблюдении,
так и в других организациях, не отобранных для обследования.
На региональном уровне специалисты отбирают для наблюдения по
каждой позиции набора товаров-представителей несколько видов товаров с
конкретными потребительскими свойствами. Эти товары должны занимать
значительный удельный вес либо в их объеме производства, либо на
потребительском рынке данного региона и предположительно будут либо
производиться, либо предлагаться к продаже в течение продолжительного
времени.
Территориальным органам государственной статистики также
предоставлено право расширять перечень товаров и услуг для регистрации
цен. При этом зарегистрированная ценовая информация на товары (услуги),
не включенные в установленный обязательный перечень, не участвует в
расчете индексов цен.
Такой метод позволяет сохранить представительность регионального
уровня в расчете индексов цен по важнейшим товарам и услугам, а также
сводных индексов цен (тарифов) и в то же время существенно уменьшить
вероятность искажения этого показателя в связи с многочисленными
досчетами недостающей информации при нестабильном производстве или
предложении товаров.
В условиях продолжающегося роста цен ежемесячная их регистрация
на товары (услуги)-представители проводится в конце отчетного месяца (с 20
по 25 число). По товарам и услугам, цены (тарифы) на которые не
подвержены резким изменениям, регистрация может проводиться в более
ранние сроки, но не более чем на один-два дня до установленного времени.
Такой метод сбора информации в конце месяца позволяет более полно
оценить рост цен в целом за месяц.
В настоящее время повышаются требования к качеству собираемой
ценовой информации. В связи с этим становятся более жесткими правила
сбора информации об уровне цен и тарифов, а также требования по замене
товаров в организациях, где регистрируются цены на наблюдаемый перечень
товаров.
Расчет системы индексов цен в большинстве случаев производится с
месячной периодичностью, реже – с квартальной и годовой. Ежемесячно
рассчитывается вся система индексов цен к предыдущему месяцу, к декабрю
предыдущего года, к соответствующему месяцу предыдущего года,
нарастающим итогом с начала года к соответствующему периоду
предыдущего года.
Расчет базисных индексов цен (тарифов) за квартал, полугодие, период
с начала года, как правило, производится "цепным" методом, т.е. путем
99
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
перемножения месячных индексов цен (тарифов).
6.11 Применение выборочного наблюдения в сельском хозяйстве
При реорганизации статистического наблюдения за сельским
хозяйством одним из основных направлений является расширение
применения в практике выборочных методов. Разрабатывается система
выборочных обследований с применением различных типов выборки с
учетом специфики сельскохозяйственного производства и объекта
наблюдения.
Источником информации является субрегистр «крестьянские
хозяйства».
Для формирования выборочной совокупности крестьянских хозяйств
используются методы одноцелевых (механических) выборок и типических
выборок.
В регионах, где генеральная совокупность крестьянских хозяйств, производящих исследуемый вид сельхоз. продукции, малочисленна (меньше 200
хозяйств), наиболее эффективным является систематический отбор. При этом
объем выборочной совокупности будет зависеть от выбора уровня точности
получаемых данных и имеющихся финансовых ресурсов.
Применение типических выборок эффективно тогда, когда генеральная
совокупность многочисленна (больше 200 хозяйств), когда однородность показателей достигается при значительной численности единиц наблюдения
типических групп. Источником информации для построения является субрегистр «крестьянские хозяйства».
Генеральной совокупностью являются крестьянские хозяйства, производящие изучаемый вид сельскохозяйственной продукции.
Генеральная совокупность определяется:
ƒ по растениеводству – как отдельные совокупности крестьянских
(фермерских) хозяйств, имеющих посевные площади зерновых и
зернобобовых культур, сахарной свеклы, подсолнечника, картофеля, овощей,
кормовых культур по состоянию на 1 июня;
ƒ по животноводству – как отдельные совокупности крестьянских
(фермерских) хозяйств, имеющих поголовье крупного рогатого скота,
свиней, овец и коз, птицы, лошадей, северных оленей по состоянию на 1
января.
Единица отбора и наблюдения – крестьянское хозяйство.
Для формирования выборочной совокупности с помощью
механической выборки строятся ранжированные списки крестьянских
хозяйств по показателям, которые используются в качестве основы выборки.
Основа выборки – совокупность крестьянских хозяйств региона, ранжированных по возрастанию показателя, характеризующего изучаемый вид
производимой сельхоз. продукции (посевная площадь в растениеводстве, поголовье скота и птиц в животноводстве).
Для любой основы выборки рассчитываются математико-статистиче100
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ские характеристики:
1) численность крестьянских хозяйств в i − м ряду, имеющих
количественное значение (исключаются хозяйства с нулевым значением
показателя) N i ;
2) среднее значение i − ряда ~xi :
Ni
~
xi =
∑x
j =1
Ni
ij
;
3) дисперсия σ 2 :
Ni
σ =
2
∑x
j =1
Ni
2
2
ij
⎛ Ni ⎞
⎜ ∑ xij ⎟
⎜ j =1 ⎟
;
−⎜
Ni ⎟
⎜
⎟
⎜
⎟
⎝
⎠
4) среднеквадратическое отклонение
5) σ i = σ 2 ;
6) коэффициент вариации Vi :
σ
Vi = ~i ⋅ 100%. [17]
xi
Отбор крестьянских хозяйств из ранжированного списка осуществляется с помощью таблицы 7, где приведены объем выборки, номер хозяйства,
попавшего в выборку первым.
Таблица 7 – Вспомогательная таблица для формирования механической
выборки крестьянских хозяйств
1
1-50
Процент отбора
в зависимости
от численности
хозяйств
генеральной
совокупности
100
2
3
51-100
101-200
50
25
№
хозяйства
Количество
крестьянских
хозяйств
генеральной
совокупности
Интервал
отбора
Начало
отбора
Обследуется
вся совокупность
2
4
2
3
Началом отбора для любой генеральной совокупности является середина первого интервала отбора. Отбор начинается с хозяйства, попавшего в
выборку под номером 1 и далее в соответствии интервалом отбора. Если в
конце списка остается несколько хозяйств и их число равно или больше половины интервала отбора, то последнее хозяйство списка включается в вы101
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
борку. В том случае, если остаток меньше половины интервала, то последнее
хозяйство не включается в список. Все крестьянские хозяйства, резко
выделяющиеся по производству продукции из основ выборки, исключаются
и обследуются отдельно.
Для формирования типических выборок крестьянских хозяйств также
как и в предыдущем случае рассчитываются показатели 1−5, а также
7) минимально значение ряда хimin – значение показателя, находящегося в ряду первым после нулевых значений.
8) максимальное значение ряда ximax – значение показателя,
находящегося в последнем ряду (наибольшем).
Любая основа выборки разбивается на типичные (однородные) группы.
Минимальная численность группы не может быть меньше 5. Оптимальным
является типическая выборка с минимальным числом групп, минимальным
объемом выборки n n и заданным уровнем точности ∆ i .
Разбивка на типические группы проводится на основе повторного бинарного деления упорядоченного ряда по средней на группы:
а) меньше среднего значения показателя (< xi )
б) больше среднего значения показателя (> xi ).
Затем возможны 2 варианта:
1) коэффициент вариации в образовавшейся группе ≤ 33 %;
2) коэффициент вариации > 33 %;
Операция повторяется до того момента, пока вся генеральная совокупность N i не будет разбита на группы, коэффициенты вариации в которых не
будут превышать 33 %. Дробление прекращается в том случае, когда численность группы N ij ≤ 5 единиц, независимо от величины коэффициента вариации.
По сформированным j − группам, у которых коэффициент вариации
≤ 33 %, строится интервальный ряд. Эти же группы используются в качестве
типических групп. Для любой j − группы рассчитываются N ij , хij , σ ij2 , σ ij , Vij .
Затем рассчитываются:
1) средняя из внутригрупповых дисперсий
2) объем i − той типической выборки.
6.12 Тесты и задачи
6.12.1 Наиболее распространенным способом включения единиц в
выборку при проведении переписи населения является:
а) серийный отбор;
б) случайный отбор;
в) систематический (механический) отбор;
г) типический отбор;
д) многофазный отбор.
102
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6.12.2 В России при проведении выборочного обследования в переписи
населения использовалась:
а) 50 %-ная выборка;
б) 25 %-ная выборка;
в) 15 %-ная выборка;
г) 10 %-ная выборка.
6.12.3 До 1996 года выборочная совокупность домашних хозяйств
строилась пропорционально общей численности:
а) занятых лиц в общественном производстве;
б) населения страны;
в) трудовых ресурсов;
г) трудоспособного населения.
6.12.4 Главным показателем отбора при проведении выборочного
наблюдения домашних хозяйств до 1996 года являлся:
а) показатель среднемесячной заработной платы;
б) показатель среднемесячной пенсии;
в) показатель номинальной начисленной заработной платы;
г) статус членов домашнего хозяйства.
6.12.5 Одним из критериев выбора варианта объема и распределения
выборочной совокупности домашних хозяйств явилась установка на то, что
ожидаемая ошибка выборки не должна превышать:
а) 10 %;
б) 30 %;
в) 25 %;
г) 50 %.
6.12.6 Единицами отбора на второй ступени при проведении
выборочного обследования домашних хозяйств является:
а) домашнее хозяйство;
б) счетный участок;
в) член домашнего хозяйства;
г) населенный пункт.
6.12.7 Выборочное обследование домашних хозяйств проводится с
охватом:
а) 5 тыс. домохозяйств;
б) 25 тыс. домохозяйств
в) 50 тыс. домохозяйств;
г) 500 тыс. домохозяйств.
6.12.8 Объем выборочной совокупности при проведении выборочного
обследования потребительских ожиданий населения равен:
103
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) 500 респондентов;
б) 5000 респондентов;
в) 50000 респондентов;
г) 500 000 респондентов.
6.12.9 Выходные данные выборочного обследования потребительских
ожиданий населения формируются на уровне:
а) федеральном;
б) региональном;
в) местном.
6.12.10 Вопросы о характеристиках занятости респондента при
проведении выборочного обследования потребительских ожиданий
населения включаются в:
а) вводный блок;
б) блок-вопросник;
в) блок социально-демографических характеристик;
г) блок демографических характеристик.
6.12.11
Выборочное
наблюдение
за
субъектами
малого
предпринимательства (бизнес-наблюдение) проводится с периодичностью:
а) ежемесячно;
б) ежеквартально;
в) ежегодно;
г) раз в полугодие.
6.12.12 Генеральная совокупность при проведении выборочного
обследования малых предприятий составляет:
а) 50 тыс. предприятий;
б) 500 тыс. предприятий;
в) 1 млн. предприятий.
6.12.13 В целом по России число единиц наблюдения при проведении
выборочного обследования малых предприятий не превышает от генеральной
совокупности всех малых предприятий:
а) 10 %;
б) 15 %;
в) 20 %.
6.12.14 Для формирования выборочной совокупности при проведении
выборочного обследования малых предприятий применяется отбор:
а) механический;
б) многомерный типический;
в) типический;
г) серийный.
104
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
6.12.15 Минимально достаточным объемом выборки для обследования
деловой активности малых промышленных предприятий с учетом неответов
является выборка в:
а) 300−360 единиц наблюдения;
б) 200−260 единиц наблюдения;
в) 100−160 единиц наблюдения.
6.12.16 Выборочное обследование населения по проблемам занятости с
1999 г. проводится с периодичностью:
а) ежемесячно;
б) ежегодно;
в) каждое полугодие;
г) ежеквартально.
6.12.17 При проведении выборочного обследования населения по
проблемам занятости в выборку в выборку отбирается население:
а) экономически активное;
б) в возрасте 15-72 года;
в) трудоспособного возраста.
6.12.18 При проведении выборочного обследования населения по
проблемам занятости отбор единиц в выборочную совокупность проводится
способом:
а) серийным;
б) типическим;
в) механическим;
г) случайным
6.12.19 В потребительском секторе наблюдение за уровнем и
динамикой цен на важнейшие продовольственные товары проводится:
а) ежеквартально;
б) каждое полугодие;
в) ежемесячно;
г) еженедельно.
6.12.20 Выборочное обследование организаций о составе затрат на
рабочую силу проводится с периодичностью:
а) раз в два года;
б) два раза в год;
в) раз в год.
6.12.21 Объектами выборочного наблюдения организаций о составе
затрат на рабочую силу выступают юридические лица со среднесписочной
численностью работников:
а) 10 человек;
105
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
б) свыше 10 человек;
в) меньше 10 человек.
6.12.22 Для формирования выборочной совокупности крестьянских
хозяйств используются методы выборок:
а) механических и типических;
б) механических и серийных;
в) механических и случайных.
6.12.23 Минимальная численность типической группы при выборочном
обследовании крестьянских хозяйств не может быть меньше:
а) 5;
б) 10;
в) 15.
6.12.24 Если количество крестьянских хозяйств в генеральной
совокупности составляет 51-100 хозяйств, то процент отбора в выборочную
совокупность равен:
а) 100 %;
б) 50 %;
в) 25 %;
г) 15 %.
6.12.25 Если количество крестьянских хозяйств в генеральной
совокупности составляет 101-200 хозяйств, то процент отбора в выборочную
совокупность равен:
а) 100 %;
б) 75 %;
в) 50 %;
г) 25 %.
6.13 Вопросы для самопроверки и повторения
1 С чем связана первая группа задач выборочного наблюдения?
2 Что используется при планировании выборок в рамках переписи
населения?
3 Что было принято в качестве базы формирования выборочной
совокупности при проведении переписи населения?
4 Чем отличается выборочное обследование домашних хозяйств,
проводимое сейчас от аналогичных наблюдений, проводимых до 1996 года?
5 Что является конечной единицей отбора в выборочном наблюдении
бюджетов домашних хозяйств?
6 Какие вопросы включает блок-вопросник при проведении
выборочного наблюдения потребительских ожиданий населения?
7 Что является объектом выборочного наблюдения за малым
106
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
предпринимательством?
8 На каком уровне формируется генеральная совокупность малых
предприятий?
9 Что является первым этапом при проведении работ по организации
выборочного наблюдения за малым предпринимательством?
10 Что содержит первый раздел бланка обследования при
обследовании малых предприятий?
11 Для восстановления данных по каким предприятиям применяется
метод заполнения случайным подбором в классах замещения при проведении
выборочного обследования малых предприятий?
12 Для восстановления данных по каким предприятиям применяется
метод перевзвешивания (заполнению по среднему в слое) при проведении
выборочного обследования малых предприятий?
13 С какой периодичностью и по какой форме федерального
государственного статистического наблюдения проводится выборочное
наблюдение за деловой активностью малых предприятий промышленности?
14 Каков минимально достаточный объем выборки для обследования
деловой активности малых промышленных предприятий с учетом неответов?
15 Какие хозяйства используются для выборочного обследования
перевозочной деятельности?
16 Перечислите обязательные реквизиты каждого объекта
обследования перевозочной деятельности.
17 Объясните, каким образом определяется величина годового
процента
выборки
предприятий,
занимающихся
перевозочной
деятельностью.
18 Какие вопросы предусматривает программа опросного листа при
проведении наблюдения по проблемам занятости?
19 Каким образом производится распространение полученных
материалов на всю генеральную совокупность при выборочном
обследовании проблем занятости?
20 Какие групповые и отраслевые индексы рассчитываются при
проведении выборочного наблюдения за ценами?
21 На каком уровне формируется набор товаров и услуг при
выборочном наблюдении за ценами?
22 Что является целью выборочного наблюдения о составе затрат на
рабочую силу?
23 На каком уровне осуществляется расслоение генеральной
совокупности при выборочном наблюдении о составе затрат на рабочую
силу?
24 Что выступает в качестве обобщающих характеристик в
выборочном наблюдении затрат на рабочую силу?
25 Каким образом ранжируются исходные данные в группах при
выборочном наблюдении о составе затрат на рабочую силу?
26 Что является основой выборки при формировании механических
выборок крестьянских хозяйств?
107
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
27 В каком случае эффективно применение типических выборок в
выборочном наблюдении в сельском хозяйстве?
28 Что является основой выборки при формировании механических
выборок крестьянских хозяйств?
29 В чем заключается процедура отбора крестьянских хозяйств из
ранжированного списка?
30 В каком случае применяются механические выборки в выборочном
наблюдении в сельском хозяйстве?
108
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7 Задания к самостоятельной работе
Вариант 1
Задача 1
В результате выборочного обследования жилищных условий жителей
города, осуществленного на основе простой случайной повторной выборки,
получен следующий ряд распределения:
Общая
площадь
30,0
жилищ,
и
До 5,0 5,0-10,0 10,0-15,0 15,0-20,0 20,0-25,0 25,0-30,0
приходящаяся
более
на одного
человека, м2
Число жителей
8
95
204
270
210
130
83
Определить пределы, в которых заключен средний размер общей
площади, приходящейся на 1 человека.
Задача 2
На предприятии в порядке случайной бесповторной выборки было
опрошено 100 рабочих их 1000 и получены следующие данные об их доходе
за месяц:
Месячный доход, р. 1200-200 2000-2800 2800-3600 3600-4000
Число рабочих
12
60
20
8
С вероятностью 0,997 определить пределы для среднемесячного дохода
у работников данного предприятия.
Задача 3
Среди выборочно обследованных 1000 семей региона по уровню
душевого дохода (выборка 2 %-ная, механическая) малообеспеченных
оказалось 300 семей. Требуется с вероятностью 0,997 определить пределы
для доли малообеспеченных семей.
Задача 4
В крае 268 тыс. семей. Из них 163 тыс. семей рабочих, 77 тыс. семей
сельских жителей, 28 тыс. семей служащих. С целью определения доли
многодетных семей предполагается провести типическую выборку с
пропорциональным отбором. Отбор внутри типов механический. Какое
количество семей необходимо отобрать, чтобы с вероятностью 0,997 ошибка
выборки не превышала 10 %? Дисперсия типической выборки равна 2700.
109
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Задача 5
Из партии семян, разбитой на 40 равных по величине серий, методом
случайного бесповторного отбора было проверено 8 серий на всхожесть. В
результате обследования установлено, что доля взошедших семян составляет
75 %. Межсерийная дисперсия равна 900. Определить необходимую
численность выборки, чтобы с вероятностью 0,683 ошибка выборки не
превышала 10 %.
Вариант 2
Задача 1
Для определения зольности угля в месторождении в порядке случайной
выборки было установлено, что средняя зольность угля в выборке 16 %,
среднее квадратическое отклонение 5 %. В десяти пробах зольность угля
составила более 20 %. С вероятностью 0,954 определить пределы, в которых
будут находиться средняя зольность угля в месторождении и доля угля с
зольностью более 20 %.
Задача 2
В городе проживает 250 тыс. семей. Для определения среднего числа
детей в семье была организована 2 %-ная случайная бесповторная выборка
семей. По ее результатам было получено следующее распределение семей по
числу детей:
Число детей в семье
0
1
2
3
4
5
Количество семей
1000 2000 12000 400 200 200
С вероятностью 0,954 найти пределы, в которых будет находиться
среднее число детей в генеральной совокупности.
Задача 3
В районе с числом рабочих 12 тыс. необходимо определить долю
жителей, обучающихся в высших учебных заведениях, методом
механического отбора. Какова должна быть численность выборки, чтобы с
вероятностью 0,997 ошибка выборки не превышала 0,08, если известно, что
дисперсия равна 0,16?
Задача 4
В финансовой корпорации и ее филиалах 2000 сотрудников. Из них
1500 мужчин и 500 женщин. С целью определения доли сотрудников со
стажем работы на данном предприятии свыше 5 лет планируется провести
типическую выборку с пропорциональным отбором. Отбор внутри групп
механический. Какое число сотрудников необходимо отобрать, чтобы с
вероятностью 0,683 ошибка выборки не превышала 3 %, если известно, что
дисперсия типической выборки равна 2100?
110
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Задача 5
На складе готовой продукции цеха находятся 200 ящиков деталей по 40
штук в каждом ящике. Для проверки качества готовой продукции была
произведена 10 %-ная серийная выборка. В результате выборки установлено,
что доля бракованных деталей составляет 15 %. Дисперсия серийной
выборки равна 0,0049. С вероятностью 0,997 определить пределы, в которых
находится доля бракованной продукции в партии ящиков.
Вариант 3
Задача 1
Для определения скорости расчетов с кредиторами предприятий
корпорации в коммерческом банке была проведена случайная выборка 100
платежных документов, по которым средний срок перечисления и получения
денег оказался равным 22 дням со стандартным отклонением 6 дней.
Необходимо с вероятностью 0,954 определить пределы средней
продолжительности расчетов предприятий данной корпорации.
Задача 2
На предприятии в порядке случайной бесповторной выборки было
опрошено 100 рабочих их 1000 и получены следующие данные об их доходе
за месяц:
Месячный доход, р. 1200-200 2000-2800 2800-3600 3600-4000
Число рабочих
12
60
20
8
С вероятностью 0,954 определить пределы для генеральной доли
рабочих предприятия, имеющих месячных доход 2800 рублей и выше.
Задача 3.
С целью определения средней фактической продолжительности
рабочего дня в государственном учреждении с численностью служащих 480
человек была проведена 25 %-ная механическая выборка. По результатам
наблюдения оказалось, что у 10; обследованных потери времени достигали
более 45 минут в день. С вероятностью 0,683 установить пределы, в которых
находится генеральная доля служащих с потерями рабочего времени более 45
минут в день.
Задача 4
В коммерческом банке и его филиалах 4000 сотрудников. Из них
имеют стаж работы более 5 лет 3000 сотрудников, а менее 5 лет – 1000
сотрудников. С целью определения доли сотрудников, производительность
которых превышает установленные пределы нормы, предполагается
провести типическую выборку с пропорциональным отбором. Отбор внутри
банка и филиалов механический. Какое количество сотрудников необходимо
отобрать, чтобы с вероятностью 0,954 ошибка выборки не превышала 5 %?
111
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
На основе предыдущих обследований известно, что дисперсия типической
выборки равна 900.
Задача 5
В АО 200 бригад рабочих. Планируется проведение выборочного
обследования с целью определения удельного веса рабочих, имеющих
профессиональные заболевания. Известно, что межсерийная дисперсия доли
равна 225. С вероятностью 0,954 рассчитайте необходимое количество
бригад для обследования рабочих, если ошибка выборки не должна
превышать 5 %.
Вариант 4
Задача 1
На основе выборочного обследования в отделении связи города
предполагается определить долю писем частных лиц в общем объем
отправляемой корреспонденции. Никаких предварительных данных об
удельном весе этих писем в общей массе отправляемой корреспонденции не
имеется. Определить численность выборки, если результаты выборки дать с
точностью до 1 % и гарантировать это с вероятностью 0,95.
Задача 2
На предприятии в порядке случайной бесповторной выборки было
опрошено 100 рабочих их 1000 и получены следующие данные об их доходе
за месяц:
Месячный доход, р. 1200-200 2000-2800 2800-3600 3600-4000
Число рабочих
12
60
20
8
Определить необходимую численность выборки при определении
среднего месячного дохода работников предприятия, чтобы с вероятностью
0,954 предельная ошибка выборки не превышала 100 руб.
Задача 3
Для определения среднего срока пользования краткосрочным кредитом
в банке была произведена 5 %-ная механическая выборка, в которую попало
100 счетов. В результате обследования установлено, что средний срок
пользования краткосрочным кредитом – 30 дней при среднем
квадратическом отклонении 9 дней. В пяти счетах срок пользования
кредитом превышал 60 дней. С вероятностью 0,954 определить пределы, в
которых будут находиться срок пользования краткосрочным кредитом в
генеральной совокупности и доля счетов со сроком пользования
краткосрочным кредитом более 60 дней.
Задача 4
Для определения
112
урожайности
зерновых
культур
проведено
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
выборочное обследование 100 хозяйств региона
собственности, в результате которого получены данные:
различных
форм
Хозяйства
Количество
Средняя
Дисперсия
(по формам
обследованных урожайность, урожайности в
собственности)
хозяйств
ц/га
каждой группе
Коллективные
30
18
15
Акционерные
общества
50
20
25
Крестьянские
20
28
40
С вероятностью 0,954 определить пределы средней урожайности
зерновых культур по всем хозяйствам региона.
Задача 5
В цехе предприятия 10 бригад рабочих. С целью изучения их
производительности труда была осуществлена 20 %-ная серийная выборка, в
которую попали 2 бригады. В результате обследования установлено, что
средняя выработка рабочих в бригадах составила 4,6 и 3 т. С вероятностью
0,997 определить пределы, в которых будет находиться средняя выработка
рабочих цеха.
Вариант 5
Задача 1
При проверке веса импортируемого груза на таможне методом
случайной повторной выборки было отобрано 200 изделий. В результате был
установлен средний вес изделия 30 г. При среднем квадратическом
отклонении 4 г. С вероятностью 0,997 определить пределы, в которых
находится средний вес изделий в генеральной совокупности.
Задача 2
В туристических агентствах города с общим числом сотрудников 1000
человек было проведено 5 %-ное выборочное обследование возраста
сотрудников методом случайного бесповторного отбора. В результате
получены следующие данные:
Возраст, лет
До 30 30-40 40-50 50-60 Свыше 60
Число сотрудников
8
22
10
6
4
С вероятностью 0,997 определить пределы, в которых находится
средний возраст работающих на предприятии.
Задача 3
Для установления среднего срока службы деталей из совокупности,
включающей 1000 шт. кассет с деталями, методом механического отбора
проверено 10 шт. кассет. Результаты проверки показали, что средний срок
113
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
службы деталей в отобранных кассетах составил (месяцев):
Номер кассеты
1
2
3
4
5
6
7
8
9
10
Средний срок службы 7,0 8,2 8,6 7,8 8,0 5,8 8,8 7,2 6,1 6,0
деталей, лет
Средний срок службы деталей в выборке – 7,6 месяца. С вероятностью
0,997 определить пределы, в которых находится средний срок службы
деталей во всей совокупности.
Задача 4
С целью определения доли сотрудников коммерческих банков области
в возрасте старше 40 лет предполагается организовать типическую выборку
пропорционально численности сотрудников мужского и женского пола с
механическим отбором внутри групп. Общее число сотрудников банков
составляет 12 тыс. человек, в том числе 7 тыс. мужчин и 5 тыс. женщин. На
основании предыдущих обследований известно, что средняя из
внутригрупповых дисперсий составляет 1600. определить необходимый
объем выборки при вероятности 0,997 и ошибке 5 %.
Задача 5
300 работников аппаратного цеха предприятия разделены на 15 бригад
по 20 человек в каждой. При определении среднего стажа работы
произведена 20 %-ная бесповторная серийная выборка. В выборку попали 3
бригады, в которых средний стаж работы составил: в первой – 8 лет, во
второй – 12, в третьей – 10. Определите межсерийную дисперсию и объем
выборки, при котором с вероятностью 0,997 средний стаж работы в
отобранных сериях не будет отклоняться от среднего стажа всех сотрудников
предприятия более чем на 5 %.
Вариант 6
Задача 1
При проверке импортируемого груза на таможне методом случайного
повторного отбора было отобрано 200 изделий. В результате был установлен
средний вес изделия 30 г при среднем квадратическом отклонении 4 г. С
вероятностью 0,997 определите пределы, в которых находится средний вес
изделий в генеральной совокупности.
Задача 2
В районе 2000 семей. С целью определения среднего размера семьи
было проведено 3 %-ное выборочное обследование семей методом
случайного бесповторного отбора. В результате обследования получены
данные:
Размер семьи, чел. 0 1 2 3 4 5 6 7 8
Число семей
4 8 14 16 8 4 3 2 1
С вероятностью 0,997 определить пределы, в которых находится
114
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
средний размер семьи в районе.
Задача 3
В 100 туристических агентствах города предполагается обследование
среднемесячного количества реализованных путевок методом механического
отбора. Какова должна быть численность выборки, чтобы с вероятностью
0,683 ошибка не превышала 3 путевок, если по данным пробного
обследования дисперсия составляет 225?
Задача 4
В области 300 тыс. молочных коров. Из них: в районе А – 140 тыс.
коров, в районе Б – 100 тыс. коров, в районе В – 60 тыс. коров. Для
определения средней удойности коров области произведена 1 %-ная
типическая выборка с отбором единиц пропорционально численности коров
в районах (внутри районов применялся случайный бесповторный отбор).
Результаты выборки следующие:
Район Средний удой коров Среднее квадратическое
отклонение, кг
А
3400
800
Б
3100
500
В
3600
900
С вероятностью 0,954 определить пределы, в которых находится
средняя удойность коров в области.
Задача 5
В области, состоящей из 20 районов, проводилось выборочное
обследование урожайности на основе отбора серий (районов). Выборочные
средние по районам составили соответственно 14,5 ц/га; 16; 15,5 и 14 ц/га. С
вероятностью 0,954 найдите пределы урожайности во всей области.
115
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
8 Контрольные тесты
1 Вид наблюдения, при проведении которого статистическому
обследованию подвергаются единицы изучаемой совокупности, отобранные
по специально разработанной схеме, базирующейся, как правило, на
принципе случайности называется:
а) сплошное наблюдение;
б) выборочное наблюдение;
в) комбинированное наблюдение;
г) статистическое наблюдение.
2 Вставьте недостающее слово: Методы выборочных обследований
базируются на принципе, исключающем ____________ проведения отбора
единиц для их последующего изучения по заранее разработанной программе:
а) субъективность;
б) объективность;
в) случайность;
г) принципиальность.
3 При проведении выборочного наблюдения происходит повышение
точности данных вследствие:
а) уменьшения ошибки регистрации;
б) увеличения ошибки регистрации;
в) уменьшения ошибки репрезентативности;
г) увеличения ошибки репрезентативности;
д) уменьшения ошибок регистрации и репрезентативности.
4 Ошибки, обусловленные причинами, действующими в каком-то
одном направлении и искажающими результаты работы (например,
округление цифр, тяготение к полным пятеркам, десяткам и т.д.), являются:
а) случайными ошибками регистрации;
б) систематическими ошибками регистрации;
в) случайными ошибками репрезентативности;
г) систематическими ошибками репрезентативности.
5
Ошибки,
проявляющиеся
в
различных
направлениях,
уравновешивающие друг друга и лишь изредка дающие заметный
суммарный итог, называются:
а) случайными ошибками регистрации;
б) систематическими ошибками регистрации;
в) случайными ошибками репрезентативности;
г) систематическими ошибками репрезентативности.
6 Расхождение между значениями изучаемого признака выборочной и
генеральных совокупностей является:
116
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) ошибкой регистрации;
б) ошибкой совокупности;
в) ошибкой репрезентативности;
г) ошибкой наблюдения.
7 Ошибка, возникающая в силу того, что выборочное статистическое
наблюдение является несплошным наблюдением, и выборка недостаточно
точно воспроизводит (репрезентирует) генеральную совокупность,
называется:
а) случайной ошибкой регистрации;
б) систематической ошибкой регистрации;
в) случайной ошибкой репрезентативности;
г) систематической ошибкой репрезентативности;
д) ошибкой наблюдения.
8 Ошибка, возникающая из-за неправильного, тенденциозного отбора
единиц, при котором нарушается основной принцип научно организованной
выборки - принцип случайности, называется:
а) случайной ошибкой регистрации;
б) систематической ошибкой регистрации;
в) случайной ошибкой репрезентативности;
г) систематической ошибкой репрезентативности;
д) ошибкой наблюдения.
9 Вставьте пропущенное слово: увеличение колеблемости признака
влечет за собой ________ошибки.
а) увеличение;
б) уменьшение;
в) неизменность.
10 Величина, которая показывает насколько выборочная средняя (доля)
может отличаться от генеральной средней (доли) в большую или меньшую
сторону, называется:
а) средняя ошибка выборки;
б) доля выборки;
в) предельная ошибка выборки;
г) средняя ошибка доли;
д) систематическая ошибка.
11 В процессе подготовки выборочного наблюдения следует
стремиться к обеспечению соотношения между единицей отбора и единицей
наблюдения, которое заключается в том, чтобы единица отбора была
_____единицы наблюдения:
а) не больше;
б) не меньше;
117
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) значительно меньше;
г) значительно больше.
12 Представленность всех типов или групп данной генеральной
совокупности в основе выборки называется:
а) полнотой выборки;
б) соответствием выборки;
в) точностью выборки;
г) объективность выборки.
13 Чем больше период, отделяющий время применения данных о
генеральной совокупности от времени, на которое эти данные составлялись,
тем ________вероятность получить характеристику современного состояния
изучаемого объекта.
а) больше;
б) неизвестна;
в) меньше;
г) значительно больше.
14 Что произойдет с величиной предельной ошибки выборки, если
вероятность, гарантирующую результат, уменьшить с 0,954 до 0,683?
а) уменьшится в 2 раза;
б) увеличится в 2 раза;
в) увеличится в 3 раза;
г) уменьшится в 3 раза.
15 Отметьте правильное определение выборочного наблюдения:
а) наблюдение, при котором характеристика всей совокупности единиц
дается по некоторой их части, отобранной в случайном порядке;
б) наблюдения, которые проводятся не постоянно, а через
определенные промежутки времени, либо единовременно;
в) наблюдение, которое проводят систематически, постоянно
охватывая факты по мере их возникновения;
г) наблюдение, при котором характеристика всей совокупности единиц
дается по некоторой их части, отобранной в соответствии с нормативами.
16 Часть единиц совокупности, которая подвергается выборочному
обследованию, называют:
а) генеральной совокупностью;
б) случайной совокупностью;
в) выборочной совокупностью;
г) статистической совокупностью.
17 Неточности, возникающие вследствие нарушения принципов
проведения выборочного наблюдения – это:
118
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) систематические ошибки репрезентативности;
б) преднамеренные ошибки репрезентативности;
в) непреднамеренные ошибки репрезентативности;
г) случайные ошибки репрезентативности.
18 Погрешности, возникающие вследствие того, что выборочная
совокупность не воспроизводит в точности размеры показателей генеральной
совокупности – это:
а) ошибки регистрации;
б) ошибки репрезентативности;
в) арифметические ошибки;
г) логические ошибки.
19 Возможное отклонение показателей выборочной совокупности от
показателей генеральной совокупности измеряют:
а) средним квадратическим отклонением;
б) дисперсией;
в) ошибкой выборки;
г) коэффициентом вариации.
20 Величина ошибки выборки зависит от:
а) величины самого вычисляемого параметра;
б) единиц измерения параметра;
в) объема численности выборки;
г) объема генеральной совокупности.
21 Увеличение доверительной вероятности:
а) увеличивает ошибку выборки;
б) уменьшает ошибку выборки;
в) не оказывает влияния на величину ошибки выборки.
22 Укажите, что произойдет с предельной ошибкой выборки, если
дисперсию ( σ 2 ) уменьшить в 4 раза, численность выборки увеличить в 9 раз,
а вероятность исчисления изменится с 0,683 до 0,997 (t=1 и t =3):
а) уменьшится в 18 раз;
б) увеличится в 9 раз;
в) уменьшится в 2 раза;
г) увеличится в 2 раза;
д) уменьшится в 9 раз.
23 Выборочное наблюдение в сравнении со сплошным позволяет
расширить программу исследования:
а) иногда;
б) да;
в) нет;
119
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
г) при данной постановке вопроса невозможно дать однозначный ответ.
24 Укажите, что произойдет с предельной ошибкой выборки, если
дисперсию увеличить в 4 раза:
а) уменьшится в 2 раза;
б) увеличится в 2 раза;
в) не изменится;
г) результат предсказать невозможно.
25 По выборочным данным (10 %-ный отбор) удельный вес счетов со
сроком пользования кредитом, превышающим 50 дней, в первом банке
составил 5 %, во втором банке 10 %. При одинаковой численности счетов в
выборочной совокупности ошибка выборки больше:
а) в первом банке;
б) во втором банке;
в) ошибки равны;
г) невозможно дать ответ на основе имеющихся данных.
26 Величина ошибка выборки:
а) прямо пропорциональна n ;
б) обратно пропорциональна n ;
в) обратно пропорциональна n ;
г) не связана с n .
27 Вычисленные параметры по выборочной совокупности:
а) характеризуют саму выборку;
б) точно воспроизводят генеральную совокупность;
в) не точно воспроизводят генеральную совокупность;
г) частично характеризуют саму выборку.
28 По данным 5 %-ного выборочного обследования, дисперсия
среднего срока пользования краткосрочным кредитом 1-го банка 144, а 2-го
81. Число счетов 1-го банка в 4 раза больше, чем 2-го. Ошибка выборки
больше:
а) в 1-м банке;
б) во 2-м банке;
в) ошибки одинаковы;
г) предсказать невозможно.
29 По данным выборочного наблюдения оценивается среднее значение
некоторой величины. В каком направлении изменится предельная ошибка
оценки, если доверительная вероятность увеличится:
а) увеличится;
б) уменьшится;
в) не изменится.
120
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
30 Теорема, в которой утверждается, что при достаточно большом
числе независимых наблюдений можно с вероятностью, близкой к единице
(т.е. почти с достоверностью) утверждать, что отклонение выборочной
средней от генеральной будет сколь угодно малым, является:
а) теоремой Чебышева;
б) теоремой Бернулли;
в) теоремой Ляпунова;
г) теоремой Лапласа.
31 Теорема, в которой утверждается, что распределение выборочных
средних (а, следовательно, и их отклонений от генеральной средней) при
достаточно большом числе независимых наблюдений приближенно
нормально при условии, что генеральная совокупность обладает конечной
средней и ограниченной дисперсией, является:
а) теоремой Чебышева;
б) теоремой Бернулли;
в) теоремой Ляпунова;
г) теоремой Лапласа.
32 Теорема, в которой утверждается, что при достаточно большом
объеме выборки вероятность расхождения между долей признака в
выборочной совокупности и» и долей признака в генеральной совокупности
р будет стремиться к единице, является:
а) теоремой Чебышева;
б) теоремой Бернулли;
в) теоремой Ляпунова;
г) теоремой Лапласа.
33 Ошибкой I рода называется:
а) вероятность того, что нулевая гипотеза будет отвергнута, в то время,
когда она в действительности должна быть принята;
б) вероятность того, что нулевая гипотеза будет принята, в то время,
когда в действительности она должна быть отвергнута;
в) вероятность того, что нулевая гипотеза в любом случае будет
отвергнута;
г) вероятность того, что нулевая гипотеза в любом случае будет
принята.
34 Ошибкой II рода называется:
а) вероятность того, что нулевая гипотеза будет отвергнута, в то время,
когда она в действительности должна быть принята;
б) вероятность того, что нулевая гипотеза будет принята, в то время,
когда в действительности она должна быть отвергнута;
в) вероятность того, что нулевая гипотеза в любом случае будет
отвергнута;
121
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
г) вероятность того, что нулевая гипотеза в любом случае будет
принята.
35 При обследовании дневной загрузки продавцов магазина города
отбирался каждый десятый среди продовольственных магазинов и каждый
пятый среди непродовольственных. Укажите способ отбора.
а) простой случайный;
б) механический;
в) серийный;
г) типический;
д) комбинированный.
36 При изучении среднего количества слов в телеграмме отбиралась
каждая 20-тая телеграмма. Укажите способ отбора.
а) простой случайный;
б) механический;
в) серийный;
г) типический;
д) комбинированный.
37 При обследовании бюджета времени работающих отбирается
каждое пятое предприятие из общего списка их отрасли, а затем на
отобранных предприятиях отбирается каждый десятый рабочий или
служащий. Укажите способ отбора.
а) многоступенчатый;
б) механический;
в) серийный;
г) типический;
д) комбинированный.
38 Организуется выборочное обследование наличия у сельского
населения мини-тракторов. Ниже описаны возможные способы отбора. При
каком из них ошибка выборки меньше?
а) отбирается каждый пятый населенный пункт, и в каждом из них
производится сплошное обследование;
б) отбирается каждая пятая семья из общего списка семей;
в) совокупность семей расчленяется на группы, и пропорционально
численности групп производится отбор семей;
г) совокупность семей расчленяется на группы, и пропорционально
объему генеральной совокупности производится отбор семей.
39 Отбор, при котором единицами наблюдения являются качественно
однородные группы или серии, называется:
а) комбинированный;
б) групповой;
122
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) индивидуальный;
г) механический.
40 Отбор, при котором единицами наблюдения являются единицы
исследуемой совокупности, называется:
а) комбинированный;
б) групповой;
в) индивидуальный;
г) механический;
41 Заключительным этапом выборочного обследования является:
а) нахождение предельной ошибки выборки;
б) распространение результатов выборочного наблюдения на
генеральную совокупность;
в) определение параметров выборки;
г) определение объема выборки.
42 Величина предельной ошибки выборки определяется:
а) ∆ =
σ
n
;
б) ∆ = tµ ;
в) ∆ =
µ
.
t
43 Средняя ошибка выборки при случайном бесповторном отборе
определяется по формуле:
а) µ =
б) µ =
в) µ =
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
σ
n
;
δ2
r
г) µ = 1 −
;
σ2
n
.
44 Выборка, при которой отбор производится из всей массы единиц
генеральной совокупности без предварительного расчленения ее на какиелибо группы, и единицы отбора совпадают с единицами наблюдения,
называется:
а) простой случайной;
б) механической;
в) серийной;
г) типической;
д) комбинированной.
123
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
45 Средняя ошибка выборки при случайном повторном отборе
определяется по формуле:
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
а) µ =
б) µ =
σ
;
n
δ2
в) µ =
r
;
σ
г) µ = 1 −
n
.
46 Средняя ошибка доли выборки при случайном бесповторном отборе
определяется по формуле:
w(1 − w) ⎛
n⎞
⎜1 − ⎟ ;
n
⎝ N⎠
а) µ =
w(1 − w)
;
n
w(1 − w)
в) µ =
;
R
w(1 − w)
г) µ = 1 −
.
n
б) µ =
47 Необходимый объем выборки при собственно-случайном
бесповторном и механическом отборе определяется по формуле:
а) n =
б) n =
в) n =
г) r =
д) n =
t2 ⋅σ 2
;
∆2
t 2σ
2
;
2
∆
Nt 2σ
2
N∆ + t 2σ
2
2
;
t 2 ⋅δ 2 ⋅ R
∆2 ⋅ R + t 2 ⋅ δ 2
Nt 2σ
N∆
2
;
2
+ t 2σ
2
.
48 На лесном массиве в 400 га предполагается определить общий запас
древесины. Пробные площади по 0,1 га. На основе предыдущих
обследований известно, что по выходу древесины с 0,1 га σ = 5 м3. Какова
должна быть численность выборки, чтобы ошибка выборки с вероятностью
0,954 не превышала 1
а) 80;
124
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
б) 50;
в) 20;
г) 100.
49 Какова должна быть необходимая численность выборки при
определении среднего вклада населения в отделениях коммерческих банков
города, чтобы с вероятностью 0,954 предельная ошибка выборки не
превысила 50 р.? Ориентировочная дисперсия вкладов равна 200000.
а) 800;
б) 320;
в) 1600;
г) 160.
50 В порядке бесповторной типической выборки в фермерских
хозяйствах области обследовано 625 га посева озимой пшеницы сорта А и
625 га - сорта Б. В результате обследования установлено, что процент зимней
гибели пшеницы сорта А 10 % и сорта Б – 20 %. Обследованная площадь
составляет 19 % всей площади, засеянной этими сортами пшеницы.
Определите ошибку выборки с вероятностью 0,954.
а) 1,8 %;
б) 0,9 %;
в) 2,0 %;
г) 3,6 %.
51 Сколько изделий нужно обследовать при повторном отборе для
определения доли нестандартной продукции с предельной точностью 2 %
при вероятности 0,954? Доля нестандартной продукции по данным пробного
обследования составляет 10 %.
а) 900;
б) 439;
в) 81;
г) 18.
52 В отделениях коммерческого банка обследовано 36 % валютных
счетов вкладчиков. В выборку попало 100 счетов вкладчиков, в том числе:
~
пенсионеров - 60 человек, средний размер вклада Χ =200 долл. при
дисперсии 4800; рабочих и служащих-40 человек, средний размер
~
вклада Χ =250 долл. при дисперсии 8800. Определите среднюю ошибку
типической выборки.
а) 10;
б) 6,4;
в) 4,8;
г) 8,0.
53 По городской телефонной сети произвели 100 наблюдений и
установили, что средняя продолжительность телефонного разговора
125
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
составляет 4 мин. при σ = 2 мин. Ошибка выборки с вероятностью 0,954
равна:
а) 0,2;
б) 0,4;
в) 0,28;
г) 0,14.
54 Сколько изделий необходимо обследовать, чтобы определить долю
брака с точностью до 2 % при вероятности 0,954?
а) 50;
б) 1600;
в) 1250;
г) 2500.
55 В результате типической пропорциональной 1 %-ной выборки в
лесничестве отобрано 50 сосен и 50 елей. Средний диаметр одной сосны в
выборке 136 мм, ели - 120 мм. Общая дисперсия диаметра деревьев в
выборке - 289. Определите ошибку выборки с вероятностью 0,954.
а) 3;
б) 1,5;
в) 1,7;
г) 3,4.
56 По данным 10 %-ного выборочного обследования дисперсия
средней заработной платы сотрудников первого туристического агентства
225, а второго - 100. Численность сотрудников первого турагентства в четыре
раза больше, чем второго. Ошибка выборки больше:
а) в первом туристическом агентстве;
б) во втором туристическом агентстве;
в) ошибки одинаковы;
г) предсказать результат невозможно.
57 По данным 2 %-ного выборочного обследования шести
специализированных
и
десяти
неспециализированных
магазинов
2
товарооборот в среднем на 1 м площади торгового зала составил: в
специализированных магазинах - ~х =1500 р. при дисперсии 8200, в
неспециализированных - ~х =1100 р. при дисперсии 5320. Определите
ошибку выборки для среднего товарооборота на 1 м площади торгового зала
с вероятностью 0,954.
а) 58;
б) 19;
в) 41;
г) 40.
58 По данным выборочного обследования жирности молока (16 проб)
средняя жирность молока ~х =3,8 % при дисперсии 0,64. Ошибка выборки для
126
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
средней жирности молока с вероятностью 0,683 равна:
а) 0,16;
б) 0,2;
в) 0,05;
г) 0,04.
59 По данным 10 %-ного выборочного обследования дисперсия
среднего выполнения норм выработки рабочих первого предприятия 25,
второго - 49. Численность рабочих на втором предприятии в четыре раза
больше, чем на первом. Пределы среднего выполнения норм выработки в
генеральной совокупности шире:
а) на первом предприятии;
б) на втором предприятии;
в) пределы одинаковы;
г) разницу пределов предсказать нельзя.
60 На машиностроительном предприятии рабочие распределены по 100
производственным бригадам. Численности рабочих в бригадах одинаковые.
Методом бесповторной выборки отобрали 36 бригад. По данным выборки
средний производственный стаж рабочих - семь лет. Межсерийная дисперсия
равна 9. Определите ошибку выборки с вероятностью 0,954.
а) 2,4;
б) 0,4;
в) 0,8;
г) 1,0.
61 В 19 %-ной выборке удельный вес отличников среди обследованных
400 студентов составил 20 %. Ошибка выборки для доли студентовотличников с вероятностью 0,954 равна:
а) 4,0 %;
б) 3,6 %;
в) 1,8 %;
г) 1,44 %.
62 По данным предыдущих обследований средний процент влажности
некоторого продукта А ~х =14 % при σ = 2 %. Сколько проб необходимо
проанализировать, чтобы средняя ошибка выборки при определении
среднего процента влажности не превышала 0,1 %?
а) 20;
б) 40;
в) 400;
г) 100.
63 При одинаковой доле выборки среднее квадратическое отклонение
урожайности озимой пшеницы в первом хозяйстве 4 ц, во втором - 5 ц.
127
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Посевная площадь во втором хозяйстве вдвое больше, чем в первом. Ошибка
выборки больше:
а) в первом хозяйстве;
б) во втором хозяйстве;
в) ошибки одинаковы;
г) предсказать результат невозможно.
64 На основе выборочного обследования на почтамте требуется
определить долю писем "авиа". Результаты выборки необходимо дать с
точностью до 2 % и гарантировать с вероятностью 0,954. Какова должна
быть необходимая численность выборки?
а) 196;
б)50;
в) 2500;
г) 1250.
65 По данным обследования бюджетов домашних хозяйств служащих
одной из отраслей среднегодовой уровень потребления молока 120 кг при
µ=2,0 кг. С какой вероятностью можно гарантировать, что средний уровень
потребления молока не меньше 114 кг и не больше 126 кг ?
а) 0,954;
б) 0,997;
в) 0,683;
г) 0,900.
66 По данным выборочного обследования 25 строительных фирм (2 %ный отбор) среднее время оборота оборотных средств равно 52 дням при σ =
10 дней. Ошибка выборки для среднего времени оборота оборотных средств
с вероятностью 0,954 равна:
а) 0,8;
б) 4;
в) 2;
г) 1,9.
67 По данным 1 %-ного выборочного обследования затраты времени на
ведение домашнего хозяйства летом составили в среднем за сутки: для
мужчин - ~х =180 мин. при дисперсии 4400, для женщин - ~х =240 мин. при
дисперсии 3150. В выборку попали: женщин - 144, мужчин - 81. Определите
ошибку выборки для средних затрат времени на ведение домашнего
хозяйства с вероятностью 0,954.
а) 8;
б) 3,8;
в) 11,2;
г) 6,2.
128
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
68 По данным 2 %-ного выборочного обследования (n=100) доля
сотрудников коммерческих банков города, имеющих стаж работы в банке
менее одного года, равна 10 %. Ошибка выборки для доли рабочих, имеющих
стаж работы в банке менее одного года, с вероятностью 0,954 равна:
а) 0,6 %;
б) 6 %;
в) 0,9 %;
г) 1,8 %.
69 Проверено 16 проб молока, поступившего на молочный завод для
дальнейшей переработки. Средняя жирность молока в пробах ~х =3,8 % при
σ =0,4 %. Какова вероятность того, что средняя жирность поступившего
молока не выйдет за пределы 3,7 - 3,9 % ?
а) 0,954;
б) 0,683;
в) 0,900;
г) 0,997.
70 По данным 2 %-ного выборочного обследования (n=100) средний
стаж работы сотрудников туристических агентств города по специальности
равен шести годам при коэффициенте вариации υ=30 %. Относительная
ошибка выборки для среднего стажа работы сотрудников туристических
агентств с вероятностью 0,954 равна:
а) 0,3 %;
б) 3 %;
в) 5 %;
г) 6 %.
71 По данным 1 %-ного выборочного обследования бюджетов 100
домашних хозяйств служащих отрасли: а) средний размер домохозяйства 3,2 человека при µ= 0,024; б) среднее число работающих в домохозяйстве 1,5 человека при µ=0,018. Относительная ошибка выборки:
а) больше для среднего размера домохозяйства;
б) больше для среднего числа работающих;
в) ошибки равны;
г) данные не позволяют сделать вывод.
72 Средняя ошибка выборки для доли бракованных товаров 2 %, доля
бракованных товаров в выборке – 3 %. С какой вероятностью можно
утверждать, что доля бракованных товаров в генеральной совокупности не
превышает 7 %?
а) 0,683;
б) 0,954;
в) 0,997;
г) 0,900.
129
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
73 С фабрики на склад оптовой коммерческой фирмы поступило 1000
пальто. Все пальто согласно сопроводительным документам числились
первосортными. Однако в результате контрольной проверки 100 пальто,
отобранных в случайном порядке (бесповторная выборка), оказалось, что два
пальто следует перевести во второй сорт. С какой вероятностью можно
утверждать, что доля пальто второго сорта во всей партии не более 4,66 %?
а) 0,900;
б) 0,954;
в) 0,997;
г) 0,683.
74 По данным выборочного обследования продолжительности горения
электрических лампочек для n=16 получили, что средняя продолжительность
горения 1240 ч. при σ=24 ч. С какой вероятностью можно утверждать, что
средняя продолжительность горения электрических лампочек не меньше
1228 ч. и не больше 1252 ч.?
а) 0,683;
б) 0,900;
в) 0,954;
г) 0,997.
75 Для определения размера естественной убыли товара А были
подвергнуты выборочному обследованию 64 равные по весу партии этого
товара. В результате обследования оказалось, что средний процент
естественной убыли ~х =0,8 % при σ=0,2 %. С какой вероятностью можно
утверждать, что процент естественной убыли товара А не превышает 0,85 %?
а) 0,683;
б) 0,900;
в) 0,954;
г) 0,997.
76 Дисперсия доли единиц, обладающих данным признаком в
выборочной совокупности, определяется по формуле:
а) σ w2 = σ i2 + δ x2 ;
б) σ w2 =
∑ (x
i
− x )2
n
2
в) σ w = w(1 − w) ;
г) σ w
2
∑σ n ;
=
∑n
∑ (~x − ~x )
=
;
2
i i
i
2
д) σ
2
w
i
r
.
77 Отбор единиц в выборочную совокупность из генеральной, разбитой
по нейтральному признаку на равные интервалы (группы), который
130
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
производится таким образом, что из каждой такой группы в выборку
отбирается лишь одна единица, называется:
а) серийным;
б) случайным;
в) типическим;
г) механическим;
д) комбинированным.
78 Необходимый объем выборки при собственно-случайном повторном
отборе определяется по формуле:
а) n =
б) n =
в) n =
г) r =
д) n =
t 2 ⋅σ 2
;
∆2
t 2σ
2
;
2
∆
Nt 2σ
N∆
2
2
+ t 2σ
2
t 2 ⋅δ 2 ⋅ R
∆2 ⋅ R + t 2 ⋅ δ 2
Nt 2σ
N∆
2
;
;
2
+ t 2σ
2
.
79 При 2 %-ной механической выборке отбирается и проверяется
каждая:
а) 10-тая единица;
б) 20-тая единица;
в) 30-тая единица;
г) 40-ая единица;
д) 50-тая единица.
80 Для определения средней ошибки механической
используют формулы:
а) типической выборки;
б) серийной выборки;
в) собственно-случайной повторной выборки;
г) собственно-случайной бесповторной выборки.
выборки
81 Отбор единиц в выборочную совокупность из генеральной, разбитой
на качественно однородные группы, называется:
а) механическим;
б) собственно-случайным;
в) типическим;
г) серийным;
131
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
д) комбинированным.
82 Средняя ошибка выборки при типическом повторном отборе
определяется по формуле:
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
а) µ =
б) µ =
в) µ =
г) µ =
σ
;
n
δ2
;
r
σ2
;
n
σ2⎛
n⎞
⎜1 − ⎟ .
n ⎝ N⎠
д) µ =
83 Средняя ошибка выборки при определении доли в типическом
повторном отборе, пропорциональном объему типических групп
определяется по формуле:
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
а) µ =
wi (1 − wi ) ⎛
n⎞
⎜1 − ⎟ ;
n
⎝ N⎠
б) µ w =
в) µ =
г) µ w =
δ2
;
r
wi (1 − wi )
;
n
σ2⎛
n⎞
⎜1 − ⎟ .
n ⎝ N⎠
д) µ =
84 Средняя ошибка выборки при типическом бесповторном отборе,
пропорциональном объему типических групп, определяется по формуле:
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
а) µ =
б) µ =
в) µ =
г) µ =
д) µ =
132
σ
n
;
δ2
r
σ2
n
;
;
σ2⎛
n⎞
⎜1 − ⎟ .
n ⎝ N⎠
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
85 При типической выборке, пропорциональной объему типических
групп, число единиц, подлежащих отбору из каждой группы, определяется по
формуле:
а) ni = n ⋅
б) n i = n
∑σ
i
Ni
σ i Ni
∑σ i Ni
в) ni =
г) ni =
Ni
;
N
σ i Ni
∑σ n
∑n
2
i i
;
;
.
i
86 Случайный отбор из генеральной совокупности не отдельных
единиц, а их равновеликих групп, с тем, чтобы в таких группах подвергать
наблюдению все без исключения единицы называется:
а) механическим;
б) собственно-случайным;
в) типическим;
г) серийным;
д) комбинированным.
87 Средняя ошибка выборки при типическом бесповторном отборе,
пропорциональном дифференциации признака, определяется по формуле:
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
а) µ =
1
N
б) µ =
δ2
в) µ =
г) µ =
∑
r
1
N
σ i2 N i2
ni
;
;
∑
σ i2 N i2 ⎛
ni
n
⎜⎜1 − i
⎝ Ni
⎞
⎟⎟ ;
⎠
σ2⎛
n⎞
⎜1 − ⎟ .
n ⎝ N⎠
д) µ =
88 Средняя ошибка выборки при типическом повторном отборе,
пропорциональном дифференциации признака, определяется по формуле:
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
а) µ =
б) µ =
1
N
∑
σ i2 N i2
ni
;
133
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
δ2
в) µ =
г) µ =
;
r
1
N
∑
n ⎞
⎜⎜1 − i ⎟⎟ ;
⎝ Ni ⎠
σ i2 N i2 ⎛
ni
σ2⎛
n⎞
⎜1 − ⎟ .
n ⎝ N⎠
д) µ =
89 Средняя ошибка доли при типическом бесповторном отборе,
определяется по формуле:
wi (1 − wi )
;
n
а) µ w =
w(1 − w) ⎛
n⎞
⎜1 − ⎟ ;
n
⎝ N⎠
в) µ x = w(1 − w) ;
б) µ w =
wi (1 − wi ) ⎛
n⎞
⎜1 − ⎟ ;
n
⎝ N⎠
г) µ w =
w(1 − w)
.
n
д) µ w =
90 Средняя ошибка выборки при серийном повторном отборе
определяется по формуле:
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
а) µ =
б) µ =
в) µ =
1
N
∑
δ2
∑
σ2
д) µ =
ni
;
;
r
1
г) µ =
N
σ i2 N i2
n
n ⎞
⎜⎜1 − i ⎟⎟ ;
⎝ Ni ⎠
σ i2 N i2 ⎛
ni
.
91 Средняя ошибка выборки при серийном бесповторном отборе
определяется по формуле:
σ2 ⎛
n⎞
⎜1 − ⎟ ;
n ⎝ N⎠
а) µ =
б) µ =
134
1
N
∑
σ i2 N i2
ni
;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
δ2
в) µ =
г) µ =
;
r
1
N
д) µ =
∑
σ2
n ⎞
⎜⎜1 − i ⎟⎟ ;
r ⎝ Ni ⎠
δ2 ⎛
.
n
92 Межгрупповая дисперсия серийной выборки рассчитывается по
формуле:
а) σ
2
w
∑ (x
=
− x )2
i
;
n
∑σ n ;
∑n
∑ (~x − ~x )
=
2
i i
б) σ w 2 =
i
в) σ
2
w
2
i
;
r
г) σ w2 = σ i2 + δ x2 .
93 Необходимый объем выборки при типическом бесповторном отборе
определяется по формуле:
а) n =
Nt 2σ ~х
2
N∆ ~х + t 2σ ~х
2
2
;
б) r =
t 2 ⋅ δ ~x2 ⋅ R
;
∆2~x ⋅ R + t 2 ⋅ δ ~x2
в) n =
Nt 2σ ~х
;
2
2
N∆ ~х + t 2σ ~х
2
t 2σ ~х
г) n =
;
2
∆ ~х
2
д) n =
t 2σ ~х
.
2
∆ ~х
2
94 Необходимый объем выборки при типическом повторном отборе
определяется по формуле:
Nt 2σ ~х
;
а) n =
2
2
N∆ ~х + t 2σ ~х
2
б) r =
t 2 ⋅ δ ~x2 ⋅ R
;
∆2~x ⋅ R + t 2 ⋅ δ ~x2
в) n =
Nt 2σ ~х
;
2
2
N∆ ~х + t 2σ ~х
2
t 2σ ~х
г) n = 2 ;
∆ ~х
2
135
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
д) n =
t 2σ ~х
.
2
∆ ~х
2
95 При обследовании дневной загрузки продавцов магазинов отбирался
каждый десятый среди продовольственных магазинов и каждый пятый среди
непродовольственных. Какой способ отбора в данном случае применялся?
а) случайный;
б) серийный;
в) механический;
г) типический;
д) комбинированный.
96 Отбор, при котором на каждой ступени используются разные
единицы отбора: более крупные – на начальных ступенях, на последней
ступени единица отбора совпадает с единицей наблюдения, называется:
а) многофазным;
б) многоступенчатым;
в) комбинированным.
97 Отбор, который предполагает сохранение одной и той же единицы
отбора на всех этапах его проведения, при этом отобранные на каждой
стадии единицы подвергаются обследованию (на каждой последующей
стадии отбора программа обследования расширяется), называется:
а) многофазным;
б) многоступенчатым;
в) комбинированным.
г) серийным.
98 Необходимый объем выборки при серийном повторном отборе
определяется по формуле:
а) r =
t 2 ⋅ δ ~x2
∆2~x
;
t 2σ ~
б) n = х2 ;
∆ ~х
2
в) n =
t 2σ ~х
;
2
∆ ~х
2
2
t σ~
г) n = х .
∆ ~х
99 Необходимый объем выборки при серийном бесповторном отборе
определяется по формуле:
а) r =
136
t 2 ⋅ δ ~x2 ⋅ R
∆2~x ⋅ R + t 2 ⋅ δ ~x2
;
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
б) n =
Nt 2σ ~х
;
2
2
N∆ ~х + t 2σ ~х
2
Nt 2σ ~х
в) n =
;
2
2
N∆ ~х + t 2σ ~х
2
г) r =
t ⋅ δ 2~x ⋅ R
.
∆ ~x ⋅ R + t ⋅ δ 2~x
100 Объем выборочной совокупности определяется на стадии:
а) осуществления выборочного наблюдения;
б) проектирования выборочного наблюдения;
в) распространения результатов выборочного наблюдения
генеральную совокупность;
г) анализа результатов выборочного наблюдения.
101 Расчет объема выборки (n) осуществляют по
бесповторного отбора, если в результате расчета n доля отбора:
а) превысит 5 %;
б) будет меньше 5 %;
в) будет равна 5 %.
на
формуле
102 Многофазный отбор целесообразно применять, если соотношение
между рассчитанными объемами выборки составляет:
а) 1:5;
б) 1:6;
в) 1:7;
г) 1:3.
103 Объем многоступенчатой выборки рекомендуется увеличивать по
отношению к рассчитанной численности:
а) не более чем на 10 %;
б) не менее чем на 10 %;
в) на 10 %.
104 Несопоставимость данных возникает при выборочном
обследовании:
а) когда неверно составлена программа выборочного обследования;
б) в момент распространения результатов на генеральную
совокупность;
в) всегда;
г) когда неверно определен объем выборки.
105 Несопоставимость, возникающая из-за проведения обследования в
различные периоды времени, является:
а) территориальной;
137
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
б) моментной;
в) хронологической;
г) статистической;
д) выборочной.
106 Несопоставимость, возникающая из-за проведения обследования на
различных территориях, является:
а) территориальной;
б) моментной;
в) хронологической;
г) статистической;
д) выборочной.
107 Наличие или представленность всех типов или групп данной
генеральной совокупности в основе выборки называется:
а) сопоставимостью;
б) полнотой;
в) основой;
г) точностью;
д) единством.
108 Укажите способы отбора единиц в выборочную совокупность из
генеральной:
а) собственно-случайный;
б) механический;
в) монографический;
г) серийный;
д) типический;
е) анкетный.
109 Укажите, при каком виде выборки обеспечивается наибольшая
репрезентативность:
а) серийной;
б) случайной;
в) типической;
г) механической;
д) многофазной.
110 Величина ошибки выборки при типическом отборе меньше,
поскольку в ее расчете используется:
а) общая дисперсия признака;
б) межгрупповая дисперсия;
в) средняя из внутригрупповых дисперсий;
г) внутригрупповая дисперсия.
138
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
111 Средняя ошибка выборки при серийном отборе зависит только от:
а) общей дисперсии;
б) межгрупповой дисперсии;
в) внутригрупповой дисперсии;
г) выборочной средней.
112 При распространении результатов выборочного наблюдения на
генеральную совокупность, исходят из того, что все средние и
относительные показатели, полученные по выборке, являются:
а) смещенными и эффективными характеристиками генеральной
совокупности;
б) несмещенными характеристиками генеральной совокупности;
в) несмещенными и эффективными характеристиками генеральной
совокупности;
г) эффективными характеристиками генеральной совокупности.
113 Процесс восстановления пропорций выборки на основе исходной
информации о пропорциях в генеральной совокупности принято называть:
а) корректировкой выборки;
б) восстановлением выборки;
в) заменой выборки;
г) созданием выборки.
114 К методам распространения результатов выборочного наблюдения
на генеральную совокупность относятся:
а) способ коэффициентов;
б) прямой пересчет;
в) способ моментов;
г) способ условного нуля;
д) метод наименьших квадратов.
115 Способ распространения результатов выборочного наблюдения на
генеральную совокупность, который заключается в умножении среднего
значения признака, найденного в результате выборочного наблюдения, на
объем генеральной совокупности, называется:
а) метод средних показателей;
б) способ прямого пересчета;
в) способ коэффициентов;
г) способ обратного пересчета.
116 В случае, когда выборочное наблюдение проводится с целью
проверки и уточнения данных сплошного наблюдения, в частности
численности учтенных единиц совокупности для распространения
результатов выборочного наблюдения на генеральную совокупность
применяется:
139
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) способ коэффициентов;
б) способ прямого пересчета;
в) способ моментов;
г) способ обратного пересчета.
117 При уточнении данных сплошного наблюдения на основе
контрольных выборочных мероприятий поправка на недоучет наиболее
широко применяется в обследованиях относительно совокупностей, когда их
объем не превышает:
а) нескольких десятков единиц;
б) нескольких тысяч единиц;
в) нескольких единиц;
г) несколько сотен единиц.
118 Исследуемая партия состоит из 5 тыс. деталей. Предполагается, что
партия деталей содержит 8 % бракованных. Определите необходимый объем
выборки, чтобы с вероятностью 0,997 установить долю брака с
погрешностью не более 2 %:
а) 1650;
б) 1244;
в) 1300;
г) 1444.
119 Организуется выборочное обследование наличия у сельского
населения мини-тракторов. Ниже описаны возможные способы отбора. При
каком из них ошибка выборки меньше?
а) отбирается каждый пятый населенный пункт, и в каждом из них
производится сплошное обследование;
б) отбирается каждая пятая семья из общего списка семей;
в) совокупность семей расчленяется на группы, и пропорционально
численности групп производится отбор семей;
120 Малой выборкой называется выборочное наблюдение, объем
которого:
а) не превышает 30 единиц;
б) не превышает 40 единиц;
в) не превышает 50 единиц;
г) не превышает 20 единиц.
121 При оценке результатов малой выборки в расчетах не используется
величина:
а) генеральной средней;
б) генеральной дисперсии;
в) коэффициента доверия;
г) выборочной средней.
140
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
122 Для определения возможных пределов σ ошибки в малой выборке
пользуются критерием:
а) Стьюдента;
б) Хи-квадрат;
в) Фишера-Снедокера;
г) Лапласа.
123 Мера случайных колебаний выборочной средней в малой выборке
определяется по формуле:
а) µ МВ =
б)
µ МВ =
в) µ МВ =
г) µ МВ
σ
n −1
σ2
n −1
σ
;
;
;
n
σ
= 1− .
n
124 При малой выборке вероятная оценка:
а) несколько больше, чем при большой выборке;
б) несколько меньше, чем при большой выборке;
в) такая же, как и при большой выборке;
г) зависит от случая.
125 Выводы по результатам малой выборки имеют практическое
значение лишь при условии, что распределение признака в генеральной
совокупности:
а) отличается от нормального;
б) близко к нормальному;
в) является нормальным;
г) асимптотически нормальное.
126 Точность результатов выборки малого объема по сравнению с
выборками большого объема:
а) ниже;
б) выше;
в) равна.
127 При проверке веса импортируемого груза на таможне методом
случайной повторной выборки было отобрано 200 изделий. В результате был
установлен средний вес изделия – 30 грамм при среднеквадратическои
отклонении 4 грамма. С вероятностью 0,997 (t=3) определите предельную
ошибку выборки.
а) 0,96;
141
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
б) 0,78;
в) 0,84;
г) 0,94.
128 В 100 туристических агентствах города предполагается провести
обследование среднемесячного количества реализованных путевок методом
механического отбора. Какова должна быть численность выборки, чтобы с
вероятностью 0,683 ошибка выборки не превышала 3 путевки, если по
данным пробного обследования дисперсия составляет 225?
а) 15 агентств;
б) 20 агентств;
в) 25 агентств;
г) 30 агентств.
129 Для определения скорости расчетов с кредиторами предприятий
корпорации в коммерческом банке была проведена случайная выборка 100
платежных документов, по которым средний срок перечисления и получения
денег оказался равным 22 дням и дисперсией, равной 36. С вероятностью
0,954 определите предельную ошибку выборки.
а) 1,02;
б) 1,2;
в) 1,4.
130 Для определения среднего возраста 1200 студентов факультета
необходимо провести выборочное обследование методом случайного
бесповторного отбора. Предварительно установлено, что дисперсия равна
100. Сколько студентов нужно обследовать, чтобы с вероятностью 0,954
средняя ошибка выборки не превышала 3 года?
а) 25;
б) 34;
в) 39;
г) 43.
131 С целью определения средних затрат времени при поездках на
работу населения города планируется выборочное обследование на основе
случайного повторного отбора. Сколько людей должно быть обследовано,
чтобы с вероятностью 0,954 ошибка выборочной средней не превышала 1
минуты при среднем квадратическом отклонении 15 минут?
а) 720;
б) 850;
в) 900;
г) 1000.
132 Среди выборочного обследованных 1000 семей региона по уровню
душевого дохода (выборка 2 %-ная, механическая) малообеспеченных
142
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
оказалось 300 семей. С вероятностью 0,997 предельная ошибка доли
обеспеченных семей составит:
а) 0,014;
б) 0,14;
в) 0,025.
133 Какова должна быть численность рабочих, которую необходимо
отобрать в выборочную совокупность с тем, чтобы при изучении их средней
заработной платы предельная ошибка выборки не превышала 30 р. с
вероятностью 0,997, если по данным предыдущего обследования среднее
квадратическое отклонение составило 70 р.
а) 40 человек;
б) 50 человек;
в) 49 человек;
г) 59 человек.
134 В городе проживает 100 тыс. человек. Какова должна быть
численность выборки для определения доли населения со среднедушевыми
денежными доходами до 1500 р. в месяц, чтобы с вероятностью 0,997 ошибка
выборки не превышала 2 %, если на основе предыдущих обследований
известно, что дисперсия равна 0,24?
а) 5153 чел.;
б) 5000 чел;
в) 5264 чел.
135 Для выявления причин постоев рабочих завода, численность
которых составляет 1000 человек, необходимо провести типическую выборку
по различным цехам. Какое число рабочих необходимо исследовать, чтобы с
вероятностью 0,997 ошибка выборки не превышала 5 %, если из ранее
проведенных обследований известно, что дисперсия типической выборки
1600?
а) 360 чел.:
б) 365 чел.;
в) 370 чел.
136 В финансовой корпорации и ее филиалах 2000 сотрудников. Из них
1500 мужчин и 500 женщин. С целью определения доли сотрудников со
стажем работы на данном предприятии более 5 лет планируется провести
типическую выборку с пропорциональным отбором. Отбор внутри групп
механический. Какое число сотрудников (мужчин и женщин) необходимо
отобрать, чтобы с вероятностью 0,683, ошибка выборки не превышала 3 %,
если на основе предыдущего обследования известно, что дисперсия
типической выборки 2100?
а) 157 мужчин и 52 женщины;
б) 160 мужчин и 60 женщин;
143
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) 167 мужчин и 62 женщины;
г) 52 мужчины и 157 женщины.
137 В партии семян, разбитой на 40 равных по величине серий,
методом случайного бесповторного отбора было проверено 8 серий на
всхожесть. В результате обследования установлено, что доля взошедших
семян составляет 75 %. Межсерийная дисперсия равна 900. Определите
необходимую численность выборки, чтобы с вероятностью 0,683 ошибка
выборки не превышала 10 %.
а) 20;
б) 30;
в) 40;
г) 50.
138 В механическом цехе завода имеется 10 бригад по 20 рабочих в
каждой бригаде. Для установления квалификации рабочих цеха
проектируется серийная выборка методом механического отбора. Какое
количество бригад необходимо отобрать, чтобы с вероятностью 0,954
ошибка выборки не превышала 1,0, если на основе предыдущих
обследований известно, что дисперсия серийной выборки 0,9?
а) 3 бригады;
б) 5 бригад;
в) 7 бригад;
г) 9 бригад.
139 На заводе, имеющем 200 бригад, проектируется серийная выборка
для установления доли рабочих завода, выполняющих норму выработки.
Требуется определить необходимую численность выборки, чтобы с
вероятностью 0,954 предельная ошибка выборки не превышала 5 %, если
межсерийная дисперсия доли 225.
а) 50 бригад;
б) 40 бригад;
в) 30 бригад.
140 Изготовлено 1600 единиц. Проверено 25 %, из них 16 оказались
бракованными. В каких пределах находится доля бракованных изделий во
всей партии при вероятности 0,954?
а) 2,3-5,7;
б) 2-5;
в) 3,4-5,8;
г) 3-6.
141 В районе 10 тыс. семей. Из них 5 тыс. – семьи рабочих, 1 тыс. –
семьи служащих, 4 тыс. – семьи фермеров. Для определения среднего
размера семьи района проектируется типическая выборка со случайным
144
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
бесповторным отбором внутри типических групп. Какое число семей
необходимо отобрать, чтобы с вероятностью 0,954 ошибка выборки не
превышала 0,5 человека, если на основе предыдущих обследований известно,
что дисперсия 9?
а) 141 семья;
б) 142 семьи;
в) 143 семьи;
г) 144 семьи.
142 В одном из лесничеств методом случайно выборки обследовано
1000 деревьев с целью установления их среднего диаметра, который оказался
равным 210 мм со средним квадратическим отклонением 126,5 мм. С
вероятностью 0,683 определите пределы среднего диаметра деревьев в
генеральной совокупности.
а) 200-220;
б) 204-216;
в) 206-214;
г) 208-212.
143 По данным выборочного обследования 10000 пассажиров
пригородных поездов, средняя дальность поездки – 32,4 км,
среднеквадратическое отклонение – 15 км. Определить пределы средней
дальности поездки с вероятностью 0,954.
а) 30,1-32,7;
б) 32,1-32,7;
в) 32,0-32,8.
144 По данным выборочного обследования продолжительности
телефонных разговоров по городской телефонной сети (100 наблюдений)
установили, что средняя продолжительность телефонного разговора – 4
минуты при среднем квадратическом отклонении 2 минуты. С вероятностью
0,954 определите продолжительности телефонных разговоров.
а) 3,6-4,4 минуты;
б) 4,0-4,4 минуты;
в) 0,4-4,4 минуты;
г) 4,4-5,6 минуты.
145 Методом случайной повторной выборки было взято для проверки
на вес 200 шт. деталей. В результате был установлен средний вес детали 30 г.
При среднем квадратическом отклонении 4 г. С вероятностью 0,954
требуется определить пределы, в которых находится средний вес деталей в
генеральной совокупности.
а) 29,0-31;
б) 29,43-30,57;
в) 29,6-30,4.
145
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
146 По данным выборочного обследования доля рабочих, имеющих
стаж работы менее 1 года – 10 %. С вероятностью 0,954 исчислите
предельную ошибку выборки для доли рабочих, имеющих стаж работы менее
1 года. В выборку попало 100 рабочих.
а) 0,6;
б) 6;
в) 0,9;
г) 1,8;
д) 9.
147 Отобрано 100 проб. Средняя влажность в выборочной
совокупности 15 %. Среднее квадратическое отклонение 10 %. Предельная
ошибка выборки 1 %. Определить вероятность:
а) 0,954;
б) 0,683;
в) 0,997;
г) 0,960.
148 С какой вероятностью можно утверждать, то предельная ошибка
при определении роста цен в настоящем периоде не превысит 40 %, при
среднем квадратическом отклонении 200 % по 100 наиболее необходимым
товарам и услугам:
а) 0,683;
б) 0,997;
в) 0,954;
г) 0,960.
149 С какой вероятностью можно утверждать, то предельная ошибка
при определении доли женского труда на предприятии не превысит 13 %,
если из 100 обследованных человек 75 женщин.
а) 0,683;
б) 0,954;
в) 0,997;
г) 0,866.
150 С какой вероятностью можно утверждать, что средняя
продолжительность разговора жителей города не отклонится от
продолжительности 100 обследованных человек более, чем на 5 минут, при
среднем квадратическом отклонении 25 минут?
а) 0,683;
б) 0,954;
в) 0,997;
г) 0,866.
151
146
Равная
вероятность
попадания
единиц
в
выборочную
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
совокупность:
а) основной принцип собственно-случайной выборки;
б) основной принцип серийной выборки;
в) основной принцип любой случайной выборки;
г) основной принцип типической выборки.
152 Какие единицы обследуются внутри каждой серии при серийном
отборе:
а) все серии;
б) отобранные собственно-случайным способом;
в) отобранные собственно-случайным или механическим способом;
г) отобранные механическим способом.
153 Для каких способов формирования выборочной совокупности
предельная ошибка выборки определяется по одним и тем же формулам:
а) собственно-случайного и механического;
б) собственно-случайного и типического;
в) собственно-случайного и серийного;
г) типического и механического.
154 Какие единицы обследуются внутри групп при типическом отборе:
а) все единицы;
б) отобранные собственно-случайным способом;
в) отобранные собственно-случайным или механическим способом;
г) отобранные механическим способом.
155 Какова должна быть необходимая численность выборки при
определении среднего вклада населения в отделениях коммерческих банков
города, чтобы с вероятностью 0,954 предельная ошибка выборки не
превысила 50 р.? Ориентировочная дисперсия вкладов равна 200000.
а) 800;
б) 320;
в) 1600;
г) 160.
156 В городе А проживает 10 тыс. семей. С помощью механической
выборки предполагается определить долю семей с тремя детьми и более.
Какова должна быть численность выборки, чтобы с вероятностью 0,954
ошибка выборки не превышала 0,02, если на основе предыдущих
обследований известно, что дисперсия равна 0,2?
а) 1667;
б) 2000;
в) 1000;
г) 1600.
147
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
157 В городе А с целью определения средней продолжительности
поездки населения на работу предполагается провести выборочное
обследование методом случайного отбора. Какова должна быть численность
выборки, чтобы с вероятностью 0,997 ошибка выборочной средней не
превышала 5 минут при среднем квадратическом отклонении 20 мин.?
а) 125;
б) 144;
в) 315;
г) 425.
158 Какая категория шире:
а) несплошное наблюдение;
б) выборочное наблюдение;
в) статистическое наблюдение;
д) сплошное наблюдение.
159 При проведении выборочного наблюдения определяют:
а) численность выборки, при которой предельная ошибка не превысит
допустимого уровня;
б) число единиц совокупности, которые остались вне сплошного
наблюдения;
в) тесноту связи между отдельными признаками, характеризующими
изучаемое явление;
г) вероятность того, что ошибка выборки не превысит заданную
величину;
д) величину возможных отклонений показателей генеральной
совокупности от показателей выборочной совокупности.
160 С вероятностью 0,95 (t = 1,96) можно утверждать, что доля браков
«вдогонку» в регионе не превышает … %, если среди выборочно
обследованных 400 браков 20 браков оказались браками «вдогонку».
а) 7;
б) 5;
в) 3;
г) 9.
161 Объем повторной случайной выборки увеличится в … раза (с
точностью до 0,01), если вероятность, гарантирующую результат, увеличить
с 0,954 (t = 2) до 0,997 (t = 3). Формула для расчета объема выборки:
n=
t 2 ⋅σ 2
.
∆2
а) 2,25;
б) 3;
в) 9;
г) 4.
148
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
162 Средняя площадь в расчете на одного жителя (с точностью до 0,01
м ) в генеральной совокупности находится в пределах … м2 при условии:
средняя площадь, приходящаяся на одного жителя, в выборке составила 19
м2; средняя ошибка выборки равна 0,23 м2; коэффициент доверия t = 2 (при
вероятности 0,954).
а) от 18,54 до 19,46;
б) от 18 до 19;
в) от 20 до 21;
г) от 17,5 до 19,5.
2
163 Доля людей, не обеспеченных жильем, в генеральной совокупности
с вероятностью 0,954 (коэффициент доверия t = 2) находится в пределах … %
при условии: доля людей, не обеспеченных жильем в соответствии с
социальными нормами, составляет в выборке 10 %; средняя ошибка выборки
равна 0,1 %.
а) от 9,8 до 10,2;
б) от 10 до 11;
в) от 9 до 10;
г) от 12 до 13,4.
164 Какая выборка может быть реализована только на основе
бесповторного отбора:
а) собственно-случайная;
б) механическая;
в) типическая;
г) серийная.
165 Недостающим элементом в формуле расчета объема выборки при
бесповторном случайном отборе (оценивается среднее значение признака)
t 2 × N × ...
является:
n=
N × ∆2 + t 2 × σ 2
а) σ ;
б) σ 2 ;
в) ∆ ;
г) ∆2 ;
n
д) ⎛⎜1 − ⎞⎟ .
⎝
N⎠
166 Репрезентативность результатов выборочного наблюдения зависит
от ...
а) численности генеральной совокупности;
б) вариации признака;
в) способа формирования выборочной совокупности;
г) объема выборки;
д) определения границ объекта исследования.
149
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
167 Для расчета средней ошибки выборки используют формулу
µ=
σ
n −1
при:
а) наличии высокого уровня вариации признака;
б) изучении качественных характеристик явлений;
в) малой выборке;
г) уточнении данных сплошного наблюдения.
168 Недостающим элементом формулы предельной ошибки случайной
выборки при бесповторном отборе является: ... ×
σ2 ⎛
n⎞
⎜1 − ⎟
n ⎝
N⎠
а) t;
б) t2;
в) n2;
г) n;
д) N.
169 Средняя ошибка выборки (µ) характеризует:
а) вариацию признака;
б) тесноту связи между двумя факторами;
в) среднюю величину всех возможных расхождений выборочной и
генеральной средней;
г) среднее значение признака;
д) ошибку репрезентативности.
170 К задачам выборочного наблюдения относят ... .
а) определение величины возможных отклонений показателей
генеральной совокупности от показателей выборочной совокупности;
б) определение численности выборки, при котором пределы возможной
ошибки не превысят допустимого уровня;
в) определение числа единиц совокупности, которые остались вне
сплошного наблюдения;
г)определение
связи
между
отдельными
признаками,
характеризующими изучаемое явление;
д) определение вероятности того, что в проведенном наблюдении
ошибка выборки будет иметь заданный предел;
е) уточнение характерных черт и основных признаков объекта
исследования.
171 Средний размер диаметра 100 деталей, отобранных по схеме
случайной бесповторной выборки из 1000, оказался равным 49 мм, среднее
квадратическое отклонение - 10 мм. Средний размер диаметра детали в
генеральной совокупности с вероятностью 0,996 находится в пределах ... мм (с
точностью до 0,1).
150
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) от 46,2 до 51,8;
б) от 46 до 52;
в) от 45 до 46,9;
г) от 78 до 78,9.
172 Для проверки качества продукции из партии 1000 шт. отобрано
методом случайного бесповторного отбора взято 100 деталей, из которых
оказалось 10 % бракованными. С вероятностью 0,954 зона бракованных
деталей в партии находится в пределах ... % (с точностью до 0,1 %)
а) от 4,3 до 15,7;
б) от 4 до 16;
в) от 7 до 17;
г) от 4 до 19.
173 По результатам обследования жилищных условий населения
средняя площадь, приходящаяся на одного жителя, в выборке составила 10
м2, а средняя ошибка выборки – 2 м2. При коэффициенте доверия t=2 средняя
площадь (с точностью до 0,01 м2) в расчете на одного жителя в генеральной
совокупности не меньше … м2.
а) 4;
б) 5;
в) 6;
г) 10;
д) 14.
174 По результатам обследования жилищных условий населения
средняя площадь, приходящаяся на одного жителя, в выборке составила 10
м2, а средняя ошибка выборки – 2 м2. При коэффициенте доверия t=2
определите среднюю площадь в расчете на одного жителя в генеральной
совокупности.
а) от 4 до 8;
б) от 6 до 14;
в) от 8 до 12;
г) от 4 до 16.
175 По результатам выборочного обследования жилищных условий
населения доля людей, не обеспеченных жильем в соответствии с
социальными нормами, составляет 20 %, а средняя ошибка выборки – 5 %.
Какова нижняя граница доли в генеральной совокупности, если коэффициент
доверия равен 2 (с точностью до 0,1 %).
а) 10;
б) 15;
в) 20;
г) 25;
д) 30
151
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
176 По результатам выборочного обследования жилищных условий
населения доля людей, не обеспеченных жильем в соответствии с
социальными нормами, составляет 20 %, а средняя ошибка выборки – 5 %.
Какова верхняя граница доли в генеральной совокупности, если коэффициент
доверия равен 3 (с точностью до 0,1 %).
а) 10;
б) 5;
в) 20;
г) 15;
д) 30.
177 Для определения скорости расчетов с кредиторами предприятий
корпорации в коммерческом банке была проведена случайная выборка 100
платежных документов, по которым средний срок перечисления и получения
денег оказался равным 22 дням со стандартным отклонением 6 дней. Какова
предельная ошибка выборочной средней при вероятности 0,954?
а) 1,2;
б) 1;
в) 0,49;
г) 0,2.
178 Для определения скорости расчетов с кредиторами предприятий
корпорации в коммерческом банке была проведена случайная выборка 100
платежных документов, по которым средний срок перечисления и получения
денег оказался равным 22 дням со стандартным отклонением 6 дней. Какова
предельная относительная ошибка выборки при вероятности 0,954?
а) 20;
б) 18,3;
в) 5,45;
г) 27,3;
д) 22.
179 В аппаратном цехе предприятия 300 разделены на 15 бригад по 20
человек в каждой. При определении среднего стажа работы произведена 20
%-ная бесповторная серийная выборка. В выборку попали 3 бригад, в
которых средний стаж составил: в первой – 8 лет, во второй – 12, в третьей –
10. Межсерийная дисперсия составила 2,7. Определите объем выборки, при
котором с вероятностью 0,997 средний стаж работы в отобранных сериях не
будет отклоняться от среднего стажа всех работников предприятия более,
чем на 5 %.
а) 87;
б) 97;
в) 100;
г) 103;
д) 106.
152
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
180 Выпускаемая продукция упаковывается в ящики по 100 штук в
каждом. Из 100 ящиков, поступивших на склад готовой продукции, в порядке
случайной бесповторной выборки было отобрано 5, все детали которых
проверены на вес. Результаты проверки показали, что средний вес деталей
составил 49,8 г, межсерийная дисперсия 18,56 г. Определите предельную
ошибку средней при вероятности 0,954.
а) 3,76;
б) 3;
в) 2,76;
г) 6,15;
д) 6.
181 Выпускаемая продукция упаковывается в ящики по 100 штук в
каждом. Из 100 ящиков, поступивших на склад готовой продукции, в порядке
случайной бесповторной выборки было отобрано 5, все детали которых
проверены на вес. Результаты проверки показали, что средний вес деталей
составил 49,8 г, межсерийная дисперсия 18,56 г. С вероятностью 0,954
определите пределы, в которых находится средний вес деталей, поступивших
на склад готовой продукции.
а) от 45,97 до 53,63;
б) от 46,04 до 53,96;
в) от 47,01 до 55,38;
г) от 46 до 52.
182 Способы отбора единиц в выборочную совокупность: ... .
а) собственно-случайный;
б) механический;
в) типический;
г) аналитический;
д) сложный;
е) серийный.
183 В крае 268 тыс. семей. Из них 163 тыс. семей рабочих, 77 тыс.
семей сельских жителей, 28 тыс. семей служащих. С целью определения доли
многодетных семей предлагается провести типическую выборку с
пропорциональным отбором. Отбор внутри типов механический. Какое
количество семей необходимо отобрать, чтобы с вероятностью 0,997 ошибка
выборки не превышала 10 %? Дисперсия типической выборки равна 2700.
а) 241,4 тыс.;
б) 201,4 тыс.;
в) 803,7 тыс.;
г) 141,5 тыс.
184 Недостающим элементом в формуле расчета объема выборки
при бесповторном случайном отборе (оценивается среднее значение
153
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
признака) n =
t2 × N ×σ 2
является:
N × ... + t 2 × σ 2
а) σ ;
б) σ 2 ;
в) ∆ ;
г) ∆2 .
185 Недостающим элементом в формуле расчета объема выборки
при бесповторном случайном отборе (оценивается среднее значение
t2 × N ×σ 2
признака) n =
является:
N × ∆2 + t 2 × ...
а) σ ;
б) σ 2 ;
в) ∆ ;
г) ∆2 .
186 Финансовая корпорация с численностью сотрудников 750 человек
путем механической выборки планирует определить долю сотрудников со
стажем работы свыше 3 лет. Какова должна быть необходимая численность
выборки, если по данным предыдущего обследования дисперсия стажа равна
0,16, а результаты выборочного наблюдения требуется гарантировать с
вероятностью 0,683 и ошибкой не более 5 %?
а) 35 человек;
б) 59 человек;
в) 75 человек;
г) 96 человек;
д) 100 человек.
187 С целью определения средней фактической продолжительности
рабочего дня в государственном учреждении с численностью служащих 480
человек была проведена 25 %-ная механическая выборка. По результатам
наблюдения оказалось, что у 10; обследованных потери времени достигали
более 45 минут в день. С вероятностью 0,683 установить пределы, в которых
находится генеральная доля служащих с потерями рабочего времени более 45
минут в день.
а) от 5,9 до 10,1;
б) от 8 до 10;
в) от 6,3 до 8,3;
г) от 4,9 до 9.
188 При проверке веса импортируемого груза на таможне методом
случайной повторной выборки было отобрано 600 изделий. В результате был
установлен средний вес изделия 50 г При среднем квадратическом
отклонении 6 г. С вероятностью 0,997 определить пределы, в которых
находится средний вес изделий в генеральной совокупности.
154
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) от 50 до 55;
б) от 45 до 55;
в) от 40 до 60;
г) от 40 до 50.
189 Первая группа прикладных задач выборочного наблюдения чаще
всего связана:
а) с решением общетеоретических проблем, проведением исследований
и экспериментов для получения информации о генеральной совокупности на
основе выборочного наблюдения;
б) с практическими интересами и приобретает все большее значение в
области управления технологическими процессами, качеством продукции и
работ;
в) решением вопросов с помощью системы органов отраслевого
управления и государственной статистики;
г) с решением общетеоретических проблем.
190 Вторая группа прикладных задач выборочного наблюдения чаще
всего связана:
а) с решением общетеоретических проблем, проведением исследований
и экспериментов для получения информации о генеральной совокупности на
основе выборочного наблюдения;
б) с практическими интересами и приобретает все большее значение в
области управления технологическими процессами, качеством продукции и
работ;
в) решением вопросов с помощью системы органов отраслевого
управления и государственной статистики;
г) с практическими интересами в области технологических процессов.
191 Третья группа прикладных задач выборочного наблюдения чаще
всего связана:
а) с решением общетеоретических проблем, проведением исследований
и экспериментов для получения информации о генеральной совокупности на
основе выборочного наблюдения;
б) с практическими интересами и приобретает все большее значение в
области управления технологическими процессами, качеством продукции и
работ;
в) решением вопросов с помощью системы органов отраслевого
управления и государственной статистики;
г) с проведением исследований и экспериментов для получения
информации о генеральной совокупности.
192 В целях уменьшения затрат на подготовку и проведение
выборочного наблюдения в переписи населения в качестве единиц отбора
используют:
155
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
а) переписные единицы;
б) переписные объекты;
в) переписные совокупности;
г) переписные выборки.
193 Наиболее распространенным способом включения единиц в
выборку при проведении переписи населения является:
а) серийный отбор;
б) случайный отбор;
в) систематический (механический) отбор;
г) типический отбор;
д) многофазный отбор.
194 Если в процессе подготовки к переписи населения технологически
предусмотрена запись информации на технических носителях и выделены
средства на программное обеспечение процедур формирования выборки, то
не исключается проведение:
а) случайного отбора;
б) типического отбора;
в) серийного отбора;
г) многоступенчатого отбора;
д) комбинированного отбора.
195 В России при проведении выборочного обследования в переписи
населения использовалась:
а) 50 %-ная выборка;
б) 25 %-ная выборка;
в) 15%-ная выборка;
г) 10%-ная выборка.
196 До 1996 года выборочная совокупность домашних хозяйств
строилась пропорционально общей численности:
а) занятых лиц в общественном производстве;
б) населения страны;
в) трудовых ресурсов;
г) трудоспособного населения.
197 До 1996 года в выборочном наблюдении домашних хозяйств для
создания отраслевой выборки применялась:
а) серийная выборка;
б) типическая выборка с механическим отбором единиц внутри групп;
в) случайная выборка;
г) двухступенчатая выборка.
198 Главным показателем отбора при проведении выборочного
156
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
наблюдения домашних хозяйств до 1996 года являлся:
а) показатель среднемесячной заработной платы;
б) показатель среднемесячной пенсии;
в) показатель номинальной начисленной заработной платы;
г) статус членов домашнего хозяйства.
199 В качестве базы формирования выборочной совокупности при
проведении выборочного наблюдения домашних хозяйств после 1996 г. были
приняты материалы микропереписи населения:
а) 1974 г.;
б) 1984 г.;
в) 1990 г.
г) 1994 г.
200 Одним из критериев выбора варианта объема и распределения
выборочной совокупности домашних хозяйств явилась установка на то, что
ожидаемая ошибка выборки не должна превышать:
а) 10 %;
б) 30 %;
в) 25 %;
г) 50 %.
201 Для формирования выборочной совокупности домашних хозяйств
с 1996 года применяется:
а) двухступенчатая выборка;
б) трехступенчатая выборка;
в) четырехступенчатая выборка.
202 Единицами отбора на первой ступени при проведении выборочного
обследования домашних хозяйств является:
а) домашнее хозяйство;
б) счетный участок;
в) член домашнего хозяйства;
г) населенный пункт.
203 Единицами отбора на второй ступени при проведении выборочного
обследования домашних хозяйств является:
а) домашнее хозяйство;
б) счетный участок;
в) член домашнего хозяйства;
г) населенный пункт.
204 Выборочные обследования домашних хозяйств проводятся:
а) ежемесячно;
б) ежеквартально;
157
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) один раз в полугодие;
г) ежегодно.
205 С какой периодичностью каждое из обследуемых домашних
хозяйств при проведении выборочного обследования ведет дневниковые
записи:
а) дважды в течение квартала;
б) дважды в течение месяца;
в) дважды в течение полугода;
г) дважды в год.
206 Опрос домашних хозяйств о жилищных условиях, наличии
предметов длительного пользования, обороте скота в личных подсобных
хозяйствах, уровне образования членов домашнего хозяйства проводится:
а) раз в месяц
б) раз в квартал;
в) раз в полугодие;
г) раз в год.
207 Выборочное обследование домашних хозяйств проводится с
охватом:
а) 5 тыс. домохозяйств;
б) 25 тыс. домохозяйств;
в) 50 тыс. домохозяйств;
г) 500 тыс. домохозяйств.
208 Для формирования выборочной совокупности на всех ступенях при
проведении выборочного обследования домашних хозяйств применяется
выборка:
а) случайная;
б) типическая;
в) механическая;
г) серийная.
209 С какого года проводятся в России выборочные обследования
потребительских ожиданий населения:
а) 1988 г.;
б) 1998 г.;
в) 2000 г.;
г) 2002 г.
210 С какой периодичностью проводятся выборочные обследования
потребительских ожиданий населения:
а) каждый второй месяц каждого квартала;
б) каждый месяц;
158
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) раз в полугодие;
г) раз в год.
211
Объектом
наблюдения
выборочного
потребительских ожиданий населения является:
а) все население страны;
б) население в возрасте 16 лет и старше;
в) население трудоспособного возраста;
г) экономически активное население.
обследования
212
Единицей
наблюдения
выборочного
потребительских ожиданий населения является:
а) отдельный человек;
б) отдельное домохозяйство;
в) все население страны;
г) отдельный населенный пункт.
обследования
213 Способом включения единиц в выборку
при проведении
выборочного обследования потребительских ожиданий населения является:
а) механический;
б) типологический;
в) двуступенчатый;
г) трехступенчатый;
д) серийный.
214 Объем выборочной совокупности при проведении выборочного
обследования потребительских ожиданий населения равен:
а) 500 респондентов;
б) 5000 респондентов;
в) 50000 респондентов;
г) 500 000 респондентов.
215 Единицей отбора на первой ступени при проведении выборочного
обследования потребительских ожиданий населения является:
а) конкретный населенный пункт;
б) один человек, определяемый «методом последнего дня рождения»;
в) домашнее хозяйство.
216 Единицей отбора на второй ступени при проведении выборочного
обследования потребительских ожиданий населения является:
а) конкретный населенный пункт;
б) один человек, определяемый «методом последнего дня рождения»;
в) домашнее хозяйство.
217 Выходные данные выборочного обследования потребительских
159
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ожиданий населения формируются на уровне:
а) федеральном;
б) региональном;
в) местном.
218 Вопросы о характеристиках занятости респондента при проведении
выборочного
обследования
потребительских
ожиданий
населения
включаются в:
а) вводный блок;
б) блок-вопросник;
в) блок социально-демографических характеристик;
г) блок демографических характеристик.
219 Вопросы об общей экономической ситуации при проведении
выборочного
обследования
потребительских
ожиданий
населения
включаются в:
а) вводный блок;
б) блок-вопросник;
в) блок социально-демографических характеристик;
г) блок демографических характеристик.
220 Обращение к респонденту при проведении выборочного
обследования потребительских ожиданий населения включается в:
а) вводный блок;
б) блок-вопросник;
в) блок социально-демографических характеристик;
г) блок демографических характеристик.
221
Выборочное
наблюдение
за
субъектами
предпринимательства (бизнес-наблюдение) проводится, начиная с:
а) 1986 г.;
б) 1990 г.;
в) 1996 г.;
г) 2006 г.
малого
222
Выборочное
наблюдение
за
субъектами
малого
предпринимательства (бизнес-наблюдение) проводится с периодичностью:
а) ежемесячно;
б) ежеквартально;
в) ежегодно.
223 Генеральная совокупность при проведении
обследования малых предприятий формируется на уровне:
а) федеральном;
б) региональном;
160
выборочного
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) местном.
224 Генеральная совокупность при
обследования малых предприятий составляет:
а) 50 тыс. предприятий;
б) 500 тыс. предприятий;
в) 1 млн. предприятий;
г) 1,5 млн. предприятий.
проведении
выборочного
225 В целом по России число единиц наблюдения при проведении
выборочного обследования малых предприятий не превышает от генеральной
совокупности всех малых предприятий:
а) 10 %;
б) 15 %;
в) 20 %;
г) 30 %.
226 По какому признаку число малых предприятий, подлежащих
обследованию (объем выборки) по субъектам РФ определяется исходя из
того, что значение коэффициента вариации оценки по данному признаку не
должно превышать 5 %?
а) ОКОНХ;
б) ОКАТО;
в) ОКФС;
г) выручка.
227 Для восстановления данных по каким предприятиям применяется
метод перевзвешивания (заполнению по среднему в слое) при проведении
выборочного обследования малых предприятий?
а) предприятиям, о которых достоверно известно, что они, несмотря на
отсутствие отчета, активны, ведут финансово-хозяйственную деятельность;
б) предприятиям, прекратившим или приостановившим свою
деятельность в силу различных причин;
в) предприятиям, по которым не получена объективная информация о
том, действующие они или нет;
г) предприятиям, о которых достоверно известно, ведут финансовохозяйственную деятельность.
228 Для восстановления данных по каким предприятиям применяется
метод заполнения случайным подбором в классах замещения при проведении
выборочного обследования малых предприятий?
а) предприятиям, о которых достоверно известно, что они, несмотря на
отсутствие отчета, активны, ведут финансово-хозяйственную деятельность;
б) предприятиям, прекратившим или приостановившим свою
деятельность в силу различных причин;
161
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) предприятиям, по которым не получена объективная информация о
том, действующие они или нет;
г) предприятиям, о которых достоверно известно, ведут финансовохозяйственную деятельность.
229 Для формирования выборочной совокупности при проведении
выборочного обследования малых предприятий применяется отбор:
а) механический;
б) многомерный типический;
в) типический;
г) серийный;
д) случайный.
230 С какого года проводятся выборочные обследования населения по
проблемам занятости?
а) 1982 г.;
б) 1992 г.;
в) 1996 г.
231 Выборочное обследование населения по проблемам занятости с
1999 г. проводится с периодичностью:
а) ежемесячно;
б) ежегодно;
в) каждое полугодие;
г) ежеквартально.
232 При проведении выборочного обследования населения по
проблемам занятости в выборку в выборку отбирается население:
а) экономически активное;
б) в возрасте 15-72 года;
в) трудоспособного возраста;
г) трудоспособное.
233 При проведении выборочного обследования населения по
проблемам занятости в выборку в выборку отбирается:
а) 30 тыс. человек;
б) 40 тыс. человек;
в) 50 тыс. человек;
г) 60 тыс. человек.
234 При проведении выборочного обследования населения по
проблемам
занятости
основой
выборки
выступают
материалы
микропереписи:
а) 1985 г.;
б) 1996 г.;
162
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) 1994 г.;
г) 2002 г.
235 При проведении выборочного обследования населения по
проблемам занятости отбор единиц проводится на уровне:
а) федеральном;
б) региональном;
в) местном.
236 При проведении выборочного обследования населения по
проблемам занятости отбор единиц в выборочную совокупность проводится
способом:
а) серийным;
б) типическим;
в) механическим;
г) случайным.
237 Выборочное обследование
периодичностью:
а) ежегодно;
б) каждое полугодие;
в) ежеквартально;
г) ежемесячно.
за
ценами
проводится
с
238 В потребительском секторе наблюдение за уровнем и динамикой
цен на важнейшие продовольственные товары проводится:
а) ежеквартально;
б) каждое полугодие;
в) ежемесячно;
г) еженедельно.
239 Выборочное обследование организаций о составе затрат на
рабочую силу проводится с:
а) 1989 г.;
б) 1994 г.;
в) 1999 г.;
г) 2002 г.
240 Выборочное обследование организаций о составе затрат на
рабочую силу проводится с периодичностью:
а) раз в два года;
б) два раза в год;
в) раз в год;
г) раз в квартал.
163
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
241 Объектами выборочного наблюдения организаций о составе затрат
на рабочую силу выступают юридические лица со среднесписочной
численностью работников:
а) 10 человек;
б) свыше 10 человек;
в) меньше 10 человек;
г) свыше 20 человек.
242 Выборочная совокупность при выборочном обследовании
организаций о составе затрат на рабочую силу создается на основе выборки:
а) случайной;
б) механической;
в) типической;
г) серийной;
д) многофазной.
243 Для формирования выборочной совокупности крестьянских
хозяйств используются методы выборок:
а) механических и типических;
б) механических и серийных;
в) механических и случайных;
г) типических и серийных.
244 В регионах, где генеральная совокупность крестьянских хозяйств,
производящих исследуемый вид сельскохозяйственной продукции,
малочисленна (меньше 200 хозяйств), наиболее эффективным является
отбор:
а) типический;
б) механический;
в) серийный;
г) многоступенчатый.
245 В регионах, где генеральная совокупность крестьянских хозяйств,
производящих исследуемый вид сельскохозяйственной продукции,
многочисленна (больше 200 хозяйств), наиболее эффективным является
отбор:
а) типический;
б) механический;
в) серийный;
г) многоступенчатый.
246 Минимальная численность типической группы при выборочном
обследовании крестьянских хозяйств не может быть меньше:
а) 5;
б) 10;
164
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
в) 15;
г) 25.
247 Совокупность крестьянских хозяйств региона, ранжированных по
возрастанию показателя, характеризующего изучаемый вид производимой
сельскохозяйственной продукции (посевная площадь в растениеводстве,
поголовье скота и птиц в животноводстве), называется:
а) выборочная совокупность;
б) полнота выборки;
в) основа выборки.
248 Если количество крестьянских хозяйств в генеральной
совокупности составляет 51-100 хозяйств, то процент отбора в выборочную
совокупность равен:
а) 100;
б) 50;
в) 25;
г) 15.
249 Если количество крестьянских хозяйств в генеральной
совокупности составляет 101-200 хозяйств, то процент отбора в выборочную
совокупность равен:
а) 100;
б) 75;
в) 50;
г) 5.
250 Разбиение генеральной совокупности на типичные группы при
проведении выборочного обследования крестьянских хозяйств основывается
на том, что коэффициент вариации в каждой группе будет:
а) меньше 33 %;
б) равен 33 %;
в) не меньше 33 %.
165
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Список использованных источников
1 Басова, В. А. Выборочный метод статистических обследований:
учеб. пособие / В. А. Басова, В. Ф. Байнеа. − Саранск: Изд-во Мордов. ун-та,
1998. – 40 с.
2 Венецкий, И. Г. Теоретические и практические основы выборочного
метода: учеб. пособие/ И. Г. Венецкий. – М.: МЭСИ, 1975. – 216 с.
3 Гаспаров, Д. В. Малая выборка / Д. В. Гаспаров, В. И. Шаповалов. –
М.: Статистика, 1978. – 189 с.
4 Гусынин А.Б. Теория выборочных обследований /Гусынин А.Б,
Минашкин В.Г. – Московский международный институт эконометрики,
информатики, финансов и права. – М., 2002 – 67с.
5 Деев, Г. И. Организация и анализ результатов выборочного
обследования: учеб. пособие / Г. И. Деев; Гос. ком. РФ по статистике. –
М.:[б.и.], 1995. – 38 с.
6 Джессен Р. Методы статистических исследований /Р. Джессен; под
ред. Е. М. Четыркина. – М.: Финансы и статистика, 1985. – 357 с.
7 Дружинин, Н. К. Выборочное наблюдение и эксперимент / Н. К.
Дружинин. – М.: Статистика, 1977. – 156 с.
8 Дружинин, Н. К. Выборочный метод и его применение в социальноэкономических исследованиях / Н. К. Дружинин. – М.: Статистика, 1970. –
198 с.
9 Йейтс Ф. Выборочный метод в переписях и обследованиях /Ф.
Йейтс; под ред. А. Г. Волкова. – М.: Статистика, 1965. – 136 с.
10 Кильдишев, Г. С. Выборочное наблюдение: учеб. пособие. / Г. С.
Кильдишев. – М.: МЭСИ, 1965. – 412 с.
11 Кокрен У. Методы выборочного обследования / У. Кокрен; под ред.
А. Г. Волкова. – М.: Статистика, 1976. – 236 с.
12 Сажин, Ю. В. Методы выборочных обследований: учеб. пособие /
Ю. В. Сажин, Н. Г. Подзоров, Е. С. Петрова. – Саранск: Изд-во Мордов. унта, 2006. – 81 с.
13 Салин, В.Н. Статистика: учеб. пособие для сред. проф.
образования / В. Н. Салин, Э. Ю. Чурилова, Е. П. Шпаковская. М.: КноРус, 2007. - 304 с. - ISBN 978-5-85971-594-7.
14 Елисеева, И.И. Общая теория статистики: учебник для вузов / И.И,
Елисеева, М.М., Юзбашев. – М.: Финансы и статистика, 2008. – 656 с. – ISBN
978-5-279-02414-8.
15 Статистика: учебник / под ред. А. Е. Суринова. – М.: РАГС, 2005. –
656 с. – ISBN 5-7729-0234-2.
16 Шварц Г. Выборочный метод / Г. Шварц; под ред. И.Г. Венецкого
и В.М. Ивановой: пер. с немецкого Я.Ш. Паппэ. – М.: Статистика, 1978. – 213
с.
17 Официальный сайт Федеральной службы государственной
статистики: www.gks.ru.
166
Документ
Категория
Экономика
Просмотров
1 476
Размер файла
1 253 Кб
Теги
метод, выборочных, обследования, 1825
1/--страниц
Пожаловаться на содержимое документа