close

Вход

Забыли?

вход по аккаунту

?

2924.Тестирование и оценивание

код для вставкиСкачать
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
V\
СИБИРСКИМ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФИЗИЧЕСКОЙ КУЛЬТУРЫ И СПОРТА
В.Н.ПОПКОВ
ТЕСТИРОВАНИЕ И ОЦЕНИВАНИЕ
I
г? ;
Омск 2004
ПХЕПО
п ь ю т
Г. Р
bTr
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В.Н.Попков. Тестирование и оценивание: Учебное пособие для
студентов. - Омск: Изд-во СибГУФК, 2004.-76 с.
В учебном пособии изложен материал, который поможет пользователям при комплексном анализе вопросов выбора информативных и
надежных тестов для оценки состояний и уровня подготовленности
спортсменов.
Пособие предназначено для самостоятельной подготовки студентов
к экзамену по спортивной метрологии, а также может быть использовано
как дополнительный источник информации при подготовке курсовых,
дипломных, квалификационных и диссертационных работ.
Предназначено студентам, аспирантам, преподавателям физического
воспитания и тренерам.
Рецензенты:
доктор пед. наук И.Т.Лысаковский,
доктор пед. наук Н.В.Астафьев
Печатается по решению редакционно-издательского совета
университета
© Сибирский государственный университет физической культуры и спорта, 2004
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ВВЕДЕНИЕ
Данное пособие адресовано студентам, аспирантам, преподавателям
физического воспитания и тренерам. Необходимость подготовки пособия
связана с тем, что любой специалист, работающий в области физической
культуры и спорта, сталкивается с необходимостью оценивать состояние
здоровья, физическую, техническую, функциональную и психологическую
подготовленность занимающихся физическими упражнениями. Оценка
различных сторон подготовленности человека, занимающегося физической
культурой или спортивной тренировкой, необходима для успешного
построения и управления тренировочным процессом. Под влиянием
систематической тренировки происходят адаптационные изменения во
всех системах организма. Непосредственное или косвенное измерение
этих приспособительных явлений позволяет делать заключения не только
о состоянии тренированности, но и оценивать эффективность средств,
применяемых для формирования отдельных её сторон, т.е. открывает возможность управления тренировочным процессом. В связи с этим все большее распространение в практической работе тренеров, преподавателей
физической культуры получают различные методы объективного контроля за состоянием занимающихся с помощью самых разнообразных тестов.
Специалисты различного профиля: педагоги-преподаватели, врачи,
биологи, физиологи, биохимики, стремясь получить объективную и точную количественную информацию о различных сторонах подготовленности человека, используют огромный арсенал различного рода контрольных упражнений, функциональных проб и т. п., которые обобщённо
можно назвать тестами. При этом зачастую процедуре оценки пригодности
теста для решения конкретной практической задачи не уделяется должного внимания. Среди ряда практических работников физической культу ры и спорта часто наблюдается скептически - пренебрежительное, а среди
3
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
специалистов биологов, напротив, излишне доверчивое отношение к результатам тестирования. Причиной многих связанных с этим иллюзий и
необоснованных практических решений, как правило, является поверхностное знакомство с теоретическими основами измерений, математической статистики и тестирования. Умение оценить пригодность теста
необходимо специалисту любой научной дисциплины в связи с тем, что
эта пригодность зависит не только (а порой и не столько) от характера самого
теста, сколько от цели тестирования, точности измерительной аппаратуры,
пола, возраста и спортивной квалификации испытуемых и ряда других
причин.
В последние десятилетия основы теории тестов включены в учебные
программы курса «Спортивная метрология» физкультурных вузов,
однако учебники ограничиваются минимальным объёмом информации,
явно недостаточным для более глубокого понимания теоретических вопросов, связанных с выбором тестов, оценкой их пригодности для поставленных практических задач и интерпретации результатов тестирования.
По ряду причин идеологического характера в нашей стране идеи биометрии, педологии и других научных направлений, связанных с применением
тестов, в советский период не получили развития. В связи с этим количество литературы по теоретическим вопросам, связанным с тестированием, в нашей с т р а н е к р а й н е ограничено. К числу наиболее
обстоятельных работ, переведённых на русский язык, следует отнести
монографии А. Анастази «Психологическое тестирование» и П.Благуша
«К теории двигательных способностей», а также работу Х.Бубэ с соавторами «Тесты в спортивной практике». Из отечественных исследователей, много сделавших для распространения теоретических основ
тестирования в области физической культуры и спорта, прежде всего,
следует назвать В.М.Зациорского, М.А.Годика, Е.Я.Бондаревского,
Б. А.Суслакова, В.Л.Уткина, В.В.Иванова, Л.Н.Жданова и С.В.Брянкина,
подготовивших учебники «Спортивная метрология» и ряд учебных пособий для студентов физкультурных вузов. К сожалению, эти работы изданы малым тиражом и стали библиографической редкостью. Данное пособие не претендует на роль оригинальной работы, в нём предпринята попытка краткого обобщения наиболее важных аспектов, связанных с тестированием. Подготовка пособия преследовала две цели: расширить знания
студентов в области теории тестирования и побудить начинающих исследователей к более глубокому изучению этой теории, для чего можно рекомендовать литературу, приведённую в библиографическом указателе, а
также обширную библиографию зарубежных источников, имеющуюся в
работах А.Анастази, П.Благуша и Х.Бубэ с соавторами.
4
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В пособии используются терминология и математическая символика,
применяемые в отечественной литературе (в частности, в учебниках по
спортивной мегрологии), а также некоторые основные понятия из теории
измерений и математической статистики, при этом предполагается, что
минимально необходимый объём знаний из этой области у читателя имеется,
1. ОСНОВЫ ТЕОРИИ ТЕСТОВ
1.1. Тесты и их применение
В широком смысле слово «тест» (test) в переводе с латинского, английского, французского языков означает пробу, испытание, определение
ценности, качественное или количественное испытание.
В более узком смысле это слово используется как термин для обозначения исследовательской процедуры, в ходе которой с помощью наблюдения, измерения или подсчёта определяется уровень какого-либо свойства изучаемого объекта. При этом объектом исследования может быть не
только человек, но и животное, растение, механическое или электронное
устройство и т.п. Процесс испытания или измерения называют тестированием, а полученное в результате тестирования числовое значение результатом теста.
Как правило, к тестированию прибегают тогда, когда прямое измерение исследуемого свойства невозможно. Таким образом, тестирование
является косвенным измерением.
В спортивной практике термином «тест» принято обозначать измерение или испытание, проводимое для определения состояния или способности человека. Тест может состоять как из единичного задания (например, прыжок в длину с места) или из нескольких различных заданий,
объединённых в один тест (например, психологический тест, включающий
несколько различных заданий-вопросов).
С формальной точки зрения всё многообразие педагогических задач,
решаемых с помощью самых различных тестов, сводится к получению ответа
на один из следующих вопросов:
1. Каков уровень качества (свойства) у данного индивида в данный
момент?
2. Изменилось ли состояние данного индивида (по сравнению с
предыдущим измерением)?
3. Каков будет уровень качества (свойства) индивида в будущем?
5
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4. Имеются ли различия между испытуемыми в уровне данного
свойства?
5. Сохранятся ли различия между испытуемыми на определённом
отрезке времени?
Для того чтобы ответить на эти вопросы, необходимо:
1. Выбрать способ измерения и оценки интересующего нас свойства.
2. Оценить пригодность выбранного способа измерения.
3. Провести измерение и оценку его результатов.
Прежде чем измерять, мы должны достаточно чётко представить
себе, «что» мы собираемся измерить. Этот вопрос относительно просто
решается при проведении прямых измерений физических величин: длины,
массы, времени и т.п. (например, измеряя длину дистанции, мы не испытываем затруднения с ответом на вопрос, что мы измеряем). Ситуация
несколько осложняется в случае, если мы проводим косвенное измерение,
т.е. когда интересующая нас величина непосредственно не измеряется, а
рассчитывается на основании известных законов, связывающих её с другими величинами. Например, средняя скорость прохождения дистанции
рассчитывается по известным значениям длины дистанции и времени её
прохождения по формуле:
t
Значительно труднее ответить на вопрос, что измеряется, когда
нужно оценить свойство (качество) человека. Помимо чисто технических
сложностей, связанных с изменчивостью, адаптивностью, подвижностью
(В.Л.Уткин,1978), мы, как правило, не можем выполнить прямое измерение интересующих нас свойств.
Но основная трудность заключается в том, что многие объективно
существующие свойства человека не могут быть измерены в силу отсутствия
однозначных, объективно измеряемых характеристик этих свойств.
Например, по поводу того, что такое «здоровье», «работоспособность»,
«выносливость» можно привести массу различных несовпадающих
определений, каждое из которых отражает субъективное описание некоторой теоретической (гипотетической) модели данного свойства. Например, для описания такого понятия, как «физические (двигательные)
качества человека», можно предложить различные теоретические модели
и различные способы описания этих моделей. В силу взаимосвязи многих
свойств живого организма мы никогда не можем быть уверены, что избранная нами теоретическая модель является единственно возможной.
Модель может быть описана с содержательной (смысловой) и с количественной точки зрения. Сложность описания свойств биологических
6
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
объектов заключается, прежде всего, в отсутствии чётких качеств- ::нлх
границ между этими свойствами (например, сколько и каких физических
качеств можно выделить в двигательных возможностях человека). Именно поэтому не так прост ответ на вопрос, что мы измеряем.
Свойства теоретических объектов и их отношений могут быть описаны различными способами, в том числе и вербально, однако наиболее
высокий уровень теоретического описания возможен только при использовании формальных определений логики или математики, допускающих
абстрактные формальные преобразования. Выбирая способ математического описания любого (в том числе и теоретического объекта), мы вновь
выбираем некоторую математическую модель (например, предполагаем,
что зависимость между измеряемыми свойствами описывается прямолинейной регрессией). Этот этап также крайне важен как с точки зрения
удачности описания (адекватности) явления, так и с точки зрения соответствия свойств и отношений изучаемых объектов избранной теоретической
модели и с точки зрения последующей интерпретации результатов
тестирования.
Таким образом, в отличие от прямого измерения физических величин,
тестирование представляет собой особый вид измерения, при котором
интересующие нас свойства измеряются не непосредственно (и порой
даже не косвенно), а ассоциативно.
В таких областях знаний, как психология, педагогика, медицина,
физическая культура и спорт стремление к объективизации результатов
исследования наталкивается на необходимость использования некоторых
приёмов получения количественной информации, которые не укладываются в классическое понятие «измерение». К таким способам относятся экспертное оценивание и тестирование способностей человека. Тот
факт, что результатом использования этих процедур является количественная характеристика (число), дает основание многим представителям
этих научных дисциплин использовать термин «измерение» расширительно, как «установление соответствия между объектами или их
свойствами и числами». Разумеется, что такая трактовка понятия «измерение» имеет не только сторонников, но и противников. Действительно,
неоднозначным термином пользоваться неудобно. Попытки замены расширительной трактовки термина «измерение» понятием «оценка» также
не являются удачными, так как этот термин также не является однозначным. Учитывая, что в научной литературе по теории тестов понятие
«измерение» используется расширительно, не остаётся ничего другого,
как разделить это понятие путём добавления дополнительных определений. Например, «измерение в узком смысле слова» или «физическое
измерение» и «измерение в широком смысле слова», как это сделано в
ряде отечественных учебников.
7
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1.2. Классификация тестов
В зависимости от признака, положенного в основу классификации
тестов, их можно разделить на различные группы.
В зависимости от области применения различают тесты: педагогические, психологические, интеллекта, специальных способностей и т.д.
В зависимости от того, как сформулирована цель задания (достижение оптимального или максимального результата), тесты соответственно делят на оптимальные и экстремальные
Тесты, в основе которых лежат двигательные задания, называют двигательными, или моторными. Результатами двигательных тестов служат
либо двигательные достижения (время прохождения дистанции, пройденное расстояние, число повторений и т.п.), либо физиологические и биохимические показатели. В зависимости от этого, а также от типа задания,
которое ставится перед испытуемым, различают три группы двигательных тестов (табл.1).
В зависимости от того, что из себя представляет содержание теста, и
что выражает его результат, тесты разделяют на простые и сложные. Если тест состоит из одного задания, его называют простым. Если тест состоит из нескольких заданий, которые следуют одно за другим, и выполняются в слитной последовательности, а результат теста выражается временем
выполнения всех заданий (например, полоса препятствий), то тест называют сложным.
Таблица 1
Разновидности двигательных тестов
Название теста
Контрольные
упражнения
Стандартные
функциональные
пробы
Максимальные
функциональные
пробы
Задание
спортсмену
Показать максимальный результат
Одинаковое
для
всех, дозируется:
а) по величине выполненной работы
б) по величине физиологических
сдвигов
Результат теста
Двигательные
достижения
Физиологические
или биохимические
показатели при
стандартной работе.
Двигательные показатели при стандартной величине
физиологических
сдвигов.
Показать
макси- Физиологические
мальный результат или биохимические
показатели
8
Пример
Бег на 1500 м,
время бега
Регистрация ЧСС
при стандартной
работе
1000 кГм/мин.
Скорость бега при
ЧСС 160 уд/мин
Определение максимального кислородного долга или
максимального
потребления
ки- j
слорода
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
По числу результатов, которыми могу т заканчиваться тесты, их делят
на дихотомические (два исхода) и мультихотомические (со многими исходами).
Если тест может быть реализован посредством более чем одной альтернативы (т.е. у испытуемого имеется более одного варианта решения)
и при этом избрание одной альтернативы приводит к изменению
трудности какой-либо из остальных альтернатив, то говорят, что тест
имеет относительный вид. Если изменение одной из альтернатив не изменяет трудности остальных, то тест называют абсолютным. Дихотомические тесты абсолютного вида, так называемые «бинарные», имеют
оценку: выполнил - 3, не выполнил - 0. В зависимости от природы дихотомии тест может иметь естественную (например, попал мячом в цель или
не попал) или искусственную (выполнил норматив или не выполнил)
дихотомию .
1.3. Комплексы (батареи) тестов
В исследовательской и спортивной практике часто используют не
один, а несколько тестов, имеющих единую цель. Такая группа называется
комплексом, или батареей тестов. Принято различать два вида таких
комплексов: гомогенные и гетерогенные.
Гомогенными называют комплексы, состоящие из различных тестов,
оценивающих одно и то же свойство (например, несколько различных
тестов для оценки выносливости). Результаты таких тестов должны иметь
высокую корреляцию между собой. Если результаты двух или более тестов имеют высокую корреляцию, близкую к единице, они являются в
высокой степени гомогенными, или эквивалентными. Эквивалентные тесты являются взаимозаменяемыми, поскольку они как бы дублируют друг
друга.
Гетерогенными называют комплексы, состоящие из тестов, оценивающих различные свойства. Например, комплекс для оценки общей
физической подготовленности, состоящий из тестов, оценивающих: силу,
быстроту, ловкость, выносливость, гибкость. Тесты, входящие в гетерогенный комплекс, не должны иметь между собой высокой корреляции.
Ещё одной важной характеристикой комплекса тестов является его
размерность, которая характеризуется числом независимых факторов,
которые отражаются тестами, входящими в комплекс. Размерность комплекса тестов обычно оценивается по результатам факторного анализа и,
как правило, выражается меньшим числом факторов, нежели число
тестов, составляющих комплекс.
9
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1.4. Критерии пригодности тестов
Любой тест независимо от его содержания, цели или области применения должен быть оценен с точки зрения его пригодности для решения
поставленной задачи. Наиболее общими характеристиками, определяющими пригодность теста, являются: трудность, длина, длительность,
скорость, надёжность, информативность. Все эти свойства теста могут
быть оценены только в отношении какой-то конкретной статистической
совокупности. Это означает, что ни один тест не обладает универсальной
пригодностью, она зависит от цели исследования и особенностей исследуемого контингента (таких, как пол, возраст, состояние здоровья, физической подготовленности, квалификации и т.п.). Сначала рассмотрим
первые четыре из перечисленных выше характеристик.
Трудность теста (Р) характеризует его доступность для испытуемых.
Количественной характеристикой трудности теста для данного контингента обычно служит доля лиц (относительная частота), выполнивших
задание:
m
Р =
п
.
где т - число выполнивших тест,
п - общее количество испытуемых.
Некоторые авторы называют Р «индексом трудности». Если при проведении теста от испытуемого требуется выполнить какой-то определённый результат (норматив), то говорят не о трудности теста, а о трудности норматива.
Совершенно очевидно, что один и тот же тест представляет различную трудность для детей и взрослых, для спортсменов и новичков и т.д.
Таким образом, понятие «трудность теста» относится не к отдельному испытуемому (для которого тест может оказаться очень лёгким или,
напротив, вообще невыполнимым), а к определённой статистической
совокупности в целом. Если в одной и той же группе лиц разные тесты
имеют неодинаковые значения Р, это свидетельствует о неодинаковой
трудности тестов. Если в разных группах одни и те же тесты имеют разные
Р, это говорит о разной подготовленности групп.
Длина теста (D) в зависимости от его содержания может выражаться
в различных мерах. Например, в числе попыток (броски в баскетбольную
корзину), в длине пути (дистанция бега), времени выполнения задания
(например, за 10 секунд выполнить максимальное количество постукиваний в теппинг-тесте). Таким образом, «длина теста» является
10
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
понятием относительным, связанным с возможностью удлинения или
укорочения теста.
Длительность выполнения ("тестовое время") (t) также является
одной из характеристик пригодности теега. Она может совпадать с его
результатом (например, время удержания равновесия) или определяться
содержанием теста (например, 20 приседаний за 30 секунд).
Скорость теста определяется отношением длины теста ко времени
его выполнения D/t. Скорость теста может быть задана формулировкой
теста и являться одним из условий его выполнения. Например, педалирование на велоэргометре в темпе 60 оборотов в минуту.
Изменение скорости теста возможно путём увеличения его длины
или продолжительности. В том и другом случае изменяется трудность
теста и, как следствие, его надёжность и информативность.
Таким образом, от всех перечисленных выше характеристик теста
прямо или косвенно зависит его пригодность для конкретного контингента, однако большинство авторов к основным метрологическим требованиям, определяющим пригодность теста, относят следующие условия:
1. Должна быть определена цель применения теста.
2. Стандартность процедуры (методика и условия проведения теста
должны быть одинаковыми во всех случаях проведения теста).
3. Тест должен обладать достаточной надёжностью.
4. Тест должен быть информативен.
5. Должна быть разработана система оценок результатов теста.
Тесты, удовлетворяющие требованиям надёжности и информативности, называют аутентичными (подлинными, добротными).
Рассмотрим смысл перечисленных критериев пригодности тестов.
Правильное определение цели тестирования способствует более обоснованному выбору тестов. Так, тестирование может проводиться в целях:
выявления уровня общей или специальной физической, технической,
тактической, психологической или функциональной подготовленности
занимающихся. В каждом из этих случаев требуются различные тесты.
Кроме того, в зависимости от цели тестирования требования к свойствам
тестов также могут быть различны. Например, требования к тестам, предназначенным для оперативного, текущего или этапного контроля, не
одинаковы. Различаются и критерии пригодности тестов, предназначенных для оценки состояния спортсмена и для прогнозирования его
достижений на отдалённое будущее. В ходе дальнейшего рассмотрения
критериев пригодности тестов мы остановимся на этих особенностях
более подробно.
Стандартность процедуры тестирования
Основными метрологическими требованиями к результатам любых
измерений являются необходимая точность и сравнимость результатов.
11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Точность результатов тестирования оценивается иначе, чем точность
измерений. При оценке точности измерения его результат сравнивается
с результатом более точного (эталонного) измерения. При тестировании
возможность такого сравнения отсутствует. Поэтому в теории тестов
оценивают не точность измерения, а свойства самого теста (при этом
подразумевается, что измерение выполняется с достаточной точностью).
Сравнимость результатов тестирования обеспечивается за счёт соблюдения стандартных условий процедуры тестирования, обеспечивающих возможность сопоставления результатов, полученных при повторном тестировании одного и того же испытуемого или различных испытуемых между собой. Соблюдение этого требования достигается при выполнении следующих условий:
1) схема выполнения теста должна быть постоянной от одного тестирования к другому;
2) условия, в которых выполняется каждое тестирование, должны
быть, по возможности, одинаковыми;
3) режим дня, предшествующего тестированию, должен быть для всех
испытуемых одинаков;
4) разминка перед выполнением теста (если она необходима) должна
быть всегда стандартной.
5) тестирование по возможности должны проводить одни и те же
лица;
6) интервалы между повторными попытками выполнения теста должны быть достаточными для восстановления состояния испытуемого
после предыдущей попытки;
7) если результат теста требует проявления максимальных возможностей испытуемого, он должен стремиться показать этот максимум.
1.5. Надёжность теста
Для того чтобы по результатам теста можно было с достаточной
уверенностью различать между собой двух (или более) испытуемых или
говорить о том, что несовпадающие результаты двух измерений одного
и того же человека свидетельствуют об изменении его состояния, тест
должен обладать надёжностью.
Под надёжностью теста понимается способность давать неизменные
результаты при повторном измерении одних и тех же лиц, находящихся
в одном и том же состоянии. По ряду причин ни один тест не может дать
абсолютного совпадения результатов при повторном измерении.
Теория надёжности тестов исходит из того, что результат любого
измерения, проводимого на человеке, Xt - есть сумма трёх величин:
12
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Xt = Xo + Xe + Xm,
где Xo - истинное значение измеряемой величины, которое мы хотим
зафиксировать;
Хе - ошибка, вызванная колебаниями в состоянии испытуемого;
Xm - ошибка, привносимая измерительным прибором.*
При этом под Хо понимают математическое ожидание Xt, т.е. его
среднее значение при бесконечно большом числе измерений в одинаковых
условиях.
Если в повторных попытках выполнения теста ошибки Хе случайны и
независимы друг от друга, то дисперсия результатов этих попыток
Ot2 = a 0 2 + O e 2
,
т.е. зарегистрированная в опыте дисперсия O t равна сомме дисперсий истинных резольтатов <5Q И ошибок 0 е Объективной количественной мерой
надёжности теста сложит Гц - отношение истинной дисперсии к дисперсии,
зарегистрированной в опыте:
г
1
tt
=
°0
_2
G
=
- ~Ge
_2
=
i
2
Таким образом, Г t это доля истинной вариации в той вариации,
которая зарегистрирована в опыте.
* Отличие теории надёжности тестов от классической теории ошибок измерений
заключается в том, что в последней рассматривается ситуация, когда измеряемая величина
неизменна, а ошибка измерения зависит от точности измерения, т.е. Xt = Xo + Xm.
Теория тестов исходит из предположения, что Xm намного меньше, чем Хе,
поэтому значением Xm, как правило, пренебрегают. Разумеется, что это предположение должно быть обоснованным, т.е. необходимая точность измерения должна
быть, безусловно, обеспечена. Если же значение Xm настолько мало, что им можно
пренебречь, то тогда Xt = Хо + Хе.
13
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Причины, снижающие надёжность теста, следующие:
1) изменение состояния испытуемых (утомление, врабатываемость
и др.);
2) неконтролируемые изменения внешних условий и аппаратуры
(изменение температуры, влажности воздуха, скорости ветра, атмосферного давления, колебание напряжения в сети измерительных приборов и др.);
3) изменение состояния лица, проводящего измерение (или замена
его другим лицом);
4) несовершенство самого теста (например, броски мяча в баскетбольную корзину до первого промаха).
На практике все перечисленные причины могут действовать совместно, но доля их влияния в каждом конкретном случае может быть различной. Без специальных приёмов оценить раздельно влияние каждой из причин невозможно. Следовательно, невозможно с достаточной для принятия практического решения вероятностью вынести суждение о том, чем
вызвано несовпадение результатов двух или более выполненных подряд
измерений, изменением состояния испытуемого или влиянием второй,
третьей или четвёртой причин. Аналогичная ситуация возникает, если
необходимо сопоставить результаты теста у разных испытуемых, если
при повторных измерениях их результаты (и их ранги) изменяются.
Понять, что является причиной этих изменений, без специального анализа
невозможно, так же как невозможно с уверенностью судить о том, у кого
из испытуемых измеряемое качество выше.
Естественно, что не все тесты обладают достаточной надёжностью,
более того, один и тот же тест в разных условиях и на разном контингенте
испытуемых может иметь различную надёжность. Таким образом, понятие «надёжность теста» может относиться к различным аспектам и в
зависимости от того, какая из причин, снижающих надёжность теста,
является основной, его можно разделить на несколько разновидностей:
воспроизводимость, стабильность и согласованность.
Воспроизводимость теста и способы её оценки
Под воспроизводимостью теста понимают степень совпадения
результатов повторного тестирования одних и тех же лиц, находящихся
в одном и том же состоянии, полученных одним и тем же исследователем
при минимальном временном интервале между первым и вторым измерениями.
Зачастую говоря о надёжности теста, имеют в виду именно его воспроизводимость. В принципе, при оценке воспроизводимости теста исследователя могут интересовать два вопроса:
14
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
1) изменяются ли ранги испытуемых от первого ко второму измерению (т.е. их положение в группе относительно друг друга);
2) изменяется ли уровень результата от первого ко второму измерению.
Простейший способ ответа на первый вопрос заключается в вычислении коэффициента корреляции между двумя повторными измерениями,
проведёнными на одной и той же выборке (п>20). Эта процедура называется «тест-ретест метод». Первое измерение называют тестом, а второе
- ретестом. Полученный при этом коэффициент обозначается Г и служит
количественной мерой воспроизводимости теста. Из теории статистики
известно, что коэффициент корреляции может принимать значения в
пределах от -1 до 1.
Если бы у каждого испытуемого результаты теста и ретеста в точности совпали, то коэффициент равнялся бы 1, что свидетельствовало
бы об абсолютной воспроизводимости теста, однако по ряду причин,
перечисленных выше, такого совпадения практически добиться не удаётся, поэтому коэффициент получается, как правило, ниже единицы. Общепринятых критериев надёжности не существует, однако можно использовать следующие градации оценки:
0,95 и >
отличная надёжность
0,90 - 0,95 высокая
0,80 - 0,90 удовлетворительная
0,70 - 0,80 приемлемая
менее 0,70 низкая
Если Г < 0,7 , то использовать тест для индивидуальной оценки не
следует, такой тест может быть применён только для оценки группы по
среднему арифметическому значению результатов испытуемых.
Для оценки влияния каждой из причин приходится повторять
процедуру, всякий раз изменяя условия тестирования (например, изменяя
условия проведения измерений, проводя замену экспериментатора или
изменяя интервал между первым и втором измерением). Так, если первое
и второе измерения разделяет минимальный временной интервал, и оба
измерения выполнены одним и тем же лицом, то основной причиной,
снижающей воспроизводимость теста, по-видимому, является естественная биологическая изменчивость уровня измеряемого свойства у
испытуемых. Если одну и ту же попытку независимо измеряют два разных
эксперта, то снижение воспроизводимости теста обусловлено влиянием
субъективных свойств экспертов (в данном случае речь идет о согласованности результатов тестирования). И, наконец, если один и тот же исследователь проводит повторное тестирование в одних и тех же условиях, но с
различным интервалом, то выявляется степень сохранения индивидуальных
15
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
различий между испытуемыми в зависимости от величины временного
интервала между тестом и ретестом. Относительная простота статистических расчётов коэффициента корреляции делает этот метод наиболее
популярным, однако за эту простоту приходится расплачиваться большими затратами сил и времени на проведение повторных серий тестирования.
В тех случаях, когда результат теста определяется как среднее значение от нескольких повторных измерений, проведённых в одно и то же
время (например, измеряется время реакции каждого испытуемого 20 раз
подряд и каждый из них оценивается по среднему арифметическому значению 20 измерений), оценка надёжности теста может быть выполнена
методом расщепления (split - halves methods, odd - even methods). При
использовании этого метода результаты тестирования каждого испытуемого разделяют на две части по 10 измерений (обычно их делят на
четные и нечётные). Затем для каждого испытуемого вычисляют две средних оценки (по первым и по вторым 10 измерениям). Таким образом,
каждый испытуемый получает две средних оценки (одну за первую половину теста, вторую - за вторую половину). Затем вычисляется коэффициент корреляции rQ между средними оценками испытуемых, полученными за первую и вторую половину теста. При этом оценивается надёжность не всех попыток, а только половины (в нашем примере - только 10
измерений). Для того чтобы получить оценку надёжности всего теста
(всех 20 попыток), можно воспользоваться формулой Спирмена-Брауна
(Spearmen - Brawn):
г - J ^ L .
И 11 +, Г
0,5
'
где Г0 - оценка надёжности половины теста,
г - надёжность полного теста.
При использовании метода расщепления надёжность теста можно рассчитать по формуле Рулона (PJ.Rulon), основанной на использовании ошибки измерения. Для этого нужно вычислить дисперсию разностей между
результатами каждого испытуемого по обеим половинам теста ( а 2 ) и
дисперсию полного (не расщеплённого) теста ( а К о э ф ф и ц и е н т
надёжности вычисляется по формуле:
гt t
x
1
2
Эта формула даёт оценку надёжности полного теста. При этом
дисперсия разностей определяется случайной вариацией, а её отношение
16
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
к полной дисперсии результатов теста оценивает её долю в общем
дисперсии. Вычитая эту долю из единицы, мы получаем долю «истинной»
дисперсии, которая равна коэффициенту надёжности.
Метод параллельных форм (parallel forms, alternate foirns, comporable
forms) предназначен для тех случаев, когда одно и то же свойство измеряется двумя разными способами и необходимо оценить степень согласованности между результатами этих тестов. Оценка Г t осуществляется с
помощью корреляционного анализа.
Одним из эффективных методов оценки надёжности теста является
дисперсионный анализ, с помощью которого можно ответить на оба поставленных выше вопроса и одновременно оценить совместное и раздельное влияние каждой из перечисленных причин. Однако этот метод
требует большой предварительной работы при организации тестирования, группировки полученных результатов и проведения объёмной
вычислительной работы. Хотя при наличии современных вычислительных средств последнее обстоятельство не является решающим, тем
не менее в практической работе с тестами оценка их надёжности чаще
всего выполняется одним из методов корреляционного анализа.
Стабильность теста
Одной из разновидностей надёжности теста является его стабильность. Под стабильностью понимают воспроизводимость результатов
при повторном тестировании, проводимом одним и тем же лицом в одних
и тех же условиях, когда первое и повторное измерения проводятся не
подряд, а разделены определённым временным интервалом. Не трудно
заметить, что стабильность теста отличается от обычной воспроизводимости только наличием более продолжительного интервала между
тестом и ретестом. Таким образом, речь идёт в основном о влиянии длительности временного интервала на воспроизводимость теста.
Стабильность теста зависит от:
1) вида теста;
2) контингента испытуемых;
3) временного интервала между тестом и ретестом.
Исследователя могут интересовать два вопроса:
1) в какой мере сохраняется уровень показателя;
2) в какой мере совпадают порядковые места, занимаемые испы туемыми по результату теста и ретеста.
Первый вопрос решается с помощью дисперсионного, а второй - с
помощью корреляционного анализа.
Чаще всего речь идёт об ответе на второй вопрос. Например, три
оценке пригодности теста для отбора очень важно иметь представление
о том, сохраняются ли различия между пр^
% т ^ н ь ц п •тигельного времени.
, \
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Согласованность теста
Согласованностью называется независимость результата теста от
свойств лица, проводящего измерение. Таким образом, речь идёт о воспроизводимости теста при проведении его на одном и том же контингенте,
в одно и то же время разными исследователями (или о совпадении экспертных оценок результата теста). В некоторых литературных источниках
эту разновидность надёжности называют объективностью. Возможны два
варианта влияния субъективных свойств исследователя на результат
тестирования:
1) различие в оценке вызвано разным отношением исследователей к
одному и тому же результату (например, оценка за ответ на экзамене);
2) исследователи по-разному влияют на результат (например, один
побуждает испытуемого, а другой относится нейтрально).
Нетрудно заметить, что эта разновидность надёжности теста особенно важна в тех случаях, когда результат теста является итогом экспертной
оценки, хотя и при объективных измерениях возможно влияние субъективных свойств исследователя.
В том случае, если исследователей только два, согласованность оценивается по коэффициенту корреляции между полученными ими результатами при тестировании (или оценивании) одной и той же группы испытуемых. В том случае, когда нужно оценить согласованность оценок нескольких исследователей (например, бригады судей в гимнастике или фигурном катании), то используется коэффициент конкордации.
Следует заметить, что термин «согласованность» является более
предпочтительным по сравнению с термином «объективность», поскольку оценки могут быть хорошо согласованными, но не объективными.
Кроме того, математическими методами возможно оценить именно согласованность, но не объективность результатов теста.
Способы повышения надёжности тестов
Для повышения надёжности теста используются различные приёмы:
1) стандартизация условий и инструмента измерений;
2) увеличение числа исследователей (экспертов, судей);
3) увеличение числа эквивалентных тестов:
4) повышение мотивации испытуемых;
5) увеличение числа измерений (попыток);
6) выбор оптимальных значений трудности, длины, скорости теста.
Если тест нетрудоёмкий, то повышение его надёжности может быть
достигнуто за счёт увеличения «длины» теста (количества измерений, попыток). При этом лучшую надёжность, как правило, даёт среднее арифметическое (х), менее надёжна медиана (Me) и ещё менее надёжна лучшая
18
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
попытка. Однако в тех случаях, когда дисперсия индивидуальных результатов намного меньше, чем дисперсия межиндивидуальная, можно использовать и лучший результат.
Для определения числа измерений (попыток), обеспечивающего необходимую надёжность, необходимо:
1) провести эмпирическую оценку надёжности теста ( г ) ;
2) выбрать необходимую (желаемую) надёжность ( Гц );
3) по формуле
Г
к =
«(]~Гц)
Г„(1-Ги)
вычислить коэффициент К, показывающий, во сколько раз нужно
увеличить число измерений. Например, при трёх измерениях г (( = 0,5 (т.е.
каждый испытуемый выполнил 2 серии по 3 попытки, от каждой серии
получена средняя арифметическая и коэффициент корреляции между
ними оказался = 0,5). Необходимая надёжность Г t* выбрана = 0,9.
Рассчитаем, во сколько раз нужно увеличить число измерений, чтобы г
равнялась 0,9 (т.е. чему равно К).
к
=
0,9(1- 0,5)
= 9
0,5(1-0,9)
Следовательно, для достижения необходимой надёжности число
измерений нужно увеличить в 9 раз, т.е. вместо трёх следует выполнить 27
попыток и, в качестве итогового результата теста, использовать среднее
значение от этих попыток. Разумеется, что возможности увеличения числа
измерений зависят от характера теста, в частности от того, насколько
продолжительна (или утомительна) для испытуемого процедура тестирования.
1.6. Информативность теста
Информативностью* (валидностью) теста называется его способность оценивать то свойство, которое хотят с его помощью измерить.
Таким образом, понятие «информативность» объединяет в себе два
вопроса: «что измеряет тест?» и «насколько хорошо он это делает?»
* Термин «информативность» в отечественной литературе используется как
синоним понятия «валидность» (validity - обоснованность, действительность).
19
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Сложность ответа на первый вопрос заключается в том, что в отличие от
прямого физического измерения, тестирование является своеобразной
разновидностью косвенного (шш опосредованного измерения), в котором
интересующее нас свойство непосредственно не измеряется, а косвенно
оценивается по результату измерения другого свойства (качества, способности). Например, если нас интересует сила разгибателей ног, то её можно
измерить с помощью динамометра. В этом случае вопрос о том, отражает
ли данный тест то, что мы хотим измерить, не возникает (можно ставить
под вопрос только надёжность измерения). Для оценки того же свойства
(силы разгибателей ног) можно использовать тест - прыжок с места в
длину. В этом случае сразу возникает ещё и второй вопрос: насколько
этот тест отражает силу разгибателей ног? Поскольку ясно, что больший
результат в прыжке может быть достигнут не за счёт большей силы, а за
счёт меньшей массы тела, лучшей техники прыжка или более высокой
мотивации испытуемого.
Рассмотрим несколько разновидностей информативности теста и
вариантов её оценки.
Информативность по определению. Это наиболее простой случай.
Например, ставится задача оценить «прыгучесть» спортсмена. Если определить (договориться), что понятие «прыгучесть» это способность спортсмена поднять общий центр массы своего тела в вертикальном прыжке
толчком двумя ногами на максимальную высоту, то измерение этой высоты, безусловно, будет информативным тестом для оценки «прыгучести».
Несколько сложнее выглядит ситуация, когда интересующее нас
свойство в принципе может быть объективно измерено, но в силу какихлибо обстоятельств (трудоёмкости, отсутствия соответствующих измерительных средств и др.) мы не можем это сделать. Например, мы не можем
измерять результат спортсмена на стайерской дистанции слишком часто,
но хотим получить представление о том, как изменяется его способность
показать этот результат.
И, наконец, ситуация наиболее сложная, когда свойство или качество
в принципе не поддаётся объективному измерению, а может быть описано
только на уровне семантических определений. Например, такие свойства,
как здоровье, тренированность или физические качества (сила, быстрота,
выносливость, ловкость).
Таким образом, если оценку надёжности теста можно осуществить
на основе анализа только его результатов, то для оценки информативности теста необходимо соотнести результат теста с некоторым внешним критерием. Отсюда следует, что ни один тест не может быть информативным «сам по себе» или «вообще». Он может быть информативен
20
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
только по отношению к какому-то критерию. Поскольку критерии могут
избираться различные, то и информативность теста будет меняться ь
зависимости от избранного критерия.
Выбор критерия зачастую быЕает наиболее сложной проблемой.
Информативность теста может быть охарактеризована на основе
качественного (логического), содержательного анализа того, что и как
оценивает тест и на основе математико-статистического анализа эмпирических данных, количественно описывающих результат теста и критерий. В первом случае говорят о логической или содержательной
информативности теста, во втором - об эмпирической информативности.
Следует подчеркнуть, что эти два способа не следует рассматривать
в отрыве друг от друга, т.к. несмотря на определённые преимущества
эмпирических критериев (объективность, сравнимость, пригодность для
математических расчётных методов прогнозирования), в практической
работе содержательная информативность всегда предшествует эмпирической её оценке. Именно на основе логической информативности производится первичный выбор теста. Логический, содержательный анализ
во всех случаях является обязательным, а в ряде случаев единственно возможным способом оценки информативности теста.
Понятие «информативность» не имеет однозначной трактовки. Так,
в теории тестов выделяют 7 основных видов информативности: содержательную (логическую), простую или сложную, абсолютную, дифференциальную, синхронную, диахронную, теоретическую (конструктивную)
и 12 производных разновидностей: очевидную, внутренюю, внешнюю,
чистую, инкременантную, параморфную, диагностическую, эмпирическую, ретроспективную, прогностическую, факторную и дискриминантную. Ю.И.Смирнов и М.М.Полевщиков (2000) приводят схему соотношения видов информативности тестов (рис.1).
Логическая, или содержательная информативность
Поскольку тестирование выполняется всегда с какой-то определённой целью, и его результаты используются для решения конкретной практической задачи (например, оценки состояния здоровья, тренированности, прогнозирования спортивного результата, отбора претендентов
и т. д.), то выбор теста и обоснование его пригодности для решения
поставленной задачи должны опираться на логический, содержательный
анализ тех свойств, которые предстоит оценить на самом деле и того, в
какой мере эти свойства отражены в результате теста. Например, совершенно очевидно, что такой тест, как измерение силы кисти не будет информативным для оценки музыкальных способностей.
21
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
ИНФОРМАТИВНОСТЬ
ТЕСТА
1. Содержательная или логическая
2. Простая или сложная
3 Абсолютная
4 .Дифференциальная
5.Синхронная
б.Дихронная
7.Теоретическая
или конструктивная
Дискриминантная
Факторная
Эмпирическая
Ретроспективная
Прогностическая
Диагностическая
Чистая
Внешняя
Внутренняя
Очевидная
Рис. 1. Структура видов информативности
(по Ю.И.Смирнову и М.М.Полевщикову)
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В тех случаях, когда качество, которое предстоит оценить с помощью
теста, семантически определяется однозначно и не допускает разлинныл
вариантов смыслового толкования, вопрос об информативности теста
решается относительно просто - по определению. В этом случае как бы
заранее договариваются, какой смысл вкладывать в то или иное понятие
(термин).
Например, договоримся, что под «аэробной производительностью»
будем понимать то, что измеряется максимальным потреблением кислорода (МПК). В таком случае вопрос о том, что измеряет МПК. не возникает. Сомнению может подвергаться надёжность теста, но не его инфор мативность.
Если интересующее нас свойство не имеет однозначного определения, то ситуация с обоснованием информативности более сложная.
Например, необходимо выбрать тест для оценки «работоспособности».
Сразу возникает масса вопросов: какой работоспособности - физической
или умственной, если физической, то какой - специальной или общей;
если специальной, то какой - аэробной, анаэробной и т.д.
Поскольку информативность геста зависит от его надёжности, а та,
в свою очередь, от других свойств теста (трудности, длины, скорости) и
от особенностей исследуемого контингента, то становится совершенно
очевидно, что уже на этапе предварительной оценки пригодности теста
необходимо дать ответы на все эти вопросы, причём на них нельзя ответить формальными математическими приёмами.
Наиболее сложной является ситуация, когда свойство, подлежащее
оценке, не только не может быть измерено прямым методом, но вообще
носит скрытый (латентный) характер. Например, такие свойства, как
«здоровье, «физическая подготовленность», «физические качества» хотя
и имеют определения в соответствующих областях науки (медицине,
теории физического воспитания), но определены только в качественных,
содержательных понятиях и обоснование пригодности тестов для их оценки может быть сделано только логическим путём. Содержание процедуры
логического анализа информативности формализовать практически
невозможно, но в общих чертах она сводится к анализу причинно-следственных отношений между факторами, определяющими уровень свойства
и факторами, влияющими на результат теста. Содержательный анализ
информативности теста совершенно необходим не только для предварительного выбора теста, но и для последующей смысловой интерпретации
результатов тестирования на этапе принятия практических решений.
Очевидная информативность связана с содержательной и характеризует представление исследователя или испытуемого о том, что оценивает
23
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
тест. При этом имеется в виду не столько то, что тест оценивает на самом
деле, сколько то, что он оценивает при первом впечатлении. Разумеется,
что содержательная и очевидная информативности могут не совпадать,
поскольку задание, используемое в качестве теста, может оценивать свойство,
которое не очевидно из характера или содержания теста. По этому поводу
А.Анастази замечает, что название теста не может служить указанием на
то, что он измеряет, оно позволяет лишь опознать тест (отличить его от
других). Проблема отображения непосредственно не наблюдаемых
(латентных) свойств по наблюдаемым (манифестным) результатам тестов
достаточно подробно рассмотрена в монографии П.Благуша (1982).
Эмпирическая информативность
Этот вид оценки информативности подразумевает возможность получения экспериментальным путем количественных, объективных характеристик результата теста и его сопоставления с количественной оценкой
критерия с последующим вычислением количественной меры их связи.
Наиболее простой случай, когда имеется единичный критерий (к), с
которым сопоставляется результат теста (t). Мерой информативности
теста является коэффициент корреляции (Г k )между результатом теста и
критерием.
В качестве критерия при оценке информативности тестов обычно
используются:
1) прямое измерение свойства;
2) спортивный результат;
3) результат другого теста, информативность которого не вызывает
сомнений;
4) составной критерий (сумма баллов по нескольким упражнениям);
5) принадлежность к какой-либо определённой группе (в этом случае
используются специальные виды корреляционного анализа, например,
коэффициент корреляции Юлла).
Существуют различные варианты корреляционного анализа, и выбор
того или иного из них зависит от многих причин, в том числе от вида
распределения результатов теста и критерия, от вида шкалы измерений, в
которой выражены их значения.
Наиболее часто информативность оценивается по коэффициенту
корреляции Бравэ-Пирсона.
Использование этого коэффициента предполагает, что выполняются
следующие условия:
1) тест и критерий имеют распределение, не отличающееся существенно от нормального;
24
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2) зависимость между результатом теста и критерием носит прямолинейный характер;
3) тест и критерий измерены в шкале отношений или интервалов.
При оценке информативности теста этим методом предполагается.
что результаты теста (X) связаны с критерием (Y) уравнением регрессии
типа
Y= КХ + В.
В таком случае наиболее вероятное значение (Y) может быть
рассчитано по уравнению:
Y
=
Y
+ Ryx (X, - X ) ,
гае:
Y - среднее арифметическое значение критерия;
X - среднее арифметическое значение результата теста;
X. - индивидуальный результат испытуемого;
R - коэффициент регрессии, который показывает, на сколько в среднем
изменяется Y, если X изменяется на единицу.
Мерой информативности (точности) индивидуальной оценки в этом
случае может служить
Этот показатель называют стандартной ошибкой оценки. При
полной информативности (r tk =l) ошибка оценки = 0 (т.е. по результату
теста X возможно абсолютно точное предсказание критерия Y). Если
информативность равна нулю (rtk=0), то возможность предсказания Y
по X равна простому угадыванию, т.е. применение теста вообще не имеет
практического смысла.
Если результаты теста и критерия выражены в шкале порядка (рангов), то для оценки информативности теста можно использовать коэффициент ранговой корреляции Спирмана
где d - разность рангов сопряжённых пар значений теста и критерия.
25
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Ранговый коэффициент свободен от ограничений, предъявляемых к
виду распределения и форме связи результатов теста и критерия, поэтому
он может быть использован и в тех случаях, когда тест и критерий измерены в шкале интервалов или отношений, но не выполняется одно из
условий применения г Пирсона. Разумеется, что при этом результаты
теста и критерия должны быть переведены в шкалу порядка, т.е. ранжированы.
Если результаты теста и критерий выражены в шкале наименований
таким образом, что их значения могут быть выражены дтя каждого испытуемого в виде двух альтернатив по тесту и двух альтернатив по критерию
(например, А- занимается спортом, В - не занимается спортом, С - заболел
гриппом, В - не заболел гриппом), то информативность может быть
оценена по тетрахорическому коэффициенту корреляции Юлла.
_
АВ - ВС I - 0 , 5 п
I
;
( А + В )( С + D )( А + С )( В + D ) '
Эмпирическая оценка информативности по составному критерию
В тех случаях, когда единичный критерий отсутствует, информативность теста может быть оценена по составному, сложному критерию,
синтезированному из элементов деятельности, способность к которой
предстоит оценить. Например, дтя оценки уровня специальной физической подготовленности хоккеистов нельзя предложить какой-то один
критерий, но можно логическим путём отобрать ряд критериальных элементов игровой деятельности (ускорения, броски, обводка). Затем результаты теста, подлежащего проверке на информативность, коррелируют с
количественной оценкой каждого из элементов или с их обобщённой
оценкой. В случае использования обобщённой оценки результатов измерения всех критериальных элементов, их переводят в одну из стандартных
шкал, определяют весовой коэффициент каждого из них, затем с учётом
весовых коэффициентов определяют суммарную критериальную оценку
дтя каждого испытуемого.
Мерой информативности теста может служить коэффициент корреляции между результатом теста и суммарной оценкой составного критерия. Практический эффект такого анализа может выразиться в том, что
в случае высокого Rtk весь комплекс может быть заменён одним тестом.
Основная трудность в реализации данного подхода заключается в определении весовых коэффициентов элементов составного критерия.
Другой подход основан на использовании факторного анализа, с
помощью которого можно выявить весовые коэффициенты и коэффициент
информа тивности. В таком случае говорят о факторной информативности.
26
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Особенно эффективен такой подход, когда составляющие элементы
критерия в явном виде выделить затруднительно (например, если крит ерий определён таким понятием, как «общая физическая подготовленность»).
Информативность комплекса тестов
При оценке информативности одного теста по одному критерию
говорят о простой информативности, если же по одному критерию оценивают комплекс из двух и более тестов, то говорят о сложной информативности.
При анализе комплекса тестов принято выделять чистую информативность, под которой понимают самостоятельную информативность
одного из тестов, входящих в комплекс, по отношению к критерию, который оценивается всем комплексом.
Степень повышения информативности всего комплекса в результате
включения в него дополнительного теста называют инкрементальной
информативностью.
При анализе пригодности комплекса тестов для прогноза достижений испытуемых в критериальной деятельности прогностическая
информативность входящих в комплекс тестов может быть оценена на
основе интуитивного мнения о перспективности испытуемых. В этом
случае говорят о параморфной информативности.
При анализе пригодности комплекса тестов приходится оценивать
информативность как входящих в него тестов, так и всего комплекса в
целом.
Поскольку при этом используются различные приёмы, то и оценки
информативности получаются различными в зависимости от того, какой
вид информативности оценивается.
Если критерий регистрируется одновременно с результатом теста,
то говорят о синхронной информативности. Если же значение критерия
определяется не одновременно с результатом теста, то информативность
называют диахронной. При этом критерий может быть промежуточный
(интермедиарный) или конечный (дефинитивный).
Разновидностями диахронной информативности является прогностическая (когда критерий регистрируют после результата теста) и ретроспективная (когда критерий получают до результата теста) информативность.
Если информативность оценивают только в отношении одного критерия, её называют абсолютной. Если же с помощью теста можно оценивать способности к различным видам деятельности, то говорят, что тест
обладает дифференциальной информативностью.
27
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Прямую или сложную информативность различают по числу тестов,
для которых выбран критерий, т.е. для одного, двух и более тестов. С
вопросами взаимного отношения простой и сложной информативности
тесно связаны следующие её разновидности:
- чистая информативность, выражающая самостоятельную информативность одного теста по отношению к критерию, который оценивается батареей тестов.
- инкрименантная информативность выражает степень повышения
сложной информативности комплекса тестов, когда данный тест включают в батарею тестов более высокого порядка.
1.7. Методические принципы тестирования
Чтобы получить достаточно надёжные и объективные результаты
(даже при наличии тестов, обладающих высокой информативностью),
тестирование должно проводиться с достаточной точностью и возможной
тщательностью. При этом затраты времени должны быть минимальными.
Поэтому к тестированию необходимо тщательно готовиться. Необходимо предварительно уточнить комплекс тестов, их надёжность и информативность, выяснить возможность выполнения теста в данных условиях,
узнать, существуют ли нормативы, которые можно использовать для
оценки результатов тестирования.
Избранные тесты целесообразно занести в информационные карточки, которые являются основой организации и оценки. Использование
карточек имеет большое преимущество перед протокольной формой
записи. Рекомендуется на обороте корточки поместить нормативы для
используемых тестов.
Если требуется, то нужно составить и распространить единую
инструкцию проведения тестов.
Помещение или площадку, где будет проходить тестирование, следует тщательно подготовить. Необходимо заранее наметить места для
выполнения отдельных тестов и порядок, в котором испытуемые будут
их выполнять. При этом лёгкие тесты должны предшествовать трудным.
Измерения должны выполняться по точной инструкции (сколько
попыток, средний или лучший результат и т.п.).
Необходимо обеспечить безопасность испытуемых. Перед началом
тестирования следует объяснить испытуемым цель тестирования, ознакомить с заданиями, если необходимо и возможно - дать выполнить пробные попытки.
Во время тестирования нужно своевременно подбодрить робких
спортсменов и побудить равнодушных к точному выполнению теста.
28
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При повторных тестированиях особое внимание нужно уделить
соблюдению одинаковых условий (время суток, приём пиши, последовательность выполнения тестов). Природные условия также могут
оказать влияние на результаты тестирования (ветер, температура, влажность воздуха, атмосферное давление, высота над уровнем моря, разница
во времени при дальних переездах и т.п.).
В практике контроля состояния спортсменов используются как лабораторные тесты, так и полевые, проводимые в естественных, близких к
соревновательным условиях двигательной активности спортсмена. В
отличие от лабораторных тестирований, проводимых в строго контролируемых условиях, результаты полевых тестирований подвержены влиянию неконтролируемых факторов (скорость ветра, температура, влажность, состояние спортивного покрытия и т.п.). Кроме того, портативные
системы сбора данных, используемые в полевых условиях, обычно менее
точны, по сравнению с лабораторными. Поэтому результаты, полученные в ходе проведения полевого тестирования, не так надёжны, как
результаты лабораторных тестов, но часто бывают более информативными, так как лучше отражают специфику конкретного вида спорта, кроме того, в ряде видов спорта исследователь не может эффективно имитировать специфику спортивного упражнения в лабораторных условиях.
Учитывая сказанное, следует рассматривать результаты лабораторных
и полевых исследований как дополняющие, но не заменяющие друг друга.
Подведение результатов тестирования необходимо делать немедленно и сообщать их испытуемому и тренеру с понятным для них объяснением.
При организации любого тестирования необходимо соблюдать
этические критерии, выполнение которых гарантирует уважение человеческих прав спортсмена (сообщать цели тестирования, давать информацию о возможном риске, связанном с его проведением; если необходимо, то соблюдать конфеденциальность результатов тестирования).
2. ОСНОВЫ ТЕОРИИ ОЦЕНОК
2.1. Проблема оценивания
Ни одно измерение вообще, и на человеке в частности, не проводится
без определённой цели. В самом общем виде целью измерений различных
свойств и качеств человека является оценка его состояния (оперативного,
текущего или перманентного). Для оценки состояния человека, занимающегося физической культурой или спортом, могут использоваться самые
29
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
различные характеристики, так или иначе отражающие его здоровье,
физическое развитие, психическое состояние, общую и специальную физическую подготовленность и т.п. Некоторые из этих характеристик оцениваются на основе экспертизы (например, результаты выступлений гимнастов, фигуристов), однако в большинстве случаев основой для такой
оценки служат результаты объективных измерений различных характеристик.
Сами по себе результаты таких измерений или тестов (несмотря на
объективный характер, обеспеченный необходимой точностью и надёжностью измерений) не содержат в себе указания на то, является зафиксированный уровень свойства «хорошим или плохим», «нормальным или
нет», а содержит только объективную основу для подобных оценок. Например, один и тот же результат в беге на 100 м, равный 13,2с, в зависимости от пола, возраста, спортивной специализации и квалификации
человека может рассматриваться и как очень хороший, и как очень
плохой. Поэтому для ответа на вопросы «здоров человек или болен»,
«соответствует ли уровень данного качества полу и возрасту человека»,
«какова тренированность спортсмена» и т.п. результат измерения должен
быть обязательно преобразован в оценку.
Кроме того, результаты измерения различных характеристик выражаются в разных единицах измерения (секундах, метрах, килограммах и
т.д.)и не сопоставимы друг с другом. Поэтому для сравнительной оценки
результатов, измеренных в различных единицах, их приходится
превращать в оценки (очки, баллы и т.д.).
В зависимости от задач, стоящих перед человеком, производящим
оценку, могут быть использованы различные процедуры (способы) и
критерии оценивания. Отсюда следует, что процессу оценивания всегда
предшествует некоторый субъективный момент, связанный с выбором
критерия и способа оценки. Следовательно, любой исследователь мог
бы предложить свой вариант оценивания. В таком случае процедура
оценивания потеряла бы смысл, т.к. её результат зависел бы не только и
не столько от уровня измеренного свойства, сколько от того, кто и как
проводит оценивание. Оценки стали бы трудно сопоставимыми. Например, один врач оценивал бы человека как здорового, а другой как
больного; один специалист говорил бы, что ребёнок имеет нормальное
развитие, а другой - считал бы его отстающим; один преподаватель устанавливал бы свой зачётный норматив, а другой - свой. Поэтому значение
имеет не только стандартизация процедур измерения и тестирования, но
и стандартизация приёмов и способов оценивания.
30
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
2.2. Основные понятия
Оценкой (или педагогической оценкой) называется унифицированная
мера успеха в выполнении какого-либо задания (теста). Процесс перевода
результата измерения в оценку называют оцениванием.
Оценка может быть выражена в качественной (словесной) форме
(например, «зачтено» или «не зачтено», «сдано», «не сдано», «неудовлетворительно», «удовлетворительно», «хорошо», «отлично») или в
количественной форме (например, баллы в школьных оценках или очки,
набранные в многоборье).
Различают учебные оценки, выставляемые преподавателем в процессе обучения, и квалификационные оценки, свидетельствующие о
квалификации человека в том или ином виде деятельности (спортивной,
производственной, научной и др.).
2.3. Задачи оценивания
Основными задачами, решаемыми в процессе оценивания, являются:
1. Сопоставление уровня различных достижений в одном и том же
задании (например, при оценивании результатов в командном зачёте
может возникнуть вопрос: сколько начислить команде за результат мастера спорта, а сколько за результат первого разряда).
2. Сопоставление уровня достижений в разных заданиях. Главной
трудностью при решении таких задач является уравнивание оценок за
достижения одинаковой трудности в разных упражнениях или разных
видах спорта (например, на сколько метров должен прыгнуть с трамплина
лыжник-двоеборец, чтобы получить столько же очков, сколько он набрал
в лыжной гонке).
3. Определение норм. Например, каким должен быть зачетный
норматив для получения зачёта по физической культуре для отбора в
ДЮСШ, каким должен быть норматив мастера спорта и т.п. В отдельных
случаях (например, в школьных оценках) нормы совпадают с градациями
шкалы оценок.
2.4. Процедура оценивания
Процедура оценивания может выполняться в один и в два этапа.
В первом случае результат измерения (теста) сравнивается с заранее
установленной нормой (критерием). Во втором - результат измерения
сначала на основе так называемых шкал оценок превращают в очки
(промежуточная оценка), а затем набранные очки сравнивают с заранее
31
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
установленной нормой (критерием) и определяют итоговую оценку.
Например, во всех многоборьях вначале результаты отдельных упражнений переводят в очки, а затем, после сравнения их с нормами спортивной классификации, выводят итоговую оценку - присваивают спортивный разряд.
В.М.Зациорский (1982) приводит схему полной процедуры оценивания, представленную на рис.2.
Рис.2. Процедура оценивания по В.М.Зациорскому
2.5. Шкалы оценок
Правило преобразования результата теста (или спортивного результата) в очки называется шкалой оценок. Шкала оценок может быть задана
в виде зависимости, представленной формулой, графиком или таблицей.
Любая оценка может быть сделана на основе некоторой шкалы. Наличие шкалы не всегда очевидно. Шкала может существовать в процедуре
оценивания как логический элемент (даже не осознанный). Шкала может
32
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
быть явной (например, таблица очков по какому-либо виду спорта), либо
не явной (например, школьные оценки). Но в процессе оценивания она
всегда присутствует.
Поскольку результаты различных тестов могут выражаться в разных
единицах измерения, то для определения итоговой оценки их необходимо
сначала преобразовать в условные (безразмерные) единицы - очки. Перевести результат теста в очки можно разными способами. Наиболее простой способ - ранжирование, т.е. количество очков, которое получают
испытуемые (или команды), равно занятому ими месту. Основной недостаток этого способа заключается в том, что он не учитывает различие
между результатами испытуемых, занявших смежные места. Независимо
от этого разница в оценках всегда будет равна одному очку. Поэтому
для перевода результата в очки лучше использовать шкалу оценок, в
которой разрыв между результатом и очками находится в определенной
зависимости. В принципе, можно предложить бесчисленное множество
вариантов шкал оценок. Однако все они распадаются на 4 основных типа.
Первый тип - пропорциональные шкалы. Этот тип шкал предполагает
начисление одинакового числа очков за одинаковый прирост результата,
независимо от исходного уровня (например, на рис.3 за каждые 15 см
улучшения результата в прыжке прибавляется 15 очков). В этом есть некоторая «несправедливость», поскольку добиться одного и того же прироста
при высоком уровне результата значительно труднее, чем при его низком
уровне.
Пропорциональные шкалы используются в современном пятиборье,
конькобежном спорте, лыжных гонках, лыжном двоеборье, биатлоне и
других видах спорта.
очки
—
±—
115
—
130
1
i
145
160
результат
—
175
190 см
Рис.3. Пропорциональная шкала для оценки
прыжка в длину с места мальчиков 13 лет
33
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Второй тип - прогрессирующие шкалы. В этих шкалах за одинаковый
прирост результата дается тем большая прибавка очков, чем выше был
его исходный уровень. Так, по шкале на рис.4, за прирост результата в
прыжке от 115 до 130 см прибавляется 5 очков, а за такой же прирост в
диапазоне от 160 до 175 см - 20 очков. Несмотря на то, что прогрессирующие шкалы выглядят более справедливыми, по сравнению с пропорциональными, их использование не всегда оправдано. Так, в многоборьях
применение таких шкал побуждало бы спортсмена уделять основное внимание тому упражнению, которое у него получается лучше всех остальных. Тем самым вместо подготовки по многоборному принципу такая
шкала стимулирует узкую специализацию. Однако если возникает необходимость сделать акцент на развитие какого-либо одного из упражнений
многоборья, то применение для этого упражнения прогрессирующей
шкалы будет вполне целесообразным. Применение прогрессирующих
шкал в комплексных спартакиадных зачётах стимулирует развитие
спорта высших достижений в ущерб массовому спорту. Прогрессирующие шкалы применяются в плавании, отдельных видах лёгкой
атлетики, тяжёлой атлетике.
очки
100 90
80 ^
70 J
I
50 30 20 10 0 -_
115
130
145
160
результат
175
190см
Рис.4. Прогрессирующая шкала дтя оценки
прыжка в длину мальчиков 13 лет
Третий тип - регрессирующие шкалы. Эти шкалы за одинаковый
прирост результата дают тем меньшую прибавку очков, чем выше был
его исходный уровень. Приведённая на рис. 5 регрессирующая шкала за
улучшение результата со 115 до 130 см прибавляет 37 очков, а за такой
же прирост от 160 до 175 см - всего 5 очков.
34
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
очки
результат
Рис.5. Регрессирующая шкала для оценки
прыжка в длину с места мальчиков 13 лет
На первый взгляд, эти шкалы выглядят ещё менее справедливыми,
чем пропорциональные, тем не менее, их использование в многоборьях
вполне оправдано, т.к. в этом случае спортсмен заинтересован, в первую
очередь, обращать внимание на отстающий вид.
Применение регрессирующих шкал для комплексного спартакиадного зачета будет стимулировать массовость в ущерб спорту высших
достижений. Эти шкалы применяются в некоторых легкоатлетических
прыжках и метаниях.
Четвёртый тип - сигмовидные (или S-образные) шкапы (рис.6). В этих шкалах
за одинаковые приросты результата наибольшие приросты очков происходят
в области их средних значений. Так, прирост результата со 115 до 130 см
оценивается в 5 очков, со 160 до 175 - в 20 очков, а со 190 до 205 - в 7 очков.
очки
115 130
145 160 175 190 205 220 см
результат
Рис.6. S-образная шкала для оценки прыжка в длину с места
мальчиков 13 лет
35
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Эти шкалы имеет смысл использовать для оценки физической подгоовленности населения. Такие шкалы используются с этой целью в США.
В спортивной практике сигмовидные шкалы не используются.
2.6. Разновидности шкал оценок
Стандартные шкалы являются одной из разновидностей пропорциональных шкал. Эти шкалы названы так потому, что в качестве
масштаба при начислении очков в них используются стандартные (средние квадратические) отклонения. Шкалы пригодны в том случае, если
распределение результатов близко к нормальному. В этом случае одинаковые оценки, полученные в стандартной шкале за разные задания, свидетельствуют об одинаковых (эквивалентных) достижениях. Кроме того,
используя таблицу нормального распределения, всегда можно определить
процент лиц, которому доступны достижения выше, ниже какой-либо
оценки (или в любом диапазоне стандартной шкалы).
Простейшей стандартной шкалой является Z- шкала, в которой очки
равны нормированному отклонению:
о
где X. - оцениваемый результат, X - среднее арифметическое значение
результата, G - стандартное отклонение, Z - оценка результата в очках.
Средний результат в этой шкале приравнивается к 0 очков. Результаты выше среднего получают положительные оценки, а результаты ниже
среднего - отрицательные. Для нормально распределённых результатов
очки 99,7% оценок лежат в интервале от - 3 до +3. Эта шкала не совсем
удобна из-за отрицательных значений оценок. Это неудобство легко
преодолевается во всех остальных стандартных шкалах с помощью следующего приёма: среднее арифметическое значение результата и стандартное отклонение приравниваются к некоторым числам, выбранным
таким образом, чтобы получить удобные градации шкалы. Так, в наиболее популярной Т - шкале среднее значение результата приравнено к 50,
а стандартное отклонение - к 10 очкам.
В результате чего формула дтя перевода результата в очки приобретает следующий вид:
Т = 50 + 10 Z.
36
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
При массовых обследованиях, когда не требуется большой точности,
используется стандартная шкала С:
С = 5 + 2 Z.
При проведении психологических исследований интеллекта применяют шкалу Бине:
В = 100 + 16 Z.
В ряде школ Европы и США для школьных отметок используют шкалу Н:
H = 3-Z.
В США при приёме в высшие учебные заведения используется экзаменационная шкала Е:
Е = 500 + 100 Z.
Персентильные{процентные) шкапы относятся к сигмовидным шкалам и представляют собой график накопленных частот, выраженных в
процентах (кумуляту).
По этой шкале оценка, полученная испытуемым в очках, соответствует теоретически ожидаемому проценту конкурентов, которых он мог
бы опередить, показав данный результат. Таким образом, одно очко это один процент испытуемых. Если прирост в одно очко приравнивается
к интервалу, включающему 10% испытуемых, то такой интервал называют децилем. Если на одно очко приходится интервал, содержащий 25%
испытуемых, то такой интервал называют квартилем.
На рис.7, приведены наиболее распространённые шкалы и их связь
с нормальным распределением (по А.Н.Петросяну)
Шкалы выбранных точек используются в тех случаях, когда параметры распределения результатов невозможно получить. Процедура
построения шкалы выбранных точек выглядит следующим образом:
- высокий спортивный результат (мировой рекорд или 10-й результат
в истории данного вида спорта) приравнивают его к 1000 или 1200 очкам;
- затем определяют средний результат для выборки новичков и
приравнивают его к 100 очкам.
37
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
-г
-4,0 -3.0 -2.0
to"
-1.0 -2,0 -3.0 -4.0
Z-шкала
20
30
40
J
50
Т-шкала
Q.I
>6
60
L.
70
80
98
99.9
_l
50
84
Пврцвнтильная шкала
1
Рис.7. Наиболее
распространённые
шкалы оценок
3 [,4 j 51 €
Дамтибаллъиая шкала
С-мкала 1 3
5
7
9
'——'—• .
i •• • — r двцмли
I 234 6 7 8 9
10
После этого выбирают тип шкалы. Если избрана пропорциональная
шкала, то задача сводится к нахождению уравнения прямой, проходящей
через выбранные опорные точки. В том случае, если предполагается
использовать криволинейную шкалу (прогрессирующую или регрессирующую), предстоит выбрать степень её кривизны. Математические
методы решения подобных задач не разработаны и их приходится решать
эмпирическим способом.
Параметрические шкалы
Шкала, которая позволяет определить зависимость между двумя
параметрами (например, «вес тела - вес штанги» в рывке и толчке; или
«дистанция - время» в разных видах циклических упражнений).
Эти шкалы позволяют определить эквивалентные по трудности
(нагрузке) упражнения. Например, на рис.8 приведена зависимость длины дистанции и времени мировых рекордов.
Из графика видно, что спортсмены затрачивают 10 минут на
преодоление следующих дистанций: в велоспорте - 9 км; конькобежном
спорте - 7,5км; беге - 3,8км; плавании - 1км.
38
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Рис.8. Параметрическая
зависимость между длиной
дистанции (км) и временем
её преодоления (с)
Шкала ГЦОЛИФК используется в тех случаях, когда при повторном
тестировании не удаётся сохранить одни и те же условия, и сопоставление
результатов становится затруднительным. Для таких случаев на кафедре
биомеханики Г Ц О Л И Ф К предложена следующая шкала:
Очки = 100
лучшии результат - оцениваемый результат
лучший результат - худший
результат
Спортсмен, показавший лучший результат, по этой шкале получает
100 очков, занявший последнее место, - очков не получает.
2.7. Критерии эквивалентности шкал
Одной из наиболее сложных метрологических проблем является
разработка эквивалентных шкал, оценивающих достижения в разных
заданиях равным количеством очков.
Существуют различные подходы к определению эквивалентности
шкал. Выбор критерия эквивалентности осуществляется не математическим путём, а на основе логического анализа целей, ради которых разрабатывается шкала.
Первым критерием эквивалентного уровня достижений в различных
заданиях является одинаковый процент людей, которым доступен результат в этих заданиях. В этом случае считается, что мировые рекорды, результаты, доступные 50 или 75% лиц в каждом виде спорта (или в тестовых
заданиях), имеют одинаковую трудность.
39
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
На этом принципе построены так называемые квантильные шкалы.
Эти шкалы представляют собой точки, разбивающие распределение на
п частей равного объёма (квартили-4 части, децили-10 частей, перцентили
-100 частей).
На недостатки обоснованности т а к о г о подхода указывают
следующие обстоятельства:
1) мировые рекорды и средние значения 10 лучших спортсменов в
разных видах спорта имеют неодинаковую трудность;
2) разные виды спорта не одинаково популярны и ими занимается
неодинаковое количество людей;
3) места, занятые спортсменами или командой в разных видах, не
могут рассматриваться как эквивалентные при разном числе участников
(например, 5-е место из 10 участников и 5-е место из 100 участников).
Отсюда следует, что какой бы критерий не избирался, любое достижение (в частности любой норматив) в данное время доступен только
определённому проценту лиц. Этот процент необходимо знать.
Если критерий эквивалентности, основанный на равном проценте
людей, которым доступно данное достижение (результат), признан
приемлемым, можно полагать, что комбинация анализа статистического
распределения спортивных результатов; прогноза эквивалентных достижений на будущее с учётом темпов роста результатов по видам спорта,методов коррекции оценок с учётом неодинаковой распространённости
видов спорта может привести к построению систем оценок, которые в
системе рассматриваются как оптимальные.
Вторым критерием эквивалентности результатов в разных видах
спорта (или тестовых заданиях) могут служить равные сроки, необходимые для подготовки к этим результатам. Однако в этом случае предполагается, что методика подготовки в этих видах спорта одинаково совершенна, что, конечно, не всегда так.
Третьим критерием может служить мнение специалистов (экспертов)
об эквивалентности достижений. Этот подход всегда имеет субъективную
окраску.
Четвёртый критерий основан на использовании регрессионного анализа и расчете так называемых «должных величин».
Пятый критерий - среднее количество очков, набранное одними и
теми же спортсменами в разных упражнениях.
Шестой критерий - равенство достижений и набранных очков, т.е.
разности между достижениями сильных и слабых спортсменов во всех
видах должны быть примерно одинаковыми.
Седьмой критерий - равенство корреляции с результатами многоборья.
40
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Восьмой критерий - параметры кривой мировых рекордов в параметрическом графике.
2.8. Критерии пригодности шкал
Как видно из краткого анализа свойств шкал различных типов, вопрос о том, какая из них лучше, имеет смысл только в том случае, если
заранее определена цель оценивания. Тем не менее, любая шкала должна
отвечать следующим критериям:
1) быть справедливой, т.е. оценивать достижения одинаковой трудности (эквивалентные) одинаковым количеством очков, а более высокие
достижения - большим количеством очков;
2) использование шкалы должно приводить к полезному, с точки зрения практики, результату.
В тех случаях, когда возможно, следует сочетать эти критерии. Однако они не всегда совместимы. Так, наиболее справедливой является
прогрессирующая шкала, однако, как видно из вышесказанного, её использование в многоборьях нецелесообразно.
2.9. Оценка результата по комплексу тестов
Если тестирование проводится по комплексу тестов, то его результаты могут использоваться дтя решения двух задач:
1) для сравнительной оценки результатов каждого теста у одного
испытуемого;
2) для сравнительной суммарной оценки разных испытуемых по
всему комплексу тестов.
Рассмотрим первую задачу. При её решении необходимо преодолеть
две трудности метрологического характера:
1) избавиться от размерности;
2) сделать результаты разных тестов сопоставимыми, приведя их к
одному масштабу.
Если распределение результатов тестов не имеет значительного отклонения от нормального, то обе эти трудности можно преодолеть, используя
стандартную шкалу оценок. Наиболее распространённым приёмом является
использование рассмотренной выше шкалы Z (нормированного отклонения)
для результата каждого теста. Для этого нужно предварительно рассчитать
значения X иСТдля людей данного типа (пола, возраста, вида спорта,
квалификации). При необходимости можно использовать любую другую
стандартную шкалу.
Для наглядного отображения результатов тестов, оцененных в шкале
Z, обычно используют так называемые индивидуальные профили. На
41
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
рис.9 приведен пример индивидуального профиля велосипедиста пятнадцати лет. При повторном тестировании появляется возможность сопоставить не только результаты разных тестов, но и их приросты.
Рис.9. Индивидуальный профиль велосипедиста 15 лет
Этот же подход может быть использован для выявления типологических различий в уровне изучаемых характеристик групп, представляющих
различные спортивные специализации. В этом случае X. - среднее арифметическое значение признака для изучаемой группы, а X и О вычисляются
для большой выборки спортсменов без учёта спортивной специализации.
В том случае, когда результаты тестов имеют распределение, значительно отклоняющееся от нормального, их можно сопоставить по персентильным шкалам.
Вторая задача заключается в выведении суммарной оценки каждого
испытуемого по комплексу тестов. Процедура выведения такой оценки
заключается в том, что сначала по избранной шкале результат каждого
геста переводится в очки, а затем эти очки суммируются. Так поступают,
если все измеряемые признаки считаются равноценными (равновесомыми).
Если же результату каждого из тестов необходимо придать различный «вес», соответствующий его значимости в суммарной оценке, то очки,
набранные испытуемым по каждому тесту, сначала умножают на соответствующий весовой коэффициент, а уже после этого их суммируют.
Такая суммарная оценка называется взвешенной. Наибольшую трудность
в этом случае представляет определение весовых коэффициентов
42
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
отдельных тестов. Существует несколько различных подходов для определения этих коэффициентов:
- первый заключается в том, что группе квалифицированных специалистов (экспертов) предлагают независимо друг от друга определить
весовой коэффициент каждому тесту, затем находят среднее арифметическое значение коэффициента для каждого теста;
- второй способ получения весовых коэффициентов - использование
факторного анализа. В этом случае в качестве коэффициентов используются факторные веса;
- третий способ может быть использован в том случае, если имеется
объективный количественный критерий информативности всего комплекса тестов (например, спортивный результат). В этом случае в качестве
«веса» для каждого теста может быть использован коэффициент корреляции его результата с критерием (коэффициент информативности);
- четвертый способ заключается в расчёте уравнения множественной
регрессии, позволяющего не только получить весовые коэффиценты для
каждого теста, но и осуществить прогноз критериального результата.
2.10. Нормы
Понятие «норма». Разновидности норм.
Разрабатывая нормы, мы сталкивается с необходимостью решения
«проблемы классификации», которое предполагает определение понятия
«норма» и количественного описания этой нормы.
Понятие «норма» используется в самых различных областях: в биологии, медицине, психологии, физиологии, педагогике, физической культуре и др. Вокруг толкования этого понятия в биологии и медицине идут
дискуссии. При этом «норма» чаще всего понимается как некоторый
образец, эталон и противопоставляется таким понятиям, как «аномалия»,
«уродство», «патология», «болезнь». В педагогике и физическом воспитании норма имеет несколько иной смысл, так как, кроме оценивающей
функции, она выполняет ещё и стимулирующую роль. Понятие «норма»
в физиологии и медицине определяется как «... условное обозначение
равновесия организма человека, отдельных его органов в условиях внешней среды» (Большая медицинская энциклопедия, 1961).
Нормой в спортивной метрологии называют граничные значения
признака, позволяющие отнести испытуемого к одной из классификационных норм. Классификационными признаками помимо пола и возраста могут служить: уровень физического развития, физической подготовленности, спортивного мастерства и др.
43
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Принято различать 3 разновидности норм: сопоставительные, индивидуальные и должные.
Сопоставительные нормы предназначены для оценки какого-либо
свойства или способности человека путём его сравнения с характеристикой той генеральной совокупности, к которой он принадлежит.
Чаще всего такие нормы строятся на основе стандартной шкалы. При
этом, в зависимости от строгости подхода, за нормальные значения могут
приниматься различные интервалы. Количественно норма обычно связывается с типичным, устойчивым значением признака, выраженным в
виде среднего арифметического и некоторой областью отклонений от
этого среднего. Важно заметить, что если среднее значение признака
для данной популяции является относительно устойчивым и с течением
времени изменяется мало, то в отношении зоны индивидуальных отклонений, которые следует относить к норме, единства мнений не существует.
Так, для оценки физического развития человека Р.Мартин предлагает 7
градаций, а к нормальному уровню относит интервал X ± 0,5 СУ (38%);
П.Башкиров предлагает 5 градаций, относя к норме X ± 0.7(7 (50%);
В.Штефко т а к ж е предлагает 5 градаций и считает нормальными значения в интервале X ± (7 (68%), именно этот последний подход чаще всего
используется биологами и психологами.
В качестве аргумента в доказательство целесообразности того или
иного подхода делаются ссылки на математико-статистическую доказательность его справедливости. Совершенно очевидно, что обоснование
границ нормы должно опираться на медицинскую или биологическую
аргументацию. Так, при оценке верхней и нижней границ физиологической нормы для человека, по-видимому, следует считать такие уровни
признака, при которых большинство людей не испытывает чувства
субъективного дискомфорта, не жалуется на пониженную работоспособность, быструю утомляемость, болезненные симптомы, свидетельствующие о нарушении коадаптации функций организма. Параметры этих
границ, выявленные по результатам одновременной объективной регистрации свойства (качества, способности), на наш взгляд, и должны служить
основой для последующего статистического описания нормы.
В педагогике под «должной нормой» понимают то, что человек должен знать или уметь для того чтобы успешно справляться с какой-либо
деятельностью. Например, для того, чтобы получить водительское удостоверение, человек должен знать правила уличного движения и уметь
управлять автомобилем.
Одним из наиболее сложных вопросов при конструировании норм
является выбор её трудности (степени доступности норматива) и установление градаций нормы. Например, какой уровень результата в тесте
44
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
физической подготовленности считать нормальным, какой выше, а какой
значительно выше нормы. Решение этих вопросов лежит вне области метрологии и математики, их необходимо решать, опираясь на содержательный анализ роли изучаемых признаков. В любом случае основным
Критерием правильности выбранных градаций нормы должен являться
полезный эффект от применения нормативов в той области практики,
для которой они созданы. Например, завышенные нормы при оценке
состояния здоровья человека могут привести к тому, что неоправданно
большой процент людей будет отнесен в категорию больных. Ещё хуже
будет, если при оценке здоровья человека будут использоваться заниженные нормативы.
При конструировании педагогических норм (например, для оценки
физической подготовленности детей) слишком лёгкие и неоправданно
завышенные нормы могут привести к одинаково нежелательному результату - потере интереса занимающихся к физическим упражнениям.
В сопоставительных нормах дтя выбора эквивалентных градаций
норм иногда используют такой критерий, как время, необходимое для
достижения определённого уровня мастерства. В спортивной классификации использование такого критерия вполне оправдано. Нарушение
этого требования может привести к тому, что вид спорта, в котором эти
сроки значительно меньше (по сравнению с другими видами) будет наиболее привлекателен для людей. И напротив, вид, в котором для достижения
той же квалификации нужно затратить больше времени, будет менее
популярен. Поэтому желательно, чтобы время, необходимое для достижения одинаковой квалификации в различных видах спорта, было одинаковым.
При использовании сопоставительных норм следует учитывать, что
они позволяют сравнивать испытуемых внутри данной совокупности (и
по отношению к данной совокупности), но никак не характеризуют
уровень самой совокупности. В связи с этим, если в каком-то регионе в
силу влияния неблагоприятных факторов может снизиться уровень
физического развития или физической подготовленности людей, нормы,
рассчитанные на основе средних значений данного региона, позволят
считать заведомо неприемлемый уровень характеристик нормальным.
Поэтому сопоставительные нормы, разработанные для разных регионов,
должны сравниваться между собой для внесения соответствующих
поправок.
Возрастные нормы
Одной из разновидностей сопоставительных норм являются возрастные нормы. Наиболее распространёнными являются нормы, разрабатываемые на основе X ± О , полученных на больших выборках людей
45
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
одного пола и возраста. Например, нормы для оценки физического развития детей и подростков. При этом, как правило, используется стандартная
шкала.
Другой разновидностью сопоставительных норм являются нормы
для оценки биологического возраста. В эти нормах определяется степень
биологической зрелости подростка и тот возраст, которому эта степень
соответствует (например, мальчик, имеющий календарный возраст 13 лет,
может быть отнесён по биологическому возрасту к 11- летним, если его
развитие отстаёт, и к 14-15 -летним, если он опережает в развитии своих
сверстников).
По такому же принципу определяют так называемый двигательный
возраст. В этом случае измеряют результат в двигательном тесте и смотрят, какому возрасту он соответствует. Если испытуемый по биологическому или двигательному возрасту опережает своих сверстников, то
его называют акселерантом, а если отстаёт - то ретардантом. Из-за
гетерохронности (неодновременности) развития различных функций
человека может получиться, что по одному показателю испытуемый
относится к акселерантам, а по другому - к ретардантам. В связи с этим
оценка уровня физического развития и физической подготовленности
должна осуществляться по комплексу показателей (тестов).
Построение возрастных норм предполагает группировку людей по
возрастным группам. В детском и подростковом возрасте из-за быстро
происходящих изменений возрастные градации избирают более частые
(через один, три месяца, полгода или год), для взрослых людей допустимо
объединять в одну группу несколько смежных возрастов. В научных
исследованиях принято определять возрастные градации в 1 год ± 5
месяцев и 29 дней (например, мальчик, которому исполнилось 7 лет и 6
месяцев считается 8-летним, а 7 лет 5 месяцев и 29 дней - семилетним).
Международные стандарты предполагают использование десятичной системы для определения возраста.
Учёт особенностей телосложения при построении нормативов
Характеристики телосложения - рост, вес тела влияют на возможности людей при выполнении двигательных тестов. Например, люди с
большим ростом и весом имеют преимущество в метаниях, с большим
ростом и относительно небольшим весом - в прыжках в высоту. Поэтому
нормативы в отдельных двигательных тестах представляют различную
трудность для людей с различными особенностями телосложения. В такой
ситуации было бы не только справедливо, но и полезно установить
нормативы не только с учётом возраста, но и особенностей телосложения.
Такие нормативы устанавливают с помощью уравнений множественной
регрессии. Например, в США и Канаде для определения норматива в
прыжке в длину с места используется формула:
46
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Y = 20 X, + 2,5 X, + 2,0X3 - 12,
где Y - норматив в прыжке; X t - возраст в десятичной шкале; X , рост, см; Х3 - вес тела, кг.
Индивидуальные нормы
Индивидуальные нормы разрабатываются на основе данных, полученных от одного и того же человека в разных состояниях, и служат для
оценки состояния этого человека путём сравнения с типичным для него
уровнем. Например, наблюдая ежедневно за частотой сердечных сокращений человека в покое в течение 2-3 месяцев, можно рассчитать X и СУ и
использовать их для оценки его состояния. Точно так же можно построить
индивидуальную норму и по другим показателям. Такие нормы необходимы для осуществления текущего контроля за состоянием человека.
Совершенно очевидно, что индивидуальные нормы должны сопоставляться с популяционными, в противном случае заведомо неприемлемый уровень признака можно принять за индивидуальную норму. Например, если мужчина 24 лет при росте 173 см имеет вес тела 98 кг и систолическое артериальное давление 180 мм рт.ст., то совершенно очевидно,
что он имеет избыточный вес и страдает гипертонической болезнью.
Принять такие индивидуальные средние значения веса тела и артериального давления за индивидуальную норму никак нельзя.
Должные нормы
В ряде случаев, оправданным является построение нормы в виде так
называемой «должной величины» - наиболее вероятного значения оцениваемого признака, рассчитанного в зависимости от значений других
характеристик испытуемого. Так, в медико-биологических исследованиях
на основе регрессионного анализа определяют должные величины массы
тела в зависимости от длины тела, или должные величины жизненной
ёмкости лёгких в зависимости от массы тела и т.п. В ряде случаев должная
величина рассчитывается в зависимости от значения нескольких признаков (в этом случае строятся уравнения множественной регрессии).
Критерии пригодности норм •
Нормы составляются всегда для определённой совокупности людей
и пригодны только для данной оценки представителей этой совокупности.
Это свойство норм называется релевантностью.
Нормы разрабатываются по результатам выборочных исследований.
И только в том случае будут пригодны для всей совокупности, если они
построены по данным, полученным на репрезентативной выборке. Следовательно, вторым требованием к нормам является репрезентативность.
И, наконец, следует учитывать, что со временем нормы устаревают и
требуют пересмотра. Отсюда третье требование к нормам - современность.
47
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
3. МЕТОДЫ КОЛИЧЕСТВЕННОЙ ОЦЕНКИ
КАЧЕСТВЕННЫХ ПОКАЗАТЕЛЕЙ
Качество - это существенные свойства объекта, которые позволяют
отличать его от других объектов. Качественными называют характеристики, не имеющие определенных единиц измерения. Таких характеристик
в физическом воспитании и спорте много (выносливость, артистичность
и выразительность движений, эффективность соревновательной
деятельности, качество спортивного инвентаря и т.п.). При решении различных задач, связанных с оценкой состояния спортсмена, определением
спортивных результатов в фигурном катании, гимнастике, прыжках в
воду возникает необходимость количественной оценки различных
свойств человека, не поддающихся объективному измерению. Раздел
метрологии, в котором рассматриваются методы количественной оценки
качественных характеристик, называется квалиметрией. В процессе
оценки качества происходит его сопоставление с некоторым «эталоном
качества», который не всегда может быть однозначно выражен. Так, для
количественной оценки артистичности выступления фигуриста судья
вынужден сопоставлять то, что он увидел, со своим представлением об
артистичности. При этом оценка происходит не по одному, а по многим
признакам, а наивысшая обобщённая оценка не обязательно соответствует максимально возможному уровню каждого признака. Разумеется,
что такая оценка всегда носит субъективную окраску (не случайно оценки,
выставленные разными судьями одному и тому же спортсмену, часто не
совпадают). Такую оценку часто называют измерением, при этом термин
«измерение» понимают как процесс установления соответствия между
свойствами объектов и их числовыми оценками.
В основе квалиметрии лежат следующие положения:
- любое качество можно измерить;
- качество зависит от ряда свойств, образующих «дерево качества»;
- каждое качество определяется двумя числами: относительным
показателем К и весомостью М. Относительный показатель характеризует выявленный уровень измеряемого свойства (в процентах от его
максимально возможного уровня), а весомость - сравнительную важность
разных характеристик оцениваемого качества;
- сумма весомостей свойств на каждом уровне равна единице
(или 100%).
Общая Q оценка выводится по формуле Q = £ к . М ,
48
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где Q - оценка качества, М. - весомость показателя, Kj - относительный показатель.
Например, фигурист получил за технику исполнения оценку К т =5.6
•балла, за артистизм - оценку К с = 5,4 балла. Весомости техники
исполнения и артистизма в фигурном катании на коньках признаны
одинаковыми (Мт = Мс= 1,0).
Поэтому общая оценка Q = К т М т + К. Мс составила 11,0 балла.
Наиболее широко используемыми в квалиметрии методами оценивания являются экспертное оценивание и анкетирование. Проведение экспертизы и анкетирования - это отчасти техническая работа, предполагающая строгое соблюдение определённых правил, а отчасти - искусство, требующее интуиции и опыта.
3.1. Метод экспертных оценок
Экспертной называется оценка, получаемая путём выяснения мнений
специалистов. К мнению специалистов обращаются в том случае, когда
осуществить точное, объективное измерение качества невозможно или
затруднительно.
Субъективная оценка эксперта в значительной мере зависит от его
индивидуальных особенностей, квалификации, опыта, эрудиции, самостоятельности и т.п.
Несовпадающие индивидуальные оценки экспертов рассматриваются как случайные величины и обрабатываются статистическими
методами.
Проведение экспертизы включает следующие основные этапы:
формирование цели, подбор экспертов, выбор методики, проведение опроса и обработку полученной информации, в том числе и оценку согласованности индивидуальных экспертных оценок.
Подбор экспертов - важный этап экспертизы, так как не от всякого
специалиста можно получить достоверные данные. Экспертом может
быть человек: 1) обладающий высоким уровнем профессиональной
подготовленности; 2) беспристрастный; 3) обладающий интуицией; 4) не
склонный к соглашательству.
Для объективной оценки компетентности экспертов могут быть применены специальные анкеты, отвечая на которые в течение строго определённого времени, кандидаты в эксперты должны продемонстрировать
свои знания.
49
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Другой подход к отбору экспертов основан на определении эффективности их деятельности. Абсолютная эффективность определяется
отношением правильных оценок к общему числу оценок, сделанных экспертом. Относительная эффективность оценивается по отношению абсолютной эффективности эксперта к средней абсолютной эффективности
группы экспертов. Очевидно, что эксперты представляют тем большую
ценность, чем выше абсолютная и относительная эффективность их
деятельности.
Большое значение для достоверности экспертизы имеет степень
согласованности мнений экспертов. Если в экспертизе участвовали только
2 эксперта, то согласованность их оценок можно оценить по коэффициенту ранговой корреляции, если экспертов более двух, то для этой цели
используют коэффициент конкордации:
w=
125
m2(n3-n)
'
где W- коэффициент конкордации, m - количество экспертов, п количество оцениваемых объектов, S - сумма квадратов отклонений сумм
рангов, полученных каждым объектом (испытуемым), от средней суммы
рангов.
Коэффициент конкордации может принимать значения от 0 (при полном отсутствии согласованности) до 1 (при полном совпадении оценок
экспертов). Следует заметить, что речь идет о согласованности мнений
экспертов, а не правильности этих мнений. Теоретически нельзя исключить вариант, когда хорошо совпадающие мнения являются результатом
широко распространённой, неверной (или устаревшей) точки зрения. По
этой же причине широко используемое на практике определение квалификации эксперта по отклонению его оценок от средних оценок группы
экспертов также не является, безусловно, достаточным критерием. Именно поэтому для повышения качества экспертизы стараются повысить
квалификацию экспертов путём специального обучения, тренировок и
ознакомления с возможно более обширной объективной информацией
по анализируемой проблеме. Так, судей во многих видах спорта можно
рассматривать как экспертов, для повышения квалификации которых
проводят специальные семинары.
Точность экспертизы зависит от количества экспертов. При уменьшении количества экспертов гипертрофируется роль каждого из них. При
очень большом количестве экспертов трудно добиться согласованного
мнения. Оптимальное количество экспертов можно установить по
графику на рис. 10.
50
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
число экспертов
Рис.10. Зависимость погрешности экспертной
оценки от количества экспертов (по Даклей, 1969)
Способы проведения экспертизы
Существует несколько способов проведения экспертизы.
1. Наиболее простой - ранжирование объектов. Суть этого метода
заключается в том, что все эксперты независимо друг от друга присваивают каждому объекту ранг (место). Обычно наиболее предпочтительному объекту присваивают наивысший (первый) ранг, наименее предпочтительному - последний ранг. Затем определяется сумма рангов, полученная каждым объектом. Предпочтение получают объект, набравший
меньшую сумму баллов. Недостатком метода является то, что сумма оценок, полученных каждым объектом, определяет только его место относительно других объектов, но не оценивает, насколько объекты отстоят друг
от друга по уровню оцениваемого качества.
2. Более распространённым является метод непосредственной оценки
по какой-либо количественной шкале. В этом случае эксперт присваивает
каждому объекту определённое количество очков (баллов), как это делают судьи в гимнастике или фигурном катании.
3. Метод последовательного сравнения. Суть метода заключается в
следующих шагах:
а) вначале все объекты ранжируются в порядке значимости;
б) наиболее важному объекту присваивается оценка, равная единице,
а остальным (тоже в порядке значимости) - оценки меньше единицы - до
нуля;
в) эксперты решают, будет ли оценка первого объекта превосходить
все остальные. Если да, то оценка «веса» этого объекта увеличивается;
если нет, то - уменьшается;
51
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
г) указанная в пункте «в» процедура повторяется до тех пор, пока не
будут оценены все объекты.
4. Метод парного сравнения основан на попарном сравнении всех
объектов. При этом в каждой паре объектов устанавливается наиболее
весомый, который оценивается в 1 балл. Второй объект оценивается в О
баллов. Каждый эксперт независимо от других заполняет матрицу попарного сравнения всех объектов. Затем находится сумма баллов, полученных каждым объектом у всех экспертов.
3.2. Анкетирование
Анкетирование, беседа и опрос относятся к методам опроса. Эти
методы позволяют получить мнения людей обо всём, что не может быть
установлено с помощью инструментальных измерений. Анкетированием
называют метод сбора мнений посредством заполнения анкет. Применяются различные формы анкетирования: групповое и индивидуальное;
очное и заочное, персональное и анонимное.
При составлении анкет наибольшее внимание уделяется чёткой и
осмысленной формулировке вопросов. По своему характеру вопросы
можно разделить на следующие типы:
1) вопрос, при ответе на который необходимо выбрать одно из заранее сформулированных мнений (в некоторых случаях каждому из этих
мнений эксперт должен дать количественную оценку по шкале порядка);
2) вопрос о том, какое решение принял бы эксперт в определённой
ситуации (здесь также возможен выбор решений с количественной
оценкой предпочтительности каждого их них);
3) вопрос, требующий оценить численные значения какой-либо величины.
В последнее время квалиметрические методы всё чаще используются
для оптимизации тренировочной и соревновательной деятельности.
Синтез квалиметрических методов с методами объективных инструментальных измерений значительно расширяют возможности решения
научных и практических задач в области физической культуры и спорта.
4. КВАЛИФИКАЦИОННЫЕ СИСТЕМЫ (КС)
4.1. Типы квалификационных систем
1. Учебные К С по физическому воспитанию в общеобразовательных
школах, ПТУ, техникумах, вузах и т.п. учреждениях. Эти системы, как
52
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
правило, входят составной частью в учебные программы и являются
обязательными для всех обучающихся. Эти системы отличаются большим
многообразием.
2. Профессиональные КС по физической подготовленности используются в различных видах деятельности, предъявляющих повышенные
требования к физической подготовленности человека (лётные, морские,
подводные и т.п.)
3. Армейские КС сходны с двумя первыми, но отличаются специфичностью в различных воинских специальностях. Сложность и трудность нормативов и требований этих систем обычно выше, чем у учебных.
4. Всесоюзный комплекс Г Т О являлся уникальной по своему
основному принципу квалификационной системой. Он охватывал обширный контингент по возрасту и квалификации, являлся основой для создания других КС (например, учебных) или обязательным предварительным
этапом для выполнения квалификационных норм в других КС (например,
в ЕВСК).
5. Комплекс ГТО являлся многоборным. В последней редакции комплекса была усилена его спортивная направленность, в частности, в нём
появились спортивные разряды и звания.
6. Единая Всероссийская спортивная классификация (ЕВСК).
В настоящее время является одной из наиболее совершенных
квалификационных систем сферы физической культуры и спорта. Она
предназначена только для сферы спорта. От всех предыдущих эта система
отличается специализированностью и наличием большого числа квалификационных уровней.
7. Международные квалификационные системы (МКС). Эти системы
сходны с ЕВСК по структуре и номенклатуре квалификационных уровней
во всех видах спорта, но каждая международная система имеет свою особую структуру (например, система А.Эло в шахматах или система поясов
в восточных единоборствах).
8. Учебные (тренировочные) и отборочные КС. Используются в спортивных школах, командах и т.п. Эта группа систем наиболее многочисленная и неформализованная. Практически каждая спортивная организация имеет свои учебные и отборочные системы. Эти системы временны, легко меняются, не оформляются в виде законов, не унифицируются
для разных организаций.
9. КС для общекомандных зачётов являются одним из самых сильных
средств решения целого ряда задач. В первую очередь к ним относятся
задачи, возникающие внутри «крупных» организационных форм физической культуры и спорта: на уровне крупных территориальных и ведомственных организаций, отдельных видов спорта и спорта в целом. Следует
53
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
отметить, что общекомандные зачёты применяются на всех уровнях,
начиная от ДЮСШ и кончая Олимпийскими играми. Широкое распространение получили неофициальные общекомандные зачёты на крупнейших международных соревнованиях.
10. Классификация мест предназначается для определения мест
спортсменов или команд в соревнованиях. К этой системе относятся как
простейшие способы выявления победителя (например, по круговой
системе), так и сложные, определяемые в ходе длительных соревнований
(например, соревнования в спортивных играх, Кубок мира у горнолыжников и др.). Эти системы отличаются большим многообразием форм.
Особенностью этих систем является результат их применения - распределение спортсменов по местам, тогда как в других системах занятые
места служат исходной основой для классификации. Поэтому классификация мест является первичной КС, а все остальные - вторичные. Следует подчеркнуть, что между квалификационными системами наблюдается преемственность: результат применения одной системы используется в другой. Так, общекомандный зачёт может работать после применения ЕВСК, а сама ЕВСК - после классификации мест.
11. Конкурсные КС - это различного рода опросы для определения
лучших спортсменов года, страны, вида спорта и т.п. Для индивидуальных видов спорта, в которых спортсмены могут в течение одного сезона
не встречаться друг с другом (теннис, шахматы), или в видах спорта, где
нет однозначного критерия для определения лучших спортсменов (футбол, хоккей) конкурсные квалификационные системы являются необходимым инструментом функционирования и развития вида спорта.
Конкурсные КС являются едва ли не единственным средством для соотнесения высших достижений в разных видах спорта. Они также являются
средством для сравнения популярности отдельных видов спорта.
Критерии классификации КС
1. По назначению: спортивные, физкультурные и общедвигательные;
2. Одновидовые и многовидовые (многоборные);
3. Индивидуальные и групповые (командные);
4. Первичные и вторичные;
5. В зависимости от квалификации. Например, ЕВСК контролирует
всех - от новичков до чемпионов. Международные системы предназначены только для высококвалифицированных спортсменов.
6. Возрастной критерий (ГТО для всех возрастов; армейские-только
для призывного).
7. М е ж д у н а р о д н ы е , национальные, ведомственные, территориальные.
8. Формализованные и неформализованные.
9. Обязательные и добровольные.
54
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4.2. Общая схема создания и использования КС
Перед разработкой КС на основе теоретического анализа и практического опыта необходимо определить следующее:
- на какие виды деятельности будет распространяться система;
- какова будет её направленность (спортивная, физкультурная,
общеразвивающая);
- на какой контингент она будет распространяться (по полу, возрасту, территориальной принадлежности и т.п.);
- какой статус она будет иметь;
- каким способом она будет применяться (формальным или экспертным);
- какое количество квалификационных уровней необходимо создать;
- на какой срок будет действовать КС;
- какие поощрения будут в основе стимулирующих функции КС.
После выявления основных принципов функционирования КС
должны быть намечены пути её возможного развития. Физическая культура и спорт являются быстроразвивающейся сферой, поэтому все их
элементы должны изначально создаваться с расчётом на развитие.
Следующим этапом является сбор информации. Для этого обследуются представительные выборки. Выбирается достаточно простая и
адекватная система фиксации квалификационных нормативов и требований.
После того как определены конкретные значения нормативов и требований, они переводятся в статус «эталонов».
Функции КС
Любая КС предназначена для оценки квалификации отдельного
человека или группы людей. Оцениваться могут:
1) двигательная квалификация не занимающихся физической культурой и спортом;
2) квалификация физкультурников;
3) квалификация спортсменов и спортивных команд.
При этом К С выполняет две основные (первичные) функции:
оценочную и стимулирующую.
Следует заметить, что КС может выполнять оценочную функцию
без стимулирующей, а для выполнения стимулирующей функции должна
быть чётко реализована оценочная.
55
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
4.3. Задачи, решаемые КС
На основе КС решаются разнообразные задачи.
1. Сравнение между собой квалификации спортсменов.
2. Оценка квалификации учителя, тренера, группы тренеров.
3. Оценка сложившейся ситуации в отдельных номерах программы
или отдельных видах спорта в определённый момент времени.
4. Сравнение состояния вида спорта в настоящее время с его состоянием в прошлом.
5. Сравнение между собой различных видов спорта и физической
культуры в конкретный момент и в развитии.
6. Оценка развития физической культуры и спорта в целом.
Эти задачи по своему содержанию отражают как бы одну плоскость
существующей практики. В другой «перпендикулярной» к ней плоскости
можно рассмотреть решение перечисленных задач относительно
- мужского и женского контингента;
- в разных возрастных группах;
- в различных организациях;
- на различных территориях;
- в различных странах.
Особо следует выделить использование К С для решения задач
планирования развития сферы физической культуры и спорта. На языке
КС создаются планы для спортсмена, тренера, тренерских коллективов,
ведомственных и территориальных организаций, видов спорта и спорта
в целом.
4.4. Способы оценки квалификации
Существует два основных способа оценки квалификации - по
нормативам и по требованиям. Оценка по нормативам наиболее широко
используется в физической культуре, т.к. при этом соревнования не проводятся и оценка по требованиям просто невозможна. В спорте оценка по
нормативам возможна в тех видах спорта, где результат может быть
объективно измерен. Оценка по требованиям применяется во всех видах
спорта. В тех видах, где возможно одновременное применение этих двух
способов, необходимо знать, для чего применяется тог или иной способ.
Особое значение указанные проблемы имеют в контексте ЕВСК. В
этом случае можно руководствоваться следующими соображениями:
- высшее спортивное звание по ЕВСК (мастер спорта международного класса) должно присваиваться за выполнение определённых
требований, т.к. на крупнейших международных соревнованиях
постоянно существует конкуренция и практически не встречаются случаи,
56
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
когда спортсмен занимает высокое место незаслуженно. Исключение
можно сделать для рекордных результатов, которые можно рассматривать как заочную победу над соперником;
- низшие разряды целесообразно присваивать за выполнение нормативов. Это облегчает процедуру оценки квалификации. В тех видах, где
возможно одновременное существование нормативов и требований,
требование обычно предполагает предварительную фиксацию результата. Кроме того, трудность выполнения нормативов на соревнованиях
низших рангов является более стабильной, чем выполнение требований.
Это происходит потому, что низшие разряды должны быть достаточно
массовыми, т.е. должны быть созданы условия для их выполнения на
многочисленных соревнованиях;
- возможна также оценка квалификации за победы над спортсменами, уже имеющими определённую квалификацию. Так, например,
второй разряд может быть присвоен за 10 побед над второразрядниками
или 3 победы над перворазрядниками. Хотя такая форма наименее
совершенна, т.к. способствует созданию условий для выращивания
одноимённых разрядников с различным уровнем мастерства;
- кроме уже названных способов возможен альтернативный вариант
оценки квалификации на основе выполнения нормативов или требований. В этом случае необходимо, чтобы нормативы и требования по
уровню сложности выполнения были примерно равны;
- возможен также случай, когда требуется одновременное выполнение и норматива и требования.
Следующие два способа оценки квалификации зависят от того,
сколько раз надо показать спортивный результат, чтобы получить определённую квалификацию. По этому критерию квалификация может присваиваться за однократное или за многократное достижение результата.
Оценка за многократное достижение результата применяется там,
где особенно важно, чтобы человек мог постоянно ей соответствовать в
различных условиях, поэтому такой способ должен быть основой дтя
учебных, профессиональных и армейских КС.
В спорте не может быть такого жёсткого требования к стабильности
достижения определённого результата. Поэтому в спорте достаточно
присвоение квалификации за однократное достижение результата.
Кроме того, оценки квалификации могут быть разделены на
объективные и субъективные. Для общедвигательных и физкультурных
КС желательно использовать объективные оценки, это позволяет проводить оценку лицам без специальной подготовки.
В ряде видов спорта конечный результат определяется с помощью
объективных критериев оценок, Так, например, в прыжках с трамплина
результат оценивается по двум характеристикам - дальности и стилю.
57
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Очные и заочные оценки различаются по критерию наличия прямого
контакта между исследователем и оценщиком. В спорте, как правило,
используется очная опенка. Заочная оценка практикуется при использовании конкурсных классификаций.
Кроме того, победы над спортсменами также могут быть очными и
заочными. Так, спортсмен, выигравший соревнование высшего ранга,
может считаться победителем над спортсменом, победившим в соревнованиях более низкого ранга. В современном спорте практически нет очной
формы выявления победителей за исключением соревнований самого
низкого ранга. Это объясняется многоуровневой системой соревнований.
Следующие два критерия - присвоение квалификации за индивидуальные и за командные достижения. Очевидно, что квалификация не
всех игроков команды - победительницы выше, чем у занявшей более
низкое место, так как отдельные игроки проигравшей команды могут
быть по классу выше некоторых игроков команды-победительницы. Поэтому в командных видах целесообразно применять критерии обоих видов.
И, наконец, по критерию множественности деятельности (упражнений, тестов, видов деятельности) можно выделить виды, где используются
один вид деятельности или многоборье.
Многоборье имеет три причины существования:
- сложившиеся традиции;
- стремление к всестороннему развитию человека;
- невозможность с помощью одного упражнения (действия,
деятельности) оценить профессиональную квалификацию.
Для спортивных многоборий основной проблемой является нахождение эквивалентных коэффициентов для объединения в единую оценку
значений результатов в каждом виде упражнений.
Для общедвигательных и профессиональных КС главной проблемой
является нахождение необходимого набора характеристик и определение
оценочных уровней их значений. В первую очередь в этом случае
необходимо нахождение минимально необходимых уровней.
4.5. Характеристика отдельных КС
Учебные КС. В эту группу входят КС в общеобразовательных школах,
ПТУ, техникумах и вузах. Они используются в рамках учебного предмета
«физическая культура», что предопределяет особенности этих систем. Эти
КС относятся к системам обязательного типа, т.е. оценивают квалификацию контингента вне зависимости от его желания.
Основная функция подобных систем - оценить и стимулировать
разностороннюю физическую подготовленность учащихся. И стимулировать
5S
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
её развитие. Учебные системы контролируют контингент в возрасте от 7
до 25 лет.
Основные задачи, для решения которых используются учебные КС:
- контроль за развитием и формированием физической подготовленности, определение слабых сторон подготовленности;
- оценка физической подготовленности отдельных классов, учебных
групп внутри одной школы, вуза и т.д.;
- оценка работы преподавателей внутри одного учебного заведения;
-сравнение физической подготовленности учащихся различных
учебных заведений;
- сравнение физической подготовленности контингента, проживающего в различных регионах страны;
- индивидуальная ориентация учащихся относительно профессий,
выдвигающих особые требования к физической подготовленности человека;
- сравнение эффективности различных методик физического воспитания, применяемых на больших контингентах.
Учебные КС особенно важны для оценки подготовленности больших
контингентов, поэтому они должны быть просты в обращении, допускать
возможность использования учащимися для самостоятельной оценки
своей подготовленности.
В своей основе учебные КС должны иметь нормативы, а не требования. Оценка должна быть очной и объективной. Общая оценка должна
слагаться из оценок, полученных за несколько упражнений.
Наиболее сложными вопросами при разработке учебных КС
являются:
1) какие упражнения (виды спорта), тесты должны входить в состав КС;
2) должны ли эти упражнения являться частью учебной программы;
3) должны ли контрольные упражнения быть одинаковыми для контингента различных регионов.
Квалификационные системы, предназначенные для контроля за
физической подготовленностью населения (такие, как ГТО), должны
отвечать следующим требованиям:
- во-первых, тесты должны обеспечивать кратковременную и доступную процедуру оценивания квалификации. Это условие ограничивает
количество нормативных характеристик (тестов);
- во-вторых, такой комплекс должен иметь связь с учебными, армейскими и профессиональными КС. Это предполагает наличие нормативных
характеристик, общих для всех указанных систем.
- в-третьих, для сравнения физической подготовленности различных
поколений необходимо обеспечить стабильность его структуры и содержания;
59
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
- в-четвёртых, комплекс должен быть доступен для каждого возраста
и обеспечивать преемственность упражнений.
ЕВСК* является одной из наиболее важных и интересных квалификационных систем сферы физической культуры и спорта. В связи с тем, что
ЕВСК распространяется на многие виды спорта, она может служить удобной моделью для изучения и создания многовидовых квалификационных
систем вообще. Она может служить прообразом для создания международных спортивных многовидовых классификаций.
ЕВСК является спортивной системой, как и другие системы, она
выполняет оценочную и стимулирующую функции.
Оценочные функции ЕВСК основываются на оценке спортивного
мастерства отдельных спортсменов. Далее, оперируя этими оценками,
можно получить:
а) оценку состояния дел в одном виде спорта;
б) сравнение настоящего состояния вида спорта с его прошлым
(анализ развития вида спорта);
в) сравнение между собой различных видов спорта;
г) оценку развития спорта в целом по стране.
ЕВСК служит своеобразным межвидовым языком для оценки
спортивных результатов.
Классификация мест является первичной КС спортсменов. В некоторых видах спорта с её помощью можно оценивать квалификацию
спортсменов, даже не используя результаты, выраженные в метрической
форме. Все остальные КС используют в качестве исходной информации
классификации мест.
В расчётах, получаемых с помощью классификации мест, нуждаются
все звенья массового спорта и спорта высших достижений, начиная от
конкретного спортсмена и заканчивая специалистами, отвечающими за
функционирование и развитие спорта в отдельных странах и в мире. Фактически места, занимаемые спортсменами и спортивными командами,
являются универсальной и основной формой выражения результатов
деятельности отдельных спортсменов, команд, ведомственных, территориальных и видовых спортивных организаций.
* Учитывая, что ЕВСК представляет особый интерес для спортсменов, тренеров
и других специалистов, работающих в области спорта, в приложении к данному
чосоРяю пркзгдекы основные правочьп положения этой классификации.
60
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В настоящее время накоплен достаточно большой объём знаний о
том, как можно усилить оценочные функции этой системы. Сложнее управлять стимулирующими функциями ЕВСК. Например, не так просто
ответить на вопрос «Что даёт повышение или понижение нормативов в
каком-то виде спорта для самого этого спорта и для других видов?».
ЕВСК служит основным связующим звеном между КС физического
воспитания (учебными, профессиональными, армейскими) и спортивными КС (классификациями мест, отборочными, общекомандными
зачётами, международными КС и конкурсными классификациями). Эта
связь осуществляется, главным образом, за счёт того, что ЕВСК контролирует контингент спортсменов различной квалификации от самого низкого уровня до уровня мировых достижений. В связи с этим актуальным
является вопрос о нормативах высших и низших разрядов и званий.
Так, звание «мастер спорта международного класса» целесообразно
присваивать только за успешные выступления на международных соревнованиях. Логичным представляется присваивать это звание за выполнение определённых требований, а не нормативов, т.е. за определённые
места, занятые на международных соревнованиях. Исключение можно
сделать при установлении рекордов мира, Олимпийских игр.
Не менее важным является вопрос «Какими должны быть низшие
разряды ЕВСК?». Решение этой задачи не менее сложно. Например, неоднократно высказывались предложения присваивать такие разряды при
условии выполнения не только норматива в избранном виде спорта, но
и выполнения определённых норм по комплексу тестов общей физической
подготовленности и даже при выполнении определённого тренировочного объёма. Это исключило бы неоправданно раннюю специализацию и форсированную подготовку юных спортсменов. Однако эта идея
не получила практической реализации, так как разработка таких тестовых
программ является непростой задачей, да и сама ЕВСК стала бы очень
громоздкой.
Международные спортивные классификации существуют лишь в
нескольких видах спорта. Зона действия каждой из них распространяется
на представителей одного вида спорта.
Наиболее совершенной из них является шахматная КС - Эло, по
которой каждый шахматист имеет индивидуальный коэффициент,
который соответствует его квалификации на данный момент.
Заслуживают внимания классификационные системы в восточных
единоборствах. Особенностью этих систем является то, что для получения
определённой квалификации (пояса определённого цвета) необходимо
не только показать на соревнованиях владение определённым набором
61
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
технических приёмов, но, в некоторых случаях, пройти подготовку
определённой длительности. Для получения высших квалификационных
оценок, кроме того, требуется быть учителем группы спортсменов низшей
квалификации. Таким образом, в КС закладывается дополнительная
функция - воспроизведения вида спорта.
В целом международные КС не получили широкого распространения, так как в тех видах спорта, по которым ежегодно проводятся крупные международные соревнования, оценка квалификации и ответы на
многие связанные с ней вопросы легко получаются с помощью классификации мест.
Общекомандные зачёты. Эти зачетные системы в качестве исходной
информации используют оценки квалификации отдельных спортсменов,
поэтому они являются вторичными. В большинстве случаев в качестве
исходной информации для них служат места, занятые спортсменами.
Можно выделить следующие разновидности общекомандных
зачётов:
- зачёты в одном виде спорта, когда требуется определить место
каждой команды на основании результатов спортсменов в отдельных
номерах программы, возрастных, половых или квалификационных
группах;
- зачёты для многих видов спорта. Здесь общекомандное место определяется на основании выступлений спортсменов в различных видах
спорта. В этом случае возникает проблема определения эквивалентных
достижений в различных видах спорта. Например, можно ли давать
одинаковое количество очков за победу в футбольном турнире и в одном
из многочисленных номеров плавательной программы.
При создании подобных зачётов необходимо учитывать следующие
факторы:
- количество занимающихся видами спорта;
- распространённость видов спорта (количество стран, организаций,
районов, в которых эти виды культивируются);
- количество соревнований различного уровня, проводимых в каждом виде спорта;
Общекомандные зачёты, предназначаемые для использования внутри страны, могут иметь несколько иные функции по сравнению с международными. Например, с их помощью можно стимулировать развитие
массовости или мастерства в отстающих видах спорта.
62
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Приложение
ОСНОВНЫЕ ПРАВОВЫЕ ПОЛОЖЕНИЯ ЕВСК
ЕВСК является нормативным документом в сфере физической
культуры и спорта, определяющим требования, условия и порядок присвоения спортивных званий и разрядов в Российской Федерации.
ЕВСК утверждается специальным постановлением Коллегии Государственного комитета Российской Федерации по физической культуре,
спорту и туризму и Бюро Исполкома Олимпийского комитета России
сроком на 4 года (один олимпийский цикл).
В первом разделе положения о ЕВСК, утверждённом на 2001-2005
годы, её задачи определены следующим образом:
1. Способствовать привлечению граждан России к активным занятиям спортом, повышать уровень всесторонней физической подготовленности и спортивного мастерства занимающихся спортом.
2. Устанавливать разрядные нормативы и требования, а также
условия их выполнения.
3. Определять порядок присвоения спортивных званий и разрядов в
соответствии с уровнем развития спорта в стране и в мире и задачами,
стоящими перед конкретным видом спорта.
4. Содействовать развитию видов спорта, совершенствовать систему
проведения соревнований.
Второй раздел ЕВСК содержит общие положения, определяющие
требования к видам спорта, на которые распространяется ЕВСК, а также
порядок определения норм и требований по национальным видам спорта.
В частности, в разделе говорится:
Спортивные звания и разряды присваиваются по видам спорта,
включённым в установленном порядке в Государственный реестр видов
спорта, признанных на территории Российской Федерации.
По национальным видам спорта, получившим развитие в отдельном
субъекте Российской Федерации, разрядные нормы и требования, условия
их выполнения определяются классификациями, разработанными соответствующими органами исполнительной власти в области физической
культуры и спорта субъекта Российской Федерации и согласованными с
федеральным органом исполнительной власти в области физической
культуры и спорта.
В этом же разделе даны следующие формулировки основных понятий
и терминов, используемых в классификации:
63
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Спорт - «составная часть физической культуры, исторически сложившаяся в форме соревновательной деятельности и специальной практики
подготовки человека к соревнованиям».
Вид спорта - составная часть спорта, в основе которой лежат систематические тренировки и участие в соревнованиях с целью достижения
спортсменом наивысших показателей. В результате тренировок у спортсменов в системах организма не должны происходить необратимые
негативные изменения.
Спортивная дисциплина (версия, стиль) - неотъемлемая составляющая вида спорта, включающая в себя один или несколько видов соревнований (программы).
Вид соревнований (программы) - состязания по виду спорта или одной
из его дисциплин, приводящие к распределению мест среди участников.
Чемпионат - соревнования среди сильнейших спортсменов (команд),
возраст которых определяется положением о соревнованиях.
Первенство - соревнования среди спортсменов (команд) различных
возрастных групп, возраст которых определяется положением о соревнованиях.
Официальные соревнования - соревнования, включённые в Единый
календарный план всероссийских и международных спортивных мероприятий, календарный план всероссийских обществ, ведомств, по согласованию с федерациями по видам спорта, а также в перечень дополнительных соревнований, определяемых комиссией ЕВСК.
Ранг соревнований: Олимпийские игры, чемпионат мира, Кубок
мира, первенство мира, чемпионат Европы, Кубок Европы, международные соревнования по перечню, утверждённому комиссией ЕВСК, универсиады, всемирные Игры по не олимпийским видам спорта, чемпионат
России, всероссийские соревнования, чемпионат субъекта Российской
Федерации, Кубок субъекта Российской Федерации, первенство субъекта
Российской Федерации, соревнования федеральных округов, спортивных
организаций, имеющих право присваивать первый и массовые разряды.
Разрядные нормы - выражены в мерах длины, веса и времени системы
СИ.
Разрядные требования - выражены в очках, баллах, занятом месте,
командных или личных соревнованиях, в победах над соперником, достижении определённого рейтинга.
Спортивные массовые разряды - II разряд, III разряд, юношеские
разряды.
Третий раздел ЕВСК определяет спортивные звания и разряды,
присваиваемые спортсменам, выполнившим соответствующие разрядные
нормы и требования.
64
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Спортивные звания:
«Мастер спорта России международного класса» (МСМК)
или «Гроссмейстер России»;
«Мастер спорта России» (МС), «Мастер спорта России (по
национальному виду спорта)».
Спортивные разряды:
«Кандидат в мастера спорта» (KMC);
I разряд;
II разряд;
III разряд;
I юношеский разряд;
II юношеский разряд;
III юношеский разряд.
По видам спорта, культивируемым среди инвалидов, спортсменам
присваиваются следующие спортивные звания и разряды:
Спортивные звания:
«Мастер спорта России международного класса (среди
инвалидов)» (МСМК);
«Мастер спорта России (среди инвалидов)» (МС),
Спортивные разряды:
«Кандидат в мастера спорта (среди инвалидов)» (KMC);
I разряд;
II разряд;
III разряд;
Разрядные нормы и требования устанавливаются с учётом особенностей развития вида спорта, пола и возраста спортсменов. Они определяются показателями, предусмотренными по виду спорта.
В отдельных видах спорта предусмотрены разрядные нормы и разрядные требования.
Четвёртый раздел ЕВСК определяет возрастные требования при
присвоении спортивных званий и разрядов. Предусмотрены следующие
градации возрастных групп: взрослые, молодёжь, юниоры, юноши разных возрастов. Эти градации определяются правилами соревнований
международных федераций, а в видах спорта, не имеющих международных объединений - правилами всероссийских федераций (союзов,
ассоциаций) по видам спорта.
65
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
В пятом разделе даны определения рангов соревнований для присвоения званий и разрядов.
1. Виды спорта, включённые в ЕВСК, условно разделены на следующие группы:
- виды спорта, имеющие признание Международного олимпийского
комитета (МОК) и вошедшие в олимпийскую программу. Соревнования
проводятся в соответствии с правилами международных спортивных
федераций, признанных МОК, членами которых являются всероссийские
федерации (союзы, ассоциации);
- виды спорта, имеющие признание МОК, но не вошедшие в олимпийскую программу. Соревнования проводятся в соответствии с правилами международных спортивных федераций, признанных МОК, членами которых являются всероссийские федерации (союзы, ассоциации);
- виды спорта, не получившие признание МОК, но имеющие международные спортивные федерации. Соревнования проводятся в соответствии с правилами международных спортивных федераций, членами
которых являются всероссийские федерации (союзы ассоциации);
- виды спорта, получившие развитие на территории Российской
Федерации или в отдельном субъекте Российской Федерации (национальные виды спорта);
-прикладные виды спорта, культивируемые в ведомственных
организациях Российской Федерации.
2. Ранг «Олимпийские игры» определяется МОК, «чемпионат», «Кубок», «первенство» мира или Европы, «международный турнир» определяется соответствующей спортивной международной федерацией,
признанной МОК. По видам спорта, не имеющим признание МОК, в
ранге «чемпионат», « К у б о к » , в ранге « ч е м п и о н а т » , «Кубок»,
«первенство» мира могут быть признаны соревнования, в которых
участвуют (культи-вируют) не менее 20 национальных команд, а в ранге
«чемпионат», «Кубок», «первенство» Европы при участии не менее 10
национальных сборных команд.
3. Ранг международных соревнований - всемирные Игры по не
олимпийским видам спорта, всемирная универсиада по прикладным и
техническим видам спорта - устанавливается в соответствии с требованиями международных организаций.
4. Ранг «чемпионат», «Кубок», «первенство России» определяется
включением данных с о р е в н о в а н и й федеральным органом исполнительной власти в области физической культуры и спорта в Единый
календарный план физкультурно-оздоровительных и спортивных
мероприятий при условии участия не менее половины субъектов Российской Федерации, культивирующих данный вид спорта. Проводятся они
66
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
всероссийскими федерациями (союзами, ассоциациями), аттестованными
по данному виду спорта и в соответствии с правилами, согласованными
с федеральным органом исполнительной власти в области физической
культуры и спорта.
5. Комплексные соревнования: всероссийские спартакиады, за исключением отраслевых и ведомственных, классифицируются как чемпионаты; всероссийские спартакиады, за исключением отраслевых и
ведомственных, - школьников (учащихся), молодёжные и студенческие
игры классифицируются как первенства.
6.Ранг «всероссийские» получают соревнования, включённые федеральным органом исполнительной власти в области физической культуры
и спорта в Единый календарный план всероссийских и международных
спортивных мероприятий. При условии участия в них не менее пяти
спортсменов в каждом виде программы (для игровых видов спорта - пяти
сборных команд различных субъектов Российской Федерации), входящих
по итогам предыдущего года в число десяти сильнейших в России - в
чемпионатах, Кубках и первенствах России, рейтингах.
Ранг «региональный», «зональный» получают соревнования, включённые в Единый календарный план всероссийских и международных
спортивных мероприятий, в которых участвуют не менее пяти спортсменов в каждом виде программы, входящих по итогам предыдущего
года в число десяти сильнейших в региональных, зональных чемпионатах,
кубках или первенствах. Для игровых видов спорта - трех сборных
команд различных субъектов Российской Федерации), входящих по
итогам предыдущего года в число шести сильнейших в региональных,
зональных чемпионатах, Кубках или первенствах.
7. Ранг чемпионатов, Кубков, и первенств всероссийских обществ
и ведомств получают соревнования, проводимые ими и согласованные с
всероссийскими федерациями (союзами, ассоциациями) и включённые в
Единый календарный план всероссийских и международных спортивных
мероприятий, календарный план обществ и ведомств при условии, что в
них участвуют не менее половины территорий России, культивирующих
данный вид спорта.
8. Ранг соревнований субъектов Российской Федерации определяется
органом исполнительной власти субъекта Российской Федерации в области физической культуры и спорта.
Шестой раздел определяет условия присвоения спортивных званий
и разрядов.
1. Спортивные звания «Мастер спорта России международного
класса», «Гроссмейстер России», «Мастер спорта России международного
67
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
класса (среди инвалидов)», «Мастер спорта России», «Мастер спорта
России (среди инвалидов)», «Мастер спорта России (по национальному
виду спорта)» присваиваются спортсменам-гражданам Российской
Федерации.
2. Спортивные звания и разряды присваиваются спортсменам, выполнившим установленные нормы и требования ЕВСК в соревнованиях:
- включённых федеральным органом исполнительной власти в области физической культуры и спорта в Единый календарный план всероссийских и международных спортивных мероприятий, календарный план
обществ и ведомств, которые проводятся в соответствии с Положениями,
утверждёнными всероссийскими федерациями, союзами, ассоциациями,
согласованными федеральным органом исполнительной власти в области
физической культуры и спорта и Олимпийским комитетом России;
- включённых органом исполнительной власти субъекта Российской
Федерации в области физической культуры и спорта в план физкультурно-оздоровительных и спортивных мероприятий, и которые проводятся
в соответствии с Положениями о соревнованиях, утверждёнными органом исполнительной власти субъекта Российской Федерации в области
физической культуры и спорта;
- включённых спортивными организациями, имеющими право присваивать спортивные массовые разряды, в план физкультурно-оздоровительных и спортивных мероприятий и которые проводятся в соответствии с Положениями о соревнованиях, утверждёнными спортивными
организациями, имеющими право присваивать спортивные массовые
разряды.
3. Спортивные звания присваиваются при условии выполнения
спортсменами разрядных норм и требований, если в состав судейской
коллегии, проводящей соревнования по данному виду спорта или
дисциплине, входят судьи соответствующего уровня, предусмотренного
Положением о судействе соревнований.
4. Для присвоения званий МСМК и МС в Главной судейской коллегии должно быть не менее 3-х судей республиканской (всероссийской)
категории.
Для присвоения спортивных разрядов:
• KMC - 2-х судей республиканской (всероссийской) категории и 3-х
судей 1-й категории;
• 1-го разряда - 2-х судей республиканской (всероссийской)
категории и 2-х судей 1-й категории;
• И-го и Ш-го разрядов - 2-х судей 1-й категории и 2-х судей 2-й
категории;
• юношеских разрядов - 2-х судей 2-й категории и 2-х судей по
спорту.
68
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Седьмой раздел Положения определяет порядок присвоения спортивных разрядов и званий.
Спортивные звания «Мастер спорта России международного класса», «Гроссмейстер России», «Мастер спорта России международного
класса (среди инвалидов)», «Мастер спорта России», «Мастер спорта
России (среди инвалидов)», «Мастер спорта России (по национальному
виду спорта)» присваиваются федеральным органом исполнительной
власти в области физической культуры и спорта по представлению:
- органов исполнительной власти субъектов области физической
культуры и спорта и согласовании всероссийскими федерациями (союзами, ассоциациями) по виду спорта;
- СК МО России ОГО ВФСО «Динамо», РОСТО, М Ч С России,
РОСИНКАСС и согласовании с всероссийскими федерациями (союзами,
ассоциациями) по виду спорта;
- «Кандидат в мастера спорта» присваивается органом исполнительной власти в области физической культуры и спорта субъекта
Российской Федерации.
Списки спортивных организаций, имеющих право присваивать
спортивные массовые разряды, утверждаются органом исполнительной
власти в области физической культуры и спорта субъекта Российской
Федерации.
По видам спорта, объединяемым СК М О России ОГО ВФСО
«Динамо», РОСТО, М Ч С России, РОСИНКАСС, порядок присвоения
спортивных разрядов определяется инструкциями, утверждёнными этими
организациями и согласованными с федеральным органом исполнительной власти в области физической культуры и спорта.
Спортсмену, удостоенному спортивного звания, вручается от имени
федерального органа исполнительной власти в области физической
культуры и спорта соответствующее удостоверение и знак.
Спортсмену, выполнившему разрядные требования «Кандидат в
мастера спорта» вручается от имени органа исполнительной власти
субъекта Российской Федерации в области физической культуры и спорта
соответствующее удостоверение и знак.
Спортсмену, выполнившему разрядные требования I разряд, II
разряд, III разряд, юношеский разряд вручается от имени спортивной
организации соответствующее удостоверение и знак.
Образцы всех удостоверений и знаков утверждаются федеральным
органом исполнительной власти в области физической культуры и спорта.
Организации, имеющие право представлять спортсмена к спортивному званию, должны направлять документы в федеральный орган
исполнительной власти в области физической культуры и спорта в
69
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
течение шести месяцев с момента выполнения соответствующего разрядного норматива или требования.
Организации, имеющие право присваивать спортивные разряды должны оформлять необходимые документы в течение месяца с момента
выполнения соответствующего разрядного норматива или требования.
В восьмом разделе Положения о ЕВСК перечисляются права спортсменов. В частности, в нем сказано, что спортсмен имеет право:
а) на участие в соревнованиях по виду спорта, в которых он может
выполнить требования ЕВСК, если при этом не нарушаются требования,
изложенные в Положении о соревнованиях;
б) на присвоение ему спортивных разрядов и званий при условии
выполнения установленных в классификации норм и требований;
в) на получение соответствующих удостоверений и знаков.
Спортивные организации и их руководители несут персональную
ответственность за нарушение прав спортсменов и достоверность информации в представляемых документах на присвоение спортивных званий
и разрядов.
Девятый раздел регламентирует документы учёта и отчетности и
зачетные классификационные книжки спортсменов:
Физкультурно-оздоровительные организации на основании приказов и постановлений о присвоении спортивного звания или разряда
оформляют зачётные классификационные книжки и регистрируют их в
установленном порядке.
В зачётных классификационных книжках спортсменов отмечаются
результаты соревнований, присвоение последующего разряда (звания) и
прохождение медицинского обследования.
Образцы зачётных классификационных книжек утверждаются федеральным органом исполнительной власти в области физической культуры
и спорта.
70
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Литература
основная
1. Годик, М.А. Спортивная метрология : Учеб. для ин-тов физ.культ. /
М.А.Годик. - М.: Физкультура и спорт, 1988.-192с.
2. Жданов, Л.Н Квалификационно-нормативные основы советской
системы физического воспитания: Учеб. пособие / Л . Н . Ж д а н о в ,
С.В.Брянкин. - М.-Смоленск.- 1978.- 95с.
3. Зациорский. В.М. Основы спортивной метрологии /В.М.Зациорский.
- М.: Физкультура и спорт, 1979,- 152 с.
4. Смирнов, Ю.И. Спортивная метрология: Учеб. для студ. пед. вузов /
Ю.И.Смирнов, М.М.Полевщиков. -М.: Изд. центр «Академия», 2000. 232с.
5. Спортивная метрология: Учеб. для ин-тов физ.культ / Под. ред
В.М.Зациорского,- М.: Физкультура и спорт, 1982.-256 с.
6. Тесты в спортивной практике / Пер. с нем. Х.Бубэ и др. - М.:
Физкультура и спорт, 1966.-237 с.
дополнительная
1. Анастази, А. Психологическое тестирование: В 2 т / А.Анастази М.: Педагогика, 1982.-Т.2.-295 с.
2. Баландина, В. А. Оценочные таблицы физического развития детей
дошкольного и школьного возраста (13-15 лет): Метод.указания /
В.А.Баландина, А.Е.Петухова, С.В.Шубенко. - Омск, 1984.-18с. -В
надзаг.: Ом. мед. ин-т.
3. Баттисти, Ж. Оценка уровня развития физических качеств у детей /
Ж . Б а т т и с т и , Л . К а в а л ь е р и , Ж . П е с с а н //Зарубежные научные
исследования: Отбор и юношеский спорт: Тем. подборка/ ВНИИФК,М.-1993.-Вып. № 3.-C.3-18.
4. Благуш, П. К теории тестирования двигательных способностей:
Сокр. пер. с чешек. /П. Благуш. -М.: Физкультура и спорт, 1982.-165 с.
5.Булкин, В.А. Некоторые вопросы моделирования состояния
сильнейших спортсменов /В.А.Булкин, Б.Н.Шустин, Х.К.Ансоков/Ютбор
и подготовка квалифицированных спортсменов к ответственным
соревнованиям.-Л. ,1975.-С.22-41.
6. Годик, М.А. О методике тестирования физического состояния
детей /М.А.Годик, Т.А.Шанина, Г.Ф.Шитикова // Теория и практика
физической культуры.-1973.-№8.-С.32-35.
71
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
7. Годик, М.А. О корректности измерительных и вычислительных
процедур в спортивно-педагогических исследованиях /М.А.Годик,
Э.С.Озолин, Б.Н.Шустин //Теория и практика физической культуры.1973.-№4.-С.56-57.
8. Годик, В.А. Контроль тренировочных нагрузок /М.А. Годик,М.:Физкультура и спорт, 1980.-135с.
9. Годик, М.А. Педагогические основы нормирования и контроля
соревновательных и тренировочных нагрузок: Автореф. дис.... д-ра пед.
наук /М.А.Годик.-М.,1982.-48с.
10. Запорожанов, В.А. Контроль в спортивной тренировке /В.А.
Запорожанов. -Киев: Здоровья, 1988.-205с.
11. Зациорский, В.М. Теоретические основы и практические пути
использования математических методов для оценки специальной
физической подготовленности спортсменов /В.М.Зациорский, М.А.
Годик, Д.Н. Ярмульник //Теория и практика физической культуры,-1964,№2,- С.33-37.
12. Зациорский, В.М. О двух типах показателей выносливости /
В.М.Зациорский, Н . И . Волков, Н.Г. Кулик //Теория и практика
физической культуры.-1965.-№2,- С.21-23.
13. Зациорский, В.М. Физические качества спортсмена/В.М. Зациорский.М.:Физкультура и спорт, 1970.-200с.
14. Зациорский, В.М. Вопросы теории и практики текущего контроля
в современном спорте / В.М. Зациорский, В.А. Запорожанов, И.А.ТерАванесян //Теория и практика физической культуры,-1971 .-№4,- С.59-63.
15. Карпман, B.JI. Исследование физической работоспособности
спортсменов / В . Л . К а р п м а н , З.Б.Белоцерковский, И.А.Гудков. М.:Физкультура и спорт, 1974.-115с.
16. Лях, В.И. Тесты в физическом воспитании школьников / В.И.Лях,М., ACT, 1988,- 271 с.
17. Нужемис, Р.Ю. Тестирование скоростно-силовых качеств и
выносливости на разных этапах отбора: Автореф. дис.... канд. пед. наук /
Р.Ю.Нужемис.-Киев, 1989.-24с.
18. Попков, В.Н. Простейшие тесты для оценки уровня тренированности и спортивных способностей юных велосипедисток //Велосипедный
спорт: Ежегодник. - М., 1976.-С. 18-21.
19. Уткин, В.Л. И з м е р е н и я в спорте (введение в спортивную
метрологию): Учеб. пособие /В.Л.Уткин. -М., 1978.-194с.
20. Физиологическое тестирование спортсмена высокого класса: Пер.
с англ. /Отв.ред. В.С.Мищенко.- Киев: Олимпийская литература.-1998. 430 с.
72
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1. ОСНОВЫ ТЕОРИИ ТЕСТОВ
1.1. Тесты и их применение
1.2. Классификация тестов
1.3. Комплексы (батареи) тестов
1.4. Критерии пригодности тестов
1.5. Надежность теста
1.6. Информативность теста
1.7. Методические принципы тестирования
2. ОСНОВЫ ТЕОРИИ ОЦЕНОК
2.1. Проблема оценивания
2.2. Основные понятия
2.3. Задачи оценивания
2.4. Процедура оценивания
2.5. Шкалы оценок
2.6. Разновидности шкал оценок
2.7. Критерии эквивалентности
2.8. Критерии пригодности шкал
2.9. Оценка по комплексу тестов
2.10. Нормы
3. МЕТОДЫ КОЛИЧЕСТВЕННОЙ ОЦЕНКИ
КАЧЕСТВЕННЫХ ПОКАЗАТЕЛЕЙ
3.1. Метод экспертных оценок
3.2. Анкетирование
4. КВАЛИФИКАЦИОННЫЕ СИСТЕМЫ
4.1. Типы квалификационных систем
4.2. Общая схема создания и использования
квалификационных систем
4.3. Задачи, решаемые квалификационными системами
4.4. Способы оценки квалификации
4.5. Характеристика отдельных квалификационных систем
Приложение
Литература
3
5
8
9
10
12
19
28
29
31
31
31
32
36
39
41
41
43
48
49
52
52
55
56
56
58
63
71
73
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Виталий Николаевич Попков
Тестирование и оценивание
Подписано в печать 22.01.04. Формат 60x84 1/16.
Объем 4,75 уч.-изд. л. Тираж 300 экз. Заказ 2.
Издательство СибГУФК.
644009, г.Омск, ул.Масленникова, 144.
74
Документ
Категория
Образование
Просмотров
241
Размер файла
6 417 Кб
Теги
оценивания, 2924, тестирование
1/--страниц
Пожаловаться на содержимое документа