Градация уровней надежности тестов

Значения коэффициентов	Надежность
0,99-0,95	Отличная
0,94-0,90	Хорошая
0,89-0,80	Средняя
0,79-0,70	Приемлемая
0,69-0,60	Низкая

Тесты, надежность которых меньше указанных в табл. 9 значений, использовать не рекомендуется.

Говоря о надежности тестов, различают их стабильность (воспроизводимость), согласованность, эквивалентность.

Под стабильностью теста понимают воспроизводимость результатов при его повторении через определенное время в одинаковых условиях. Повторное тестирование обычно называют ретестом. Стабильность теста зависит от следующих компонентов:

— вида теста;

— контингента испытуемых;

— временного интервала между тестом и ретестом.

Для количественной оценки стабильности используется дисперсионный анализ по той же схеме, что и в случае расчета обычной надежности.

Согласованность теста характеризуется независимостью результатов тестирования от личных качеств лица, проводящего или оценивающего тест. Если результаты спортсменов в тесте, который проводят разные специалисты (эксперты, судьи), совпадают, то это свидетельствует о высокой степени согласованности теста. Это свойство зависит от совпадения методик тестирования у разных специалистов.

Когда создается новый тест, обязательно нужно проверить его на согласованность. Делается это так; разрабатывается унифицированная методика проведения теста, а потом два или более специалиста по очереди в стандартных условиях тестируют одних и тех же спортсменов.

Эквивалентность тестов. Одно и то же двигательное качество (способность, сторону подготовленности) можно измерить с помощью нескольких тестов. Например, максимальную скорость — по результатам пробегания с ходу отрезков в 10, 20 или 30 м. Силовую выносливость — по числу подтягиваний на перекладине, отжиманий в упоре, количеству подъемов штанги в положении лежа на спине и т.д.

Эквивалентность тестов определяется следующим образом: спортсмены выполняют одну разновидность теста и затем после небольшого отдыха — другую и т.д.

Если результаты оценок совпадают (например, лучшие в подтягивании оказываются лучшими и в отжимании), то это свидетельствует об эквивалентности тестов. Коэффициент эквивалентности определяется с помощью корреляционного или дисперсионного анализа.

Применение эквивалентных тестов повышает надежность оценки контролируемых свойств моторики спортсменов. Поэтому если нужно провести углубленное обследование, то лучше применить несколько эквивалентных тестов. Такой комплекс называется гомогенным. Во всех остальных случаях лучше использовать гетерогенные комплексы: они состоят из неэквивалентных тестов.

Не существует универсальных гомогенных или гетерогенных комплексов. Так, например, для слабо подготовленных людей такой комплекс, как бег на 100 и 800 м, прыжок в длину с места, подтягивание на перекладине, будет гомогенным. Для спортсменов высокой квалификации он может оказаться гетерогенным.

До определенной степени надежность тестов может быть повышена путем:

— более строгой стандартизации тестирования;

— увеличения числа попыток;

— увеличения числа оценщиков (судей, экспертов) и повышения согласованности их мнении;

— увеличения числа эквивалентных тестов;

— лучшей мотивации испытуемых;

—метрологически обоснованного выбора технических средств измерений, обеспечивающих заданную точность измерений в процессе тестирования.

Информативность тестов

Информативность теста — это степень точности, с которой он измеряет свойство (качество, способность, характеристику и т.п.), для оценки которого используется. В литературе до 1980 г. вместо термина «информативность» применялся адекватный ему термин «валидность».

В настоящее время информативность подразделяют (классифицируют) на несколько видов. Структура видов информации показана на рис. 4.

Так, в частности, если тест используется для определения состояния спортсмена в момент обследования, то говорят о диагностической информативности. Если же на основе результатов тестирования хотят сделать вывод о возможных будущих показателях спортсмена, тест должен обладать прогностической информативностью. Тест может быть диагностически информативен, а прогностически нет, и наоборот.

Степень информативности может характеризоваться количественно — на основе опытных данных (так называемая эмпирическая информативность) и качественная — на основе содержательного анализа ситуации (содержательная, или логическая, информативность). В этом случае тест называют содержательно, или логически, информативным на основе мнений экспертов-специалистов.

Факторная информативность — одна из очень частых моделей теоретической информативности. Информативность тестов по отношению к скрытому критерию, который искусственно составляется из их результатов, определяется на основе показателей батареи тестов при помощи факторного анализа.

Факторная информативность связана с понятием размерности тестов в том смысле, что число факторов вынужденно определяет и число скрытых критериев. При этом размерность тестов зависит не только от числа оцениваемых двигательных способностей, но и от остальных свойств моторного теста. Когда это влияние можно частично исключить, то факторная информативность остается подвижным модельным приближением теоретической или конструктной информативности, т.е. валидности моторных тестов к двигательным способностям.

Простую или сложную информативность различают по числу тестов, для которых выбран критерий, т.е. для одного или двух и более тестов. С вопросами взаимного отношения простой и сложной информативности тесно связаны следующие три вида информативности. Чистая информативность выражает степень повышения сложной информативности батареи тестов, когда данный тест включают в батарею тестов более высокого порядка. Параморфная информативность выражает внутреннюю информативность теста в рамках прогноза одаренности к определенной деятельности. Она определяется специалистами-экспертами с учетом профессиональной оценки одаренности. Ее можно определить как скрытую (для специалистов - «интуитивную») информативность отдельных тестов.

Очевидная информативность в значительной степени связана с содержательной и показывает, насколько очевидно содержание тестов для тестируемых лиц. Она связана с мотивацией испытуемых. Информативность внутренняя или внешняя возникает в зависимости от того, определяется ли информативность теста на основе сравнения с результатами других тестов или на основе критерия, который по отношению к данной батарее тестов является внешним.

Абсолютная информативность касается определения одного критерия в абсолютном понимании, без привлечения каких-либо других критериев.

Дифференциальная информативность характеризует взаимные различия между двумя или более критериями. Например, при выборе спортивных талантов может встретиться ситуация когда тестируемый проявляет способности к двум разным спортивным дисциплинам. При этом нужно решить вопрос, к какой из этих двух дисциплин он наиболее способен.

В соответствии с временным интервалом между измерением (тестированием) и определением результатов критерия различают два вида информативности - синхронную и диахронную. Диахронная информативность, или информативность к неодновременным критериям, может иметь две формы. Одной из них является случай, когда критерий измерялся бы раньше, чем тест - ретроспективная информативность.

Если говорить об оценке подготовленности спортсменов, то наиболее информативным показателем является результат в соревновательном упражнении. Однако он зависит от большого количества факторов, и один и тот же результат в соревновательном упражнении могут показывать люди, заметно отличающиеся друг от друга по структуре подготовленности. Например, спортсмен с отличной техникой плавания и относительно невысокой физической работоспособностью и спортсмен со средней техникой, но с высокой работоспособностью будут соревноваться одинаково успешно (при прочих равных условиях).

Для выявления ведущих факторов, от которых зависит результат в соревновательном упражнении, и используются информативные тесты. Но как узнать меру информативности каждого из них? Например, какие из перечисленных тестов информативны при оценке подготовленности теннисистов: время простой реакция, время реакции выбора, прыжок вверх с места, бег на 60 м? Для ответа на эти вопросы необходимо знать методы определения информативности. Их два: логический (содержательный) и эмпирический.

Логический метод определения информативности тестов. Суть этого метода определения информативности заключается в логическом (качественном) сопоставлении биомеханических, физиологических, психологических и других характеристик критерия и тестов.

Предположим, что мы хотим подобрать тесты для оценки подготовленности высококвалифицированных бегунов на 400 м. Расчеты показывают, что в этом упражнении при результате 45 с примерно 72% энергии поставляется за счет анаэробных механизмов энергопродукции и 28 % - за счет аэробных. Следовательно, наиболее информативными будут тесты, позволяющие выявить уровень и структуру анаэробных возможностей бегуна: бег на отрезках 200—300 м с максимальной скоростью, прыжки с ноги на ногу в максимальном темпе на дистанции 100-200 м, повторный бег на отрезках до 50 м с очень короткими интервалами отдыха. Как показывают клинико-биохимические исследования, по результатам этих заданий можно судить о мощности и емкости анаэробных источников энергии и, следовательно, их можно использовать в качестве информативных тестов.

Приведенный выше простой пример имеет ограниченное значение, так как в циклических видах спорта логическая информативность может быть проверена экспериментально. Чаще всего логический метод определения информативности используется в таких видах спорта, где нет четкого количественного критерия. Например, в спортивных играх логический анализ фрагментов игры позволяет вначале сконструировать специфический тест, а затем проверить его информативность.

Эмпирический метод определения информативности тестов при наличии измеряемого критерия. Ранее говорилось о важности использования единичного логического анализа для предварительной оценки информативности тестов. Эта процедура позволяет отсеять заведомо неинформативные тесты, структура которых мало соответствует структуре основной деятельности спортсменов или физкультурников. Остальные тесты, содержательная информативность которых признана высокой, должны пройти дополнительную эмпирическую проверку. Для этого результаты теста сопоставляют с критерием. В качестве критерия обычно используют:

1) результат в соревновательном упражнении;

2) наиболее значимые элементы соревновательных упражнений;

3) результаты тестов, информативность которых для спортсменов данной квалификации была установлена ранее;

4) сумму очков, набранную спортсменом при выполнении комплекса тестов;

5) квалификацию спортсменов.

При использовании первых четырех критериев общая схема определения информативности теста следующая.

А. Измеряются количественные значения критериев. Для этого необязательно проводить специальные соревнования. Можно, например, использовать результаты ранее прошедших соревнований. Важно только, чтобы соревнование и тестирование не были разделены длительным временным промежутком.

Если в качестве критерия предполагается использовать какой-либо элемент соревновательного упражнения, необходимо, чтобы он был наиболее информативным.

Рассмотрим методику определения информативности показателей соревновательного упражнения на следующем примере.

На чемпионате страны по лыжным гонкам на дистанции 15 км на подъеме крутизной 7* регистрировали длину шагов и скорость бега. Полученные значения сравнили с местом, занятым спортсменом на соревнованиях (табл. 10).

Таблица 3.2