Коэффициент корреляции Бравэ-Пирсона
В данной лекции будут рассмотрены методы обработки исходной информации, полученной в ходе измерений. Для того чтобы правильно применять эти методы и делать корректные выводы, необходимо понять роль статистики и значение приведенных методов.
Статистика представляет собой отрасль знаний, которая исследует совокупности массовых однородных явлений. Особенность этих явлений заключается, с одной стороны, в том, что они однородны, а с другой — отличаются друг от друга количественными показателями. Например, исследуя большую группу спортсменов одного возраста, пола, спортивной квалификации и стажа, необходимо измерить величину максимального потребления кислорода (МПК). В первом случае мы получим массовые однородные показатели, а во втором— индивидуальные показатели, где каждый показатель МПК соответствует конкретному спортсмену и отличается один от другого.
Таким образом, объектом исследования статистики будут массовые однородные явления, которые отличаются друг от друга, или, как принято говорить в статистике, варьируют по единичному показателю.
Предметом исследования статистики является оценка статистических совокупностей, где применяют специальные математико-статистические методы, которые имеют определенную цель при обработке своих результатов, а именно: измерения массовых статистических совокупностей заменяются такими показателями, от применения которых не происходит или почти не происходит потеря исходной информации. Таким образом, большие совокупности чисел заменяются несколькими параметрами, несущими в себе всю исходную информацию.
Сжатие информации до обозримых размеров позволяет проанализировать исследуемое явление и дать ему адекватную оценку, что невозможно осуществить при рассмотрении всей статистической совокупности. Кроме того, выявление параметров совокупности в ряде случаев позволяет установить природную закономерность в оценки исходных данных как в части ее конкретного анализа, так и при ее сравнении с другими совокупностями.
Все эти рассуждения имеют место в практике спортивных исследований. За редким исключением, исследования в физической культуре и спорте основаны на наблюдениях, эксперименте и тестировании. Значительная часть научных методов опирается на результаты измерений больших групп спортсменов. Так, изначально практика ФКС располагает исходными данными в виде статистической совокупности, где ее единичные показатели отражают достижения конкретного спортсмена, а их варьирование свидетельствует об индивидуальном различии спортсменов по измеряемому показателю.
Итак, спортивная статистика — это наука о массовых однородных явлениях в практике ФКС.
Метод средних величин
Самым популярным методом статистики в практике физической культуры и спорта является метод средних величин, который состоит из трех основных этапов: 1) образование вариационных рядов на базе исходной статистической совокупности; 2) определение параметров вариационных рядов, характеризующих совокупность без потерь информации; 3) практическую реализацию найденных параметров.
Статистические совокупности предполагают большие массивы чисел: чем больше исходных данных, тем точнее конечный результат. В принципе практические совокупности имеют объем от 30 до 200 ед. Однако в практике спорта есть свои особенности.
Во-первых, на практике по определенному виду спорта чемпионов бывает ограниченное количество (8 — 10 человек). В этом случае используют статистические методы на малых совокупностях, справедливо полагая, что лучше установить закономерность на малой совокупности, чем вообще ее не иметь.
Во-вторых, в практике спорта не только спортсмены, но и сами явления бывают уникальны, поэтому совокупности могут быть малыми. Как бы там ни было, но принцип действия метода средних величин остается одинаковым и для больших, и для малых совокупностей.
Полученная на практике и представленная выше группа бессистемных чисел должна быть преобразована в систему, т.е. совокупность связанных между собой показателей, характеристики которой дадут представление о всей системе, а через нее — и о группе исходных данных.
С целью получения такой системы осуществим операцию ранжирования.
Ранжирование — это операция расположения чисел в порядке или возрастания, или убывания.
Вариационный ряд — это двойной столбец ранжированных чисел, где слева стоит собственно показатель — вариант, а справа — его количество — частота.
Сумма частот называется объемом совокупности, т.е. общим числом исходных данных. Сумма всех частот и представляет собой объем совокупности.
Средняя арифметическая величина — показатель среднего уровня, самого типичного и характерного для всего ряда — определяется по формуле
где, .
Символ обозначает сумму всех значений , когда i принимает значения от 1 до n. -это знак суммирования, внизу и вверху которого указывают пределы суммирования («от» -«до»), а за знаком -общий член последовательности, подлежащей суммированию; индекс i называется индексом суммирования.
Дисперсия указывает на варьирование, т.е. рассеивание исходных данных относительно средней арифметической величины (в квадрате).
Дисперсия определяется по формуле
Если число измерений не более 30, т.е. n£30, используется формула
Эти формулы применяются, когда результаты представлены неупорядоченной (обычной) выборкой.
Из характеристик колеблемости наиболее часто используется среднее квадратическое отклонение, которое определяется как положительное значение корня квадратного из значения дисперсии, т.е.
Среднее квадратическое отклонение (оно называется также стандартным отклонением) имеет те же единицы измерения, что и результаты измерения, т.е. характеризует степень отклонения результатов от среднего значения в абсолютных единицах. Однако для сравнения колеблемости двух и более совокупностей, имеющих различные единицы измерения, эта характеристика не пригодна. Для этого используется коэффициент вариации.
Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах. Вычисляется он по формуле:
В спортивной практике колеблемости результатов измерений в зависимости от величины коэффициента вариации считают небольшой (0-10%), средней (11-20%) и большой (V>20%).
Стандартная ошибка средней арифметической вычисляется по формуле:
где, - стандартное отклонение результатов измерения, - объем выборки.