ТЕМА 4. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, ЕЕ ОСНОВНЫЕ ПОНЯТИЯ И ПРИЛОЖЕНИЕ К ФИЗИЧЕСКОЙ КУЛЬТУРЕ И СПОРТУ


1. Возникновение и развитие математической статистики
Издавна в каждом государстве соответствующими органами власти собирались сведения о числе жителей по полу, возрасту, занятости в различных сферах труда, наличии различных воинов, вооружения, денежных средств, орудий труда, средств производства и т.д. Все эти и подобные им данные называются статистическими. С развитием государства и международных отношений возникла необходимость анализа статистических данных, их прогнозирование, обработка, оценка достоверности основанных на их анализе выводов и т.п. К решению таких задач стали привлекаться математики. Таким образом, в математике сформировалась новая область — математическая статистика, изучающая общие закономерности статистических данных или явлений и взаимосвязи между ними.
Сфера применения математической статистики распространилась во многие, особенно экспериментальные, науки. Так появились экономическая статистика, медицинская статистика, биологическая статистика, статистическая физика и т.д. С появлением быстродействующих ЭВМ возможность применения математической статистики в различных сферах деятельности человека постоянно возрастает. Расширяется ее приложение и к области физической культуры и спорта. В связи с этим основные понятия, положения и некоторые методы математической статистики рассматриваются в курсе “Спортивная метрология”. Остановимся на некоторых основных понятиях математической статистики.
2. Статистические данные
В настоящее время под термином "статистические данные" понимают все собранные сведения, которые в дальнейшем подвергаются статистической обработке. В различной литературе их еще называют: переменные, варианты, величины, даты и т.д. Все статистические данные можно разделить на: качественные, труднодоступные для измерения (имеется, не имеется; больше, меньше; сильно, слабо; красный, черный; мужской, женский и т.д.), и количественные , которые можно измерить и представить в виде числа общих мер (2 кг, 3 м, 10 раз, 15 с и т.д.); точные , величина или качество которых не вызывают сомнений (в группе 6 человек, 5 столов, деревянный, металлический, мужской, женский и т.д.), и приближенные , величина или качество которых вызывает сомнение (все измерения: рост 170 см, вес 56 кг, результат бега на 100 м - 10,3 с и т.д.; близкие понятия — синий, голубой, мокрый, влажный и т.д.); определенные (детерминированные), причины появления, не появления или изменения которых известны (2 + 3 = 5, подброшенный вверх камень обязательно будет иметь вертикальную скорость, равную 0 и т.д.), и случайные , которые могут появляться и не появляться или не все причины изменения которых известны (пойдет дождь или нет, родится девочка или мальчик, команда выиграет или нет, в беге на 100 м — 12,2 с, принятая нагрузка вредна или нет). В большинстве случаев в физической культуре и спорте мы имеем дело с приближенными случайными данными.
3. Статистические признаки, совокупности
Общее свойство, присущее нескольким статистическим данным, называют их статистическим признаком . Например, рост игроков команды, результат бега на 100 м, принадлежность к виду спорта, частота сердечных сокращений и т.д.
Статистической совокупностью называют несколько статистических данных, объединенных в группу хотя бы одним статистическим признаком. Например, 7.50, 7.30, 7.21, 7.77 — результаты прыжка в длину в метрах у одного спортсмена; 10, 12, 15, 11, 11 — результаты подтягивания на перекладине пяти студентов и т.д. Число данных в статистической совокупности называют ее объемом и обозначают n . Различают следующие совокупности:
бесконечные — n (масса планет Вселенной, число молекул и т.д.);
конечные — n - конечное число;
большие — n > 30;
малые — n 30;
генеральные — содержащие все данные, обусловленные постановкой задачи;
выборочные — части генеральных совокупностей.
Например, пусть рост студентов 17-22 лет в РФ — генеральная совокупность, тогда рост студентов КГАФК, всех студентов города Краснодара или студентов II курса — выборки.
4. Кривая нормального распределения
При анализе распределения результатов измерений всегда делают предположение о том распределении, которое имела бы выборка, если бы число измерений было очень большим. Такое распределение (очень большой выборки) называют распределением генеральной совокупности или теоретическим , а распределение экспериментального ряда измерений — эмпирическим.
Теоретическое распределение большинства результатов измерений описывается формулой нормального распределения, которая впервые была найдена английским математиком Муавром в 1733 г.:

Это математическое выражение распределения позволяет получить в виде графика кривую нормального распределения (рис.3), которая симметрична относительно центра группирования (обычно это значение , моды или медианы). Эта кривая может быть получена из полигона распределения при бесконечно большом числе наблюдений и интервалов. Заштрихованная область графика на рисунке 3 отражает процент результатов измерений, находящихся между значениями х1 и х2.

Рис. 3. Кривая нормального распределения.
Введя обозначение , которое называется нормированным или стандартизованным отклонением, получают выражение для нормированного распределения:

На рисунке 4 представлен график этого выражения. Он примечателен тем, что для него =0 и s =1 (результат нормировки). Вся площадь, заключенная под кривой, равна 1, т.е. она отражает все 100% результатов измерений. Для теории педагогических оценок и особенно для построения шкал представляет интерес процент результатов, лежащих в различном диапазоне варьирования, или колеблемости.
function PlayMyFlash(cmd){ Norm_.SetVariable("Counter", cmd); Norm_.GotoFrame(2); Norm_.Play(); }


1 !!! 1,96 !!! 2 !!! 2,58 !!! 3 !!! 3,29 !!!


Рис.4. Кривая нормированного распределения с процентным выражением распределений относительных и накопленных частностей:
под первой осью абсцисс — среднее квадратическое отклонение;
под второй (нижней) — накопленный процент результатов.

 


Для оценки варьирования результатов измерений используют следующие соотношения:

± 1,96 (u= ± 1,96) интервал включает 95% всех результатов
± 2,58 (u= ± 2,58)   99%  
± 3,29 (u= ± 3,29)   99,9%  
± 1 (u= ±1)   68,27%  
± 2 (u= ±2)   95,45%  
± 3 (u= ±3)   99,73%  


Другими словами, отклонения, большего, чем , от следует ожидать примерно в одном случае из трех; отклонения, большего, чем 2 , — в четырех-пяти случаях из 100, отклонения, большего, чем 3 , — в трех из 1000. Последнее соотношение для нормального распределения называют "правилом трех сигм" и используют при исключении сильно отклоняющихся "ошибочных" результатов измерений.
5. Виды представления статистических данных
После того, как определена выборка и стали известны ее статистические данные (варианты, даты, элементы и т.д.), возникает необходимость представить эти данные в удобном для решения задачи виде. На практике используют много различных видов представления статистических данных. Наиболее часто употребляют следующие:
а) текстовый вид;
б) табличный вид;
в) вариационный ряд;
г) графический вид.
Если при статистической обработке совокупности безразлично в какой последовательности записывать данные, то бывает удобным расположить эти данные (варианты) в соответствии с их значением либо по возрастанию xi ~ 2, 3, 3, 5, 5, 6, 6, 6, 6, 7 (неубывающая совокупность), либо по убыванию xi ~ 7, 6, 6, 6, 6, 5, 5, 3, 3, 3, 2 (невозростающая совокупность). Этот процесс называется ранжированием . А место каждой варианты в ранжированном ряду называется рангом .

Тема: Графическое изображение вариационных рядов
Цель:научиться строить графики (гистограмму и полигон) распределения частот в вариационном ряду и делать по ним выводы об однородности группы по заданному признаку.
Теоретические сведения
Анализ вариационных рядов упрощается при графическом представлении. Рассмотрим основные графики вариационного ряда.
1. Полигон распределения (рис. 5-I). На графике ѕ это кривая, отражающая по оси абсцисс (Х) средние значения классов, а по оси ординат (Y ) ѕ частоту накопления величин в каждом классе.
2. Гистограмма распределения (рис. 5 -II). График, выполненный в прямоугольной системе координат и отражающий по оси ординат (Y ) частоту накопления величин в классе, а по оси абсцисс (Х) - границы классов.
Графическое представление результатов измерений не только существенно облегчает анализ и выявление скрытых закономерностей, но и позволяет правильно выбрать последующие статистические характеристики и методы.
ПРИМЕР 4.1.
Построить графики вариационного ряда 20 исследуемых по показателям результатов тестирования прыжка в высоту, если данные выборки таковы:
xi, см ~ 185, 170, 190, 170, 190, 178, 188, 175, 192, 178, 176, 180, 185, 176, 180, 192, 190, 190, 192, 194.
Решение:
1. Производим ранжирование вариационного ряда в порядке неубывания:
xi, см ~ 170,170, 174, 176, 176, 178, 178, 180, 180, 185, 185, 188, 190, 190, 190, 190, 192, 192, 192, 194.
2. Определяем минимальное и максимальное значение вариант и рассчитываем размах вариационного ряда по формуле:
R=Xmax — Xmin (1)
R=194-170=24 см
3. Рассчитываем число классов по формуле Стерджеса:
(2)
N=1+3,31 Ч 1,301=5,30631 5
4. Рассчитываем интервал каждого класса по формуле:
(3)

5. Составляем таблицу границ классов.

№ класса Граница класса Среднее значение класса Частота класса Накопленная частота класса
1. Xmin хi < Xmin+k 170см хi < 174,8см 172,4 см
2. Xmin +k хi < Xmin+2k 174,8см хi < 179,6см 177,2 см
3. Xmin +2k хi < Xmin+3k 179,6см хi < 184,4см 182 см
4. Xmin +3k хi < Xmin+4k 184,4см хi < 189,2см 186,8 см
5. Xmin +4k хi < Xmin+5k 189,2см хi < 194см 191,6 см

7. Рассчитываем среднее значение каждого класса по формуле:


7 . Построим графики гистограммы и полигона данного вариационного ряда (рис.5).

Y Частота класса




Рис.5. Графическое изображение вариационного ряда
8. Сделаем выводы по построенным графикам гистограммы и полигона об однородности выборки по заданному признаку, учитывая следующие моменты:

    • если гистограмма и полигон по своему виду близки к виду графика нормального распределения величин, то группа однородна;
    • если графики низкие и растянутые, то группа, возможно, однородна, но некомпактна;
    • если графики имеют 2 и более вершины, то группа неоднородна по данному признаку, ее необходимо разбить на подгруппы, чтобы с каждой из подгрупп вести занятия по индивидуальному плану.

Вывод: так как на представленных графиках гистограмма и полигон имеют 2 вершины, то группу исследуемых по показателю прыжка в высоту можно считать неоднородной.
Ход работы
ЗАДАЧА 1.
Построить графики вариационного ряда результатов тестирования 10 исследуемых в показателе _________________________________, если данные выборки таковы:
xi ~
Решение:

1. Проранжировать данный вариационный ряд в порядке неубывания:

xi ~
2. Рассчитать размах вариационного ряда по формуле:
R=Xmax — Xmin
R=
3. Определить число классов выборки по формуле Стерджеса:
N=1+3,31 * lgn
N=
4. Определить интервал класса по формуле:

k=
5. Составить таблицу границ классов:

№ класса Граница класса Среднее значение класса Частота класса Накопленная частота класса
1.
2.
3.
4.
5.

6. Построить графики гистограммы и полигона данного вариационного ряда:

Вывод:
Контрольные вопросы

1. Что называется вариационным рядом?
2. Что такое ранжирование?
3. Что такое ранг?
4. Основные характеристики вариационного ряда.
5. Графическое изображение вариационных рядов, цель построения графиков.