Графическое представление экспериментальных данных

Для наглядности результатов эксперимента используется их графическое представление: гистограмма, полигон частот и полигон накопленных частот.

Гистограмма – это примыкающие друг к другупрямоугольники. Основание каждого прямоугольника есть ширина группировки hi. а высота - ni. если все hi одинаковые. На графике гистограммы основания прямоугольников откладываются по оси Ох, а высоты по оси Оy.

ni

 

24,9 25,7 26,5 27,3 28,1 28,9 29,7 30,5 x

Рис. 1. Гистограмма с равными интервалами

Если hi не одинаковые, то по оси Оу откладывается Pi, где Pi = , т.е. высоты прямоугольников должны быть пропорциональны величинам Pi .

Pi

 

 

 

 

24,9 25,7 26,5 27,3 28,1 29,7 30,5 x

Рис. 2. Гистограмма с объединенными интервалами

На рисунке 1 гистограмма построена по данным таблицы 3 с равными интервалами. На рисунке 2 интервалы взяты не одинаковые (два объединили), поэтому по оси Оу откладывали Pi.

Полигон частот – это ломаная линия, соединяющая точки, соответствующие срединным значениям интервалов группировки.

ni

 

 

 

 

2

 

 

0 25,3 26,1 26,9 27,7 28,5 29,3 30,1 хсi

Рис. 3. Полигон частот

На оси Ох отложены срединные значения, по оси Оу – частоты. Из сравнения двух способов следует, что для получения полигона частот из построенной гистограммы нужно соединить середины сторон отрезками. На рис 1 график полигона частот построен пунктиром.

Полигон накопленных частот получается при соединении отрезком прямых точек. координаты которых соответствуют верхним границам интервалов группировки и накопленным частотам. По оси ОХ границы интервалов, по оси ОУ - накопленные частоты.

nхi

 

 

 

 

 

0 24,9 25,7 26,5 27,3 28,1 28,9 29,7 30,5 x

Рис.4. Полигон накопленных частот

Получили более плавную линию по сравнению с полигоном частот.

Числовые характеристики выборки дают количественные представления об эмпирических данных и позволяют сравнивать их между собой. Остановимся на некоторых из них подробнее. К характеристикам положения относятся: среднее арифметическое, медиана, мода. Они определяют положение центра эмпирического распределения.

Среднее арифметическое – одна из основных характеристик выборки и представляет собой такое значение признака, сумма отклонений от которого выборочных значений признака равна нулю. Геометрически среднее арифметическое можно определить как точку на оси Ох, которая является абсциссой центра масс гистограммы и обозначается .

Для несгруппированных данных среднее арифметическое определяется по формуле: , (3.1), где n – объём выборки, хi варианты выборки.

Пример.

Для оценки уровня физической подготовленности студентов 1-го курса педагогического вуза были выбраны прыжки в длину с места. Результаты контрольной группы студентов в количестве 15 человек оказались следующими (в см): 213, 224, 225, 210, 226, 230, 201, 224, 230, 227, 228, 252, 238, 232, 246. Определить средний результат.

Для сгруппированных данных среднее арифметическое определяется по следующей формуле: , (3.2), где n – объём выборки, ni – частоты интервалов, хi срединные значения интервалов.

Пример:

Вычислить среднее арифметическое результатов в беге на 5 км (лыжи), сгруппированных в таблице. Для наглядности промежуточные результаты расчетов занесем в таблицу.

Медианой называется такое значение признака X, когда одна половина значений экспериментальных данных меньше её, а вторая половина больше. Если объем выборки невелик, то для вычисления медианы выборку ранжируют, т. е. располагают в порядке возрастание или убывания и вычисляют порядковый номер R (ранг) медианы по формуле: .

Пусть, например, имеется ранжированная выборка n=11:

13, 15, 16. 19, 19, 22, 23, 25, 27, 27, 29. Тогда ;

Ме = 22 (6-ой член ряда).

При n = 8: 12, 15, 16, 18, 22, 24, 25, 27; .

Медианой в этом случае может быть любое число между 18 и 22 (четвертым и пятым членами ряда). Ме = .

Для сгруппированных данных вначале находят медианный интервал, т.е. интервал, в котором находится медиана. Медианным будет тот интервал. в котором накопленная частота окажется больше (n – объем выборки) или накопленная частость больше . Внутри медианного интервала медиана ищется по формуле: , где

Хмен - нижняя граница медианного интервала;

0,05n – 1/2 объема выборки;

h – ширина интервала группировки;

nхмв -1 - накопленная частота интервала, предшествующего медианному;

nме- частота медианного интервала.

Найдем медиану, в предыдущем примере. Медиана содержится в интервале (27,3; 28,0), которому соответствует накопленная частота 32, а =25. Me = 27,3 + 0,8 = 27,6; Ме = 27,6 (мин)

Медиана несколько отличается от среднего арифметического, так как имеет место несимметрическая форма эмпирического распределения.

Как было сказано выше, мода представляет собой значение признака, встречающееся в выборке наиболее часто. Интервал группировки с наибольшей частотой называется модальным. Мода ищется по формуле:

где

Хмон - нижняя граница модального интервала;

h - ширина интервала группировки;

nмо- частота модального интервала:

nмо – 1 - частота интервала, предшествующего модальному.

nмо + 1 - частота интервала, следующего за модальным.

Для предыдущего примера имеем Мо = 26,5+0,8 27,2. Тогда Мо = 27,2 (мин).