Группированные выборочные данные

Если объем выборки велик ( ), и при этом мы имеем дело с одномерной непрерывной величиной (или с одномерной дискретной величиной, число возможных которой достаточно велико), то часто удобнее, с точки зрения упрощения дальнейшей статистической обработки результатов наблюдений, перейти к так называемым «группированным» выборочным данным. Для этого

1. находят наименьшее и наибольшее значения в выборке:

2. весь диапазон значений разбивается на определенное число равных интервалов группирования, при этом количество интервалов должно быть в пределах 7–20. Количество интервалов зависит от объема выборки и может быть найдено приближенно по формуле , которую следует воспринимать, скорее, как оценку снизу для (особенно при больших );

3. отмечаются крайние точки каждого из интервалов в порядке возрастания, а также их середины ;

4. подсчитываются числа выборочных данных, попавших в каждый из интервалов: ( ); выборочные данные, попавшие на границы интервалов, либо равномерно распределяются по двум соседним интервалам, либо уславливаются относить их только к какому-то одному из них, например, левому.

В зависимости от конкретного содержания задачи в данную схему группирования могут быть внесены некоторые изменения (например, в некоторых случаях целесообразно отказаться от требования равной длины интервалов группирования; иногда крайние интервалы целесообразно делать бесконечными слева и справа).