Понятие статистической гипотезы

Нормальное распределение и его параметры.

Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений, в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.

Нормальное распределение зависит от двух параметров — смещения и масштаба, то есть, является, с математической точки зрения, не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и разброса (стандартного отклонения).

Дискретный статистический ряд распределения.

Дискретные ряды распределения основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье).

Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака , а затем подсчитывается частота повторения варианта. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты. Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности.

Интервальный статистический ряд распределения.

Интервальный статистический ряд содержит в качестве значений интервалы (могут быть равными или неравными) и частоты значений, попадающих в этот интервал.

Интервальные ряды распределения базируются на непрерывно изменяющемся значении признака, принимающем любые (в том числе и дробные) количественные выражения, т.е. значение признаков таких рядах задается в виде интервала. При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование – расположение всех вариантов в возрастающем (убывающем) порядке.

Графический метод представления статистических данных.

Графический метод — это метод условных изображений при помощи линий, точек, геометрических фигур и других символов.

Основными элементами графика являются поле графика, графический образ, масштаб, масштабная шкала, экспликация графика:

• Поле графика — пространство, на котором размещаются графические символы.

• Графические образы — составляют основу графика. В качестве графических символов используются геометрические знаки.

• Масштаб — это мера перевода числовой величины в графическую.

• Масштабная шкала — линия с нанесенными на нее масштабными отметками и их числовыми значениями. Шкалы могут быть равномерными и неравномерными (логарифмические шкалы), прямолинейными и криволинейными (круговые).

• Экспликация графика — пояснения содержания графика, относящиеся к его заголовку, единицам измерения.

Понятие статистической гипотезы

Проверка статистических гипотез является содержанием одного из обширных классов задач математической статистики. Статистическая гипотеза — предположение о виде распределения и свойствах случайной величины, которое можно подтвердить или опровергнуть применением статистических методов к данным выборки.

• Формулировка основной гипотезы и конкурирующей гипотезы.

• Задание уровня значимости, на котором в дальнейшем и будет сделан вывод о справедливости гипотезы. Он равен вероятности допустить ошибку первого рода.

• Расчёт статистики критерия такой, что:

• её величина зависит от исходной выборки;

• по её значению можно делать выводы об истинности гипотезы;

• статистика, как функция случайной величины, также является случайной величиной и подчиняется какому-то закону распределения.

• Построение критической области. Из области значений выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство. Это множество и называется критической областью.

• Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы.