Краткие теоретические сведения

F-распределение возникает в регрессионном, дисперсионном и дискриминантном анализе, а также в других видах многомерного анализа данных. Далее оно будет неоднократно встречаться в таблицах вывода системы Statistica 6.

Случайная величина, имеющая F-распределение с парой степеней свободы m, n, определяется как отношение двух независимых случайных величин, имеющих распределение -квадрат(хи-квадрат) со степенями свободы m и n с умножением на нормировочный сомножитель n/m.

F-распределение сосредоточено на положительной полуоси. Это распределение в отличие от нормального несимметрично. Покажем, как построить график F-распределения и вычислить его процентные точки.

t-распределение важно в тех случаях, когда рассматриваются оценки среднего и неизвестна дисперсия выборки. В этом случае используют выборочную дисперсию и t-распределение.

t-распределение возникает в таблицах вывода регрессионного анализа. Это одно из важнейших распределений, наряду с нормальным и распределением -квадрат(хи-квадрат).

t-распределение с k-степенями свободы сосредоточено на всей действительной оси, симметрично относительно нуля. Среднее
t-распределения равно нулю, дисперсия равна k/(k-2).

Случайная величина, имеющая распределение -квадрат, определяется как сумма квадратов k независимых стандартных нормальных величин. Нормальные случайные величины – это величины, имеющие нормальное распределение. Число k в определении -квадрата называется числом степеней свободы. В частном случае, когда k= l случайная величина -квадрат равна квадрату стандартной нормальной величины. Итак, это распределение имеет только один параметр – число степеней свободы, являющийся целым положительным числом.

F-распределение Фишера

В списке распределений вероятностного калькулятора выберите
F (Fisher)(F-распределение) (рисунок 3.1 а).

Задайте в поле df1 (степень свободы 1) значение 10, в поле df2 (степень свободы 2) — значение 11. Пометьте опцию Create Graph(Создать график).

В поле р задайте 0,5. Нажав кнопку Compute(Вычислить), на экране вы увидите следующий график (рисунок 3.1 б).

 

а) б)

Рисунок 3.1 – F-распределение в вероятностном калькуляторе:
а) задание; б) плотность и функция F-распределения со степенями свободы 10, 11

T-распределение Стьюдента

В списке распределений вероятностного калькулятора выберите
t (Student) (t-распределение Стьюдента) (рисунок 3.2 а).

В строке dfзадайте 5 – число степеней свободы. Пометьте опцию Create Graph(Создать график).

В поле р задайте 0,5. Нажмите кнопку Compute(Вычислить), на экране вы увидите следующий график (рисунок 3.2 б).

При больших степенях свободы (больших 30) t-распределение практически совпадает со стандартным нормальным распределением.

Плотность t-распределения деформируется при возрастании числа степеней свободы следующим образом: пик увеличивается, хвосты
более круто идут к нулю, кажется, как будто плотность сжимается с боков.

a) б)

Рисунок 3.2 – t-распределения Стьюдента в вероятностном калькуляторе: a) задание; б) плотность и функция t-распределения Стьюдента с 5 степенями свободы

В такой деформации плотности легко убедиться с помощью вероятностного калькулятора. Задайте в поле df(степень свободы) значение 50. Нажав кнопку Compute(Вычислить), на экране вы увидите следующий график (рисунок 3.3).

 

Рисунок 3.3 – Плотность и функция распределения Стьюдента
с 50 степенями свободы

 

Сравнив график плотности распределения Стьюдента с большим числом степеней свободы, например 50, и график плотности стандартного нормального распределения, вы убедитесь, что они очень похожи.

Распределение -квадрат (хи-квадрат)

В списке распределений вероятностного калькулятора выберите Chi ?(-квадрат)(рисунок 3.4).

 

Рисунок 3.4 – Задание -квадрат-распределения в вероятностном калькуляторе

В строке dfзадайте 7 – число степеней свободы.

В поле р задайте 0,95. Нажмите кнопку Compute(Вычислить), в строке Chi ? вы увидите 0,95 – квантиль -квадрат-распределенияс 7степенями свободы (14,06714).

Выберите далее опцию Create Graph(Создать график)и вновь щелкните на кнопке Compute(Вычислить) либо просто нажмите Enterна клавиатуре, вы увидите график плотности и функции распределения -квадрат с 7степенями свободы (рисунок 3.5).

 

Рисунок 3.5 – График плотности и функции распределения случайной величины -квадрат с 7степенями свободы

Обратите внимание на то, что это распределение несимметрично и сосредоточено только на положительной полуоси.

Распределение -квадрат играет важную роль при исследовании оценки дисперсии нормальной выборки, а также при проверке зависимостей в таблицах сопряженности и в критериях согласия.

Задания для выполнения

1 С помощью вероятностного калькулятора вычислите значения распределений F-Фишера, t-Стьюдента и -квадрат при различных значениях степеней свободы для уровня надежности 0,95.

2 Дайте объяснение полученным результатам.

Таблица 3.1 – Варианты заданий

№ задания Распределение Степени свободы
df1 df2
F-Фишера
F-Фишера
F-Фишера
F-Фишера
F-Фишера
F-Фишера
F-Фишера
F-Фишера
F-Фишера
F-Фишера
F-Фишера
t-Стьюдента  
t-Стьюдента  
t-Стьюдента  
t-Стьюдента  
t-Стьюдента  
t-Стьюдента  
-квадрат  
-квадрат  
-квадрат  
-квадрат  
-квадрат  
-квадрат  

 

Лабораторная работа 4
Разнообразие значений признака (MS Excel)

Цель работы: Научить выполнять первичную обработку данных в табличном редакторе MS Excel.