Кнопки основных операций, доступных при создании переменных

 

Арифметические операции Операции сравнения Логические операции
+ Сложение < Меньше & И
- Вычитание > Больше | Или
* Умножение <= Меньше или равно ~ Не
/ Деление >= Больше или равно    
** Возведение в степень = равно    
() Очередность операций ~ = Не равно    

Основные функции, доступные при создании переменных.

ABS( numexpr)

Вычисляет модуль аргумента. Если zpositiv — целевая переменная, то выраже­ние ABS(zscore) создаст переменную zpositiv, чьи значения будут равны моду­лям соответствующих значений переменной zscore.

RND{numexpr)

Возвращает значение аргумента, округленное до ближайшего целого. Если simple — целевая переменная, то выражение RND(oтметка1) создаст перемен­ную simple, чьи значения будут равны значениям переменной отметка1, округ­ленным до ближайшего целого.

TRUNC(numexpr)

Возвращает целую часть аргумента. Если easy — целевая переменная, то вы­ражение TRUNC(oтметка1) создаст переменную easy, чьи значения будут рав­ны значениям переменной отметка1 с отсеченной дробной частью.

MODinumexpr, modulus)

Возвращает остаток от деления аргумента numexpr па число modulus (обычно равное 10). Если remain — целевая переменная, то выражение MOD(N, 10) соз­даст переменную remain, чьи значения будут равны последней цифре числа N. Если N = 86, то remain = 6.

SQRT(numexpr)

Возвращает квадратный корень аргумента. Если тест1rt — целевая пере­менная, то выражение SQRT(Tecтl) создаст переменную тecт1rt, чьи значения будут равны корню квадратному от каждого значения тест1.

Е№ (numexpr)

Возвращает число е (экспонента), возведенное в степень аргумента. Если confuse — целевая переменная, то выражение ЕХР(отметка1) создаст перемен­ную confuse, чьи значения будут равны числу е в степени отметка 1. е 2,721...; ЕХР(3,49) = (2,721...)349 32,900506.

LG10(питехрг)

Возвращает десятичный логарифм аргумента. Если rhythm — целевая пере­менная, то выражение LGIO(Tecт1) создаст переменную rhythm, чьи значения будут равны десятичным логарифмам переменной тест1.

LH(питехрг)

Возвращает натуральный логарифм аргумента. Если natural — целевая пере­менная, то выражение LGIO(Tecт1i) создаст переменную rhythm, чьи значения будут равны натуральным логарифмам переменной тест1.

NORMAL(stddev)

Возвращает массив нормально распределенных случайных чисел с нулевым сред­ним значением и стандартным отклонением, равным stddev. Если randnorm — целевая переменная, то выражение NORMAL(3) создаст переменную randnorm, значениями которой будут случайные числа, распределенные нормально с ну­левым средним значением и стандартным отклонением, равным 3.

UNIFORM (mах)

Возвращает массив случайных чисел, полученных в результате равновероят­ной выборки из целочисленного диапазона от 1 до max. Если random — целе­вая переменная, то выражение UNIFORM(IOO) создаст переменную random, чьи значения будут являться случайными целыми числами от 1 до 100.

 

Команда Compute (Вычислить) позволяет создать новую перемен­ную, значения которой вычисляются при помощи выражения, содержащего другие переменные. Команда Transform Rank Cases (Преобразование Ранжировать объекты) тоже позволяет создать новую переменную, значения которой ранго­вые места объектов но заданной переменной. Эта процедура применяется, когда необходимо перейти от исходных значений переменной к рангам.

Команда ранжирования (перехода к рангам) выполняется при помощи диало­гового окна,. Для перехода к рангам достаточно задать имя переменной в этом окне и щелкнуть на кнопке ОК. Появится но­вая переменная с заданным по умолчанию именем, содержащая ранги значений исходной переменной.

1.Сравнить успеваемость юношей и девушек в 11 классе, т.е. две независимые выборки с помощью Критерия МаннаУитни (MannWhitney), или U-критерия (ориентированый на распределения, отличные от нормальных). По назначению аналогичен t-критерию для независимых выборок (ориентированый на нормальные и близкие к ним распределения).

При реализации метода про­грамма сначала ранжирует все объекты без учета принадлежности к сравни­ваемым группам, а затем вычисляет средние ранги для каждой из двух групп Чем выше средний ранг группы, тем выше ее успеваемость После определе­ния средних рангов определяется р-уровень.

В меню Analyze (Анализ) выберите команду Nonparametric Tests 2 Independent Samples (Непараметрические методы Две независимые выборки), чтобы от­крыть диалоговое окно Two-Independent Samples Test (Критерий для двух неза­висимых выборок) (рис. 3) Для применения метода :переместите переменную отметка2 в списокTest Variable List (Список тестируемых переменных) Переместите переменную пол в полоGrouping Variable (Группирующая переменная) В диалоговом окне Define Groups (Определение групп), В поле Group 1 (Группа 1) введите значение 1, в поле Group 2 (Группа 2), введите зна­чение 2 и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Two-Independent Samples Test (Критерий для двух неза­висимых выборок). О К.

2.Сравненить две зависимые выборки. С помощью методов критерия знаков (sign test - сравнивает два измерения переменной на одной вы­борке (например, «до» и «после») но уровню ее выраженности путем сопостав­ления количества положительных и отрицательных разностей (сдвигов) значений) и критерий Вилкоксона (Wilcoxon test - критерий основан на подсчете абсолютных разностей между парами значений с последующим их ранжированием. Затем вычисляются средние значения рангов для положительных и отрицательных разностей (сдвигов). Уровень значи­мости подсчитывается на основе стандартизованного значения).

Сравнить результаты учащихся по второму (тест2) и четвертому (тест4) тестам. Для каждого объекта сначала определяется знак разности значений. Так, для первого объекта значение тест2 равно 7, а значение тест4 10. Сравнение этих значений даст отрица­тельный знак (7 - 10 - 3 < 0). Для четвертого объекта значения переменных тест2 и тест4 составляют, соответственно, 9 и 6, и знак разности будет положитель­ным (9 - 6 > 0). Подсчитывается число положительных, отрицательных и нуле­вых разностей, а затем вычисляется нормализованное z-значение и р-уровень зна­чимости.

В меню Analyze (Анализ) выберите команду Nonparametric Tests 2 Related Samples (Непараметрические критерии Две зависимые выборки), чтобы от­крыть диалоговое окно Two-Related Samples Test (Критерий для двух зависи­мых выборок) (рис.4). В группе Test Type (Тип критерия) установите флажок Sign (Знаков) и сбросьте флажок Wilcoxon (Вилкоксона). Переместить тест2 и тест4. Variable 1 и 2 (Переменная 1 и 2) в области Current Selections (Текущие выделения). Переместить выбранную пару переменных в список Test Pair(s) List (Список тестируемых пар). О К.

. Проверим гипотезу о неслучайном чередовании юношей и девушек (переменная пол) в списке испы­туемых в файле exOI .sav. с помощью критерия серий (применяется для анализа последователь­ности объектов (явлений, событий), упорядоченных во времени или в порядке возрастания (убывания) значений измеренного признака. Кроме того, критерий требует представления последовательности в виде бинарной переменной, то есть как чередования событий 0 и 1. Серия это последовательность однотипных событий, непосредственно перед и после которой произошли события другого типа. Гипотеза о случайном распределении событий 1 среди событий 0 может быть отклонена, если количество серий либо слишком мало (однотипные события имеют тенденцию к группиро­ванию), либо слишком велико (события 0 и 1 имеют тенденцию к чередованию).

Analyze (Анализ) выберите команду Nonparametric Tests Runs (Непараметрические критерии Серии), чтобы открыть диалоговое окно Runs Test (Критерий серий) рис.5Переменную пол переместить в поле Test VariableList (Список тестируемых переменных) В группе Cut Point (Точка раздела) установите флажок Custom (Настрой­ка), введите в расположенное рядом поле значение 2 и сбросьте флажокMedian (Медиана). ОК

 

5. Сравнить распределение переменной отметка 1 с нормаль­ным распределением с помощью Критерия Колмогорова-Смирнова для одной выборки (позволяющего определить, отли­чается ли заданное распределение от нормального (эксцесс и асимметрия рас­пределения равны 0), равномерного (значения распределены с одинаковой плот­ностью, например, как у целых чисел от 1 до 1000), Пуассона (среднее значение и дисперсия равны Х\ при больших значениях А, распределение Пуассона при­ближается к нормальному) или экспоненциального. Суть метода заключается в сравнении эмпирического (наблюдаемого) распределения накопленных частот выборки с теоретическим (ожидаемым) распределением накопленных частот (нормальным, Пуассона и т. д.).

В меню Analyze (Анализ) выберите команду Nonparametric Tests 1-Sample K-S (Непараметрические критерии Критерий К-С для одной выборки), чтобы от­крыть диалоговое окно One-Sample KolmogorovSmirnov Test (Критерий Кол­могороваСмирнова для одной выборки) рис.7 Переместить переменнуюОтметка1 в список TestVariable List (Список тестируемых переменных). О К.

Применить критерий хи-квадрат для одной выборки к переменной ВУЗ. Рассматриваемый в данном разделе критерий x2 для одной выборки несколько отличается от рассмотренного ранее критерия x2 для таблиц сопряженности. В данном случае в качестве ожидаемого (теоретического) распределе­ния обычно выступает равномерное распределение объектов по градациям пере­менной, в отношении которой применяется критерий. Поскольку число объ­ектов (N) в файле exOi.sav равно 100, а переменная вуз имеет 4 градации, ожидае­мые частоты для каждой градации равны 100/4 = 25. Применение рассматриваемого критерия допускает задание не только равномерного ожидаемого распределения, но и любого другого. Например, можно проверить гипотезу о том, что соотношение учащихся, предпочитающих 4 категории специализаций, соотносятся как 20:20:30:30. Для этого в группе Expected Values (Ожидаемые значения) следует установить пере­ключатель Values (Значения), а затем при помощи поля и кнопки Add (Добавление) последовательно ввести в список значения 20, 20, 30, 30. После этих действий ожидаемые частоты изменятся в соответствии с заданными пропорциями.

В меню Analyze (Анализ) выберите команду Nonparametric Tests Chi-Square (Непараметрические критерии Хи-квадрат), чтобы открыть диалоговое окно Chi-Square Test (Критерий хи-квадрат) рис.8 Переместить переменную ВУЗв список Test VariableList (Список тестируемых переменных) ОК.

Сравнить три групп учащихся, отличающих­ся внешкольными увлечениями (переменная хобби) и успеваемостью в 11 классе (переменная отметка2). Для сравнения более двух независимых выборок по уровню выраженности пе­ременной применяется несколько критериев: Н-критерий КраскалаУоллеса (KruskalWallis Я), критерий медианы (median), критерий ДжонкираТерпстра (JonckheereTerpstra). Из них наибольшей чувствительностью к различиям обла­дает Я-критерий КраскалаУоллеса. Этот критерий является пеиараметрическим аналогом одиофакторпого дисперсионного анализа, отличаясь от него в двух от­ношениях. Во-первых, критерий КраскалаУоллеса основан не на сравнении средних значений и дисперсий переменных, а па сравнении средних рангов. go-вторых, вместо вычисления F-критерия на основе сравнения средних рангов с ожидаемыми значениями вычисляется критерий хи-квадрат. Для нормальных распределений однофакториый дисперсионный анализ обеспечивает более точ­ные результаты, чем критерий КраскалаУоллеса, однако применение последнего рекомендуется для распределений, отличающихся от нормального. Н-критерий КраскелаУоллеса «по идее» сходен с [/-критерием МаннаУитии. Как и последний, он оценивает степень пересечения (совпадения) нескольких рядов значений измеренного признака. Чем меньше совпадений, тем больше различаются ряды, соответствующие сравниваемым выборкам. Основная идея Я-критерия КраскелаУоллеса основана на представлении всех значений срав­ниваемых выборок в виде одной общей последовательности упорядоченных (ранжированных) значений с последующим вычислением среднего ранга для каждой из выборок. Если выполняется статистическая гипотеза об отсутствии различий, то можно ожидать, что все средние ранги примерно равны и близки к общему среднему рангу.

В меню Analyze (Анализ) выберите команду Nonparametric Tests К Independent Samples (Непараметрические критерии К независимых выборок), чтобы от­крыть диалоговое окно Test for Several Independent Samples (Критерии для не­скольких независимых выборок рис.9 (флажок KruskalWallis Н (критерий КраскалаУолле­са) установлен но умолчанию) Переместить переменную Отметка 2 в списокTest Variable List (Список тестируемых переменных) Переместить переменную Хобби в полеGrouping Variable Группирующая переменная) В окне Define Range (Определение диапазона) в поле Minimum (Минимум) введите значение 1, в поле Maximum (Максимум) введите значение 3 Continue (Продолжить) вернуть­ся диалоговое окно Test for Several Independent Samples (Критерии для не­скольких независимых выборок) ОК

Сравнить результаты тестов тест1, тест2, тестЗ, тест4 и тест5 для всех учащихся с помощью Критерия Фридмана, это непараметрическим аналогом однофакторного дисперсионного анализа для повторных измерений. Он позволяет проверять гипотезы о различии более двух зависимых выборок (повторных измерений) по уровню выраженности изучаемой переменной. Критерий Фридмана может быть более эффективен, чем его метрический аналог однофакторный дисперси­онный анализ в случаях повторных измерений изучаемого признака па неболь­ших выборках и при отличии распределений от нормального. Критерий Фридмана весьма сходен с критерием Краскала Уоллеса и основан па ранжировании ряда повторных измерений для каждого объекта выборки. За­тем вычисляется сумма рангов для каждого из условий (повторных измерений). Если выполняется статистическая гипотеза об отсутствии различий между по­вторными измерениями, то можно ожидать примерного равенства сумм рангов для этих условий. Чем больше различаются зависимые выборки по изучаемому признаку, тем больше эмпирическое значение вычисляемого значения критерия X2, по которому определяется р-уровень значимости.

В меню Analyze (Анализ) выберите команду Nonparametric Tests К. Related Samples (Непараметрические критерии К зависимых выборок), чтобы открыть диалоговое окно Test for Several Related Samples (Критерий для нескольких за­висимых выборок) рис.10 Переместить переменную Тест1 в список TestVariables (Тестовые переменные). Повторите предыдущее действие для переменных тест2, тестЗ, тест4 и тест5ОК.

Справочный материал: Параметрический критерий это метод статистического вывода, который применяется в отношении парамет­ров генеральной совокупности. Главным параметром для параметриче­ских методов является нормальное распределение переменных и, как следствие, правомерность применения таких статистик, как среднее значение и стандартное отклонение. Непараметрические методы позволяют исследовать данные без каких-либо допущений о характере распределения переменных, в том числе при нарушении требования нормальности распределения. Так как эти методы пред­назначены для номинативных и ранговых переменных, в отношении которых не­допустимо применение арифметических операций, они основаны на различных Дополнительных вычислениях, среди которых можно отметить: ранжирование переменных; подсчет числа значений одного распределения, которые превышают значения другого распределения; применение весовых сравнений; определение степени отклонения распределения от случайного или биноми­ального распределения; проверка нормальности выборочного распределения; сравнения частот; сравнение групп путем вычисления частот значений, лежащих выше или и­же главной медианы. Помимо всего прочего непараметрические критерии позволяют вычислять ста­тистические показатели для одной выборки и сравнивать две выборки между со­бой.

Ø Сравнение двух независимых выборок (критерий МаннаУитни) позволяет установить различия между двумя независимыми выборками по уровню вы­раженности порядковой переменной.

Ø Сравнение двух зависимых выборок может проводиться по двум критериям. Критерий знаков основан па подсчете числа отрицательных и положительных разностей между повторными измерениями; критерий Вилкоксона в дополне­ние к знакам разностей учитывает их величину.

Ø Критерий серий определяет, является ли последовательность бинарных вели­чии (событий) случайной или упорядоченной.

Ø Биномиальный критерий определяет, отличается ли распределение дихотоми­ческой величины от заданного соотношения.

Ø Критерий Колмогорова-Смирнова для одной выборки определяет отличие рас­пределения переменной от нормального (равномерного, Пуассона и т. д.)

Ø Критерий хи-квадрат для одной выборки определяет степень отличия наблю­даемого распределения частот по градациям переменной от ожидаемого рас­пределения.

Ø Сравнение К независимых выборок (критерий КраскалаУоллеса) позволяет установить степень различия между тремя и более независимыми выборками но уровню выраженности порядковой переменной.

Ø Сравнение К зависимых выборок (критерий Фридмана) позволяет установить степень различия между тремя и более зависимыми выборками но уровню выраженности порядковой переменной.