Другая интерпретация результата.

 

В педагогических исследованиях, если качественный анализ данных говорит о существенных различиях между группами, допускается считать уровень статистической значимости p ≤ 0,10 достаточным для принятия альтернативной гипотезы. Из таблицы узнаем, что jкр 0,10 = 1,29. Тогда ось значимости будет выглядеть следующим образом:

 
 


1,29 1,56 1,64 2,31 2,81

jэмп jкр 0,05 jкр 0,01 jкр 0,001 j*

 

jкр 0,10 ≤ jэмп < jкр 0,05. Поэтому принимаем Н1 (p ≤ 0,10).

 

Вывод. Доля учащихся, решивших задачу, в первой группе больше, чем во второй (p ≤ 0,10).

 

Уровень статистической значимости можно уточнить, пользуясь соответствующей таблицей. Эмпирическому значению критерия 1,56 соответствует уровень значимости p ≤ 0,06. Поэтому вывод можно сформулировать так:

 

Вывод. Доля учащихся, решивших задачу, в первой группе больше, чем во второй (p ≤ 0,06).

 

Интерпретируя по-разному результат, мы можем принять одно из двух взаимоисключающих высказываний («больше — не больше»). Какой именно вывод сделать, определяет сам студент, исходя из анализа всех результатов исследования.

 

Пример 4. В экспериментальной и контрольной группах проводилось обучение арифметическим действиям с многозначными числами учащихся коррекционных школ VIII вида. В экспериментальной группе — по новой методике, в контрольной — по традиционной. Перед началом обучения было показано, что учащиеся экспериментальной и контрольной группы не отличаются по уровню знаний, необходимых для овладения данной темой. По окончании обучения был проведен контрольный срез, в ходе которого учащимся были предложены задания по изученной теме. Результаты выполнения задания представлены в таблице 7.

 

Таблица 7. Количество ошибок в контрольных заданиях у учащихся экспериментальной (n1 = 50) и контрольной (n2 = 60) группы.

Количество ошибок Экспериментальная группа (n1 = 50) Контрольная группа (n2 = 60)
S

Будем считать, что эффект есть, если контрольные задания выполнены без ошибок.

 

Н0: доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, не превосходит количества таких учащихся в контрольной группе.

Н1: доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, превосходит количество таких учащихся в контрольной группе.

 

Составим четырехпольную таблицу.

Таблица 8. Процентные доли испытуемых, выполнивших контрольные задания без ошибок и с ошибками.

  «Есть эффект» «Нет эффекта» S
Эксп. группа (n1 = 50) 10 (20%) 40 (80%)
Контр. группа (n2 = 60) 6 (10%) 54 (90%)
S

 

По таблице величин угла j для разных процентных долей находим:

j1 (20%) = 0,927

j2 (10%) = 0,644

Вычислим эмпирическое значение критерия:

    Ö  
jэмп = (0,927 – 0,644) ∙ 50 ∙ 60 = 0,283 ∙ 5,222 = 1,48
50 + 60
       

На «оси значимости» получаем:

 
 


1,48 1,64 2,31 2,81

jэмп jкр 0,05 jкр 0,01 jкр 0,001 j*

 

В соответствии с правилом отклонения Н0 и принятия Н1, если jэмп < jкр 0,05, то принимаем Н0.

 

Вывод. Доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, не превосходит количества таких учащихся в контрольной группе.

 

Точно так же, как в предыдущем примере этот результат можно интерпретировать по-другому, если позволяет качественный анализ экспериментальных данных:

 
 


1,29 1,48 1,64 2,31 2,81

jкр 0,10 jэмп jкр 0,05 jкр 0,01 jкр 0,001 j*

 

jкр 0,10 ≤ jэмп < jкр 0,05. Поэтому принимаем Н1 (p ≤ 0,10).

 

Вывод. Доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, превосходит количества таких учащихся в контрольной группе (p ≤ 0,10).

 

Уточним уровень статистической значимости. Эмпирическому значению критерия 1,48 соответствует уровень значимости p ≤ 0,07. Поэтому вывод можно сформулировать так:

Вывод. Доля учащихся в экспериментальной группе, выполнивших контрольные задания без ошибок, превосходит количества таких учащихся в контрольной группе (p ≤ 0,07).

 

Если внимательно посмотреть на таблицу 7, видно, что результаты выполнения контрольных заданий сильно различаются. В экспериментальной группе большое количество учащихся выполнило работу без ошибок или с малым количеством ошибок (одной-двумя). В контрольной группе по сравнению с экспериментальной, наоборот, большое количество испытуемых выполнило задания со значительным числом ошибок (от четырех до семи). В коррекционной школе VIII вида основным показателем успешности обучения служит не абсолютное усвоение программного материала, а положительная динамика в усвоении знаний, умений и навыков учащимися. Если исследователь показал, что испытуемые в ходе обучения стали допускать меньше ошибок, то выполнение контрольных заданий с малым количеством ошибок мы тоже можем считать достаточным эффектом. Будем полагать, что эффект есть, если работа выполнена не более, чем с двумя ошибками. Тогда гипотезы можно сформулировать следующим образом:

 

Н0: доля учащихся в экспериментальной группе, выполнивших контрольные задания не более чем с двумя ошибками, не превосходит количества таких учащихся в контрольной группе.

Н1: доля учащихся в экспериментальной группе, выполнивших контрольные задания не более чем с двумя ошибками, превосходит количество таких учащихся в контрольной группе.

 

Таблица 9.

Расчет критерия j* при сопоставлении экспериментальной и контрольной групп по количеству учащихся, допустивших не более двух ошибок в контрольных заданиях.

  «Есть эффект» «Нет эффекта» S
Эксп. группа (n1 = 50) 37 (74%) 13 (26%)
Контр. группа (n2 = 60) 27 (45%) 33 (55%)
S

 

По таблице величин угла j для разных процентных долей находим:

j1 (74%) = 2,071

j2 (45%) = 1,471

    Ö  
jэмп = (2,071 – 1,471) ∙ 50 ∙ 60 = 0,600 ∙ 5,222 = 3,13
50 + 60
       

Мы получили очень высокий результат:

 
 


1,64 2,31 2,81 3,13

j*

jкр 0,05 jкр 0,01 jкр 0,001 jэмп

В соответствии с правилом отклонения Н0 и принятия Н1, если jэмп ≥ jкр 0,001, то принимаем Н1 (p ≤ 0,001).

Вывод. Доля учащихся в экспериментальной группе, выполнивших контрольные задания не более чем с двумя ошибками, превосходит количество таких учащихся в контрольной группе (p ≤ 0,001).

Можно также сравнить экспериментальную и контрольную группы по доле учащихся, выполнивших задания с большим количеством ошибок (от четырех до семи). Мы получим еще более существенные различия.

Критерий j* удобен скоростью расчетов и возможностью формулировать наличие эффекта по-разному.

 

Метод ранговой корреляции

 

Пример 5. Студент исследовал состояние звукопроизношения у детей среднего дошкольного возраста со стертой дизартрией. Проверялся объем нарушенных звуков и объем дефекта звукоразличения, т.е. подсчитывалось количество дефектно произносимых звуков и количество смешиваемых звуков. Результаты выполнения заданий представлены в таблице 10. Существует ли корреляция между объемом нарушения звукопроизношения и объемом дефекта звукоразличения?

 

Таблица 10.Показатели количества дефектно произносимых и смешиваемых звуков у детей среднего дошкольного возраста со стертой дизартрией (n = 10).

 

n Испытуемый Кол-во дефектно произносимых звуков Кол-во смешиваемых звуков
А
Б
В
Г
Д
Е
Ж
З
И
К

 

Н0: корреляция между количеством дефектно произносимых звуков и количеством смешиваемых звуков не отличается от нуля.

Н1: корреляция между количеством дефектно произносимых звуков и количеством смешиваемых звуков статистически значимо отличается от нуля.

 

В таблице 11 проранжированы оба показателя, посчитаны разности (d) между рангами, эти разности возведены в квадрат (d2) и вычислена сумма квадратов разностей рангов (Σ d2).

Таблица 11. Расчет d2 для рангового коэффициента корреляции Спирмена rs при сопоставлении показателей количества дефектно произносимых и смешиваемых звуков у детей среднего дошкольного возраста со стертой дизартрией (n = 10).

    n Переменная А: кол-во дефектно произносимых звуков Переменная В: кол-во смешиваемых звуков     d = RA – RB     d2
Инд. значение RA Инд. значение RB
6,5 – 2,5 6,25
6,5 – 3,5 12,25
6,5 1,5 2,25
– 3
6,5 2,5 6,25
Σ    

 

 

Найдем коэффициент ранговой корреляции Спирмена rs по формуле:

rs = 1 – 6 S d2
n (n 2 — 1)

 

Для нашего примера:

rs эмп = 1 – 6 S d2 = 1 – 6 ∙ 45 = 1 – 0,27 = 0,73
n (n 2 — 1) 10 ∙ (102 — 1)

 

Табличные критические значения следующие:

  0,64 (p ≤ 0,05)
rs кр =  
  0,79 (p ≤ 0,01)

 

Отметим на «оси значимости» эмпирическое и критические значения:

 
 


0,64 0,73 0,79 rs

rs кр 0,05 rs эмп rs кр 0,01

rs кр 0,05rs эмп < rs кр 0,01. Поэтому принимаем Н1 (p ≤ 0,05).

Вывод. Корреляция между количеством дефектно произносимых звуков и количеством смешиваемых звуков статистически значимо отличается от нуля: rs = 0,73 (p ≤ 0,05).

Вероятно, при большем количестве испытуемых в подобном эксперименте можно получить больший коэффициент корреляции.

 

Схема математической обработки данных эксперимента

На схеме показано, какие исследовательские задачи можно решать и с помощью каких критериев. Для подтверждения эффективности экспериментальной методики достаточно доказать, что на момент начала исследования экспериментальная и контрольная группа не различались по рассматриваемым параметрам, а на момент окончания имелись статистически значимые различия. Доказательство будет более убедительным, если подтвердить наличие положительных сдвигов в экспериментальной группе. И, наконец, если при этом в контрольной группе сдвигов не произошло, то доказана очень высокая эффективность предлагаемой методики.

Для установления связей между различными признаками используем метод ранговой корреляции (на схеме не указан).

 

               
  Экспериментальная группа   Контрольная группа  
  Уровень исследуемого признака в контрольном эксперименте Установить различия (критерии Q, U, j*)    
  Установить изменения (критерии G, T, j*)     Уровень исследуемого признака в контрольном эксперименте  
        Установить, имеются изменения или нет (критерии G, T, j*)  
  Уровень исследуемого признака в констатирующем эксперименте Установить отсутствие различий (критерии Q, U, j*) Уровень исследуемого признака в констатирующем эксперименте  
               

 

Последовательность действий исследователя.

1. Сформулировать задачу исследования в соответствии с целью исследования.

2. Сформулировать содержательную гипотезу.

3. Подобрать выборки испытуемых.

4. Выбрать шкалу измерения.

5. Измерить значения признака.

6. Выбрать статистические критерии в соответствии с задачей исследования и шкалой измерения.

7. Проверить соответствие исследовательской задачи ограничениям использования критерия.

8. Сформулировать статистические гипотезы (в отдельных случаях они формулируются в ходе расчета критерия).

9. Применить статистические критерии, тщательно проверяя правильность вычислений.

10. Если критерий не подтверждает содержательную гипотезу, то:

· применить более мощный критерий;

· увеличить количество испытуемых;

· пересмотреть гипотезу;

· пересмотреть организацию исследования.

 

Список литературы

 

1. Ермолаев О.Ю. Математическая статистика для психологов. — 4-е изд., испр. — М., 2006.

2. Плохинский И.А. Алгоритмы биометрии / Под ред. и с предисловием Б.В.Гнеденко. — 2-е изд., перераб. и доп. — М., 1980.

3. Практикум по экспериментальной и прикладной психологии / Под ред. А.А.Крылова. — 2-е изд. — СПб, 1997.

4. Практикум по общей, экспериментальной и прикладной психологии / Под общ. ред. А.А.Крылова, С.А.Маничева. — 2-е изд. — СПб, 2000.

5. Практикум по общей психологии / Под ред. А.И.Щербакова. — 2-е изд. — М., 1990.

6. Сидоренко Е.В. Методы математической обработки в психологии. — СПб, 2006.

7. Суходольский Г.В. Основы математической статистики для психологов. — СПб, 1998.

8. Тарасов С.Г. Основы применения математических методов в психологии. — СПб, 1999.