В том случае, если число элементов совокупности , то при расчете стандартных ошибок среднего и доли в знаменателе дроби вместо необходимо ставить
Для нормального распределения (распределение выборочных средних является нормальным) известно, какая часть совокупности попадает в любой интервал вокруг среднего значения. В частности:
· 68,3% всех выборочных средних попадают в интервал
· 95,5% - в интервал
· 99,7% -в интервал
На практике проблема заключается в том, что характеристики генеральной совокупности нам неизвестны, а выборка делается именно с целью их оценки. Это означает, что если мы будем делать выборки одного и того же объема n из генеральной совокупности, то в 68,3% случаев на интервале будет находиться значение M (оно же в 95,5% случаев будет находиться на интервале и в 99,7% случаев – на интервале).
Поскольку реально делается только одна выборка, то формулируется это утверждение в терминах вероятности: с вероятностью 68,3% среднее значение признака в генеральной совокупности заключено в интервале, с вероятностью 95,5%- в интервале и т.д.
На практике вокруг выборочного значения строится такой интервал, который бы с заданной (достаточно высокой) вероятностью – доверительной вероятностью –«накрывал» бы истинное значение этого параметра в генеральной совокупности. Этот интервал называется доверительным интервалом.
Доверительная вероятность P –это степень уверенности в том, что доверительный интервал действительно будет содержать истинное (неизвестное) значение параметра в генеральной совокупности.
Например, если доверительная вероятность Р равна 90%, то это означает, что 90 выборок из 100 дадут правильную оценку параметра в генеральной совокупности. Соответственно, вероятность ошибки, т.е. неверной оценки генерального среднего по выборке, равна в процентах: . Для данного примера это значит, что 10 выборок из 100 дадут неверную оценку.
Очевидно, что степень уверенности (доверительная вероятность) зависит от величины интервала: чем шире интервал, тем выше уверенность, что в него попадет неизвестное значение для генеральной совокупности. На практике для построения доверительного интервала берется, как минимум, удвоенная ошибка выборки, чтобы обеспечить уверенность не менее 95,5%.
Определение доверительных границ средних и относительных величин позволяет найти два их крайних значения – минимально возможное и максимально возможное, в пределах которых изучаемый показатель может встречаться во всей генеральной совокупности. Исходя из этого, доверительные границы (или доверительный интервал) - это границы средних или относительных величин, выход за пределы которых вследствие случайных колебаний имеет незначительную вероятность.
Доверительный интервал может быть переписан в виде: , где t– доверительный критерий.
Доверительные границы средней арифметической величины в генеральной совокупности определяют по формуле:
Мген = Мвыб+ t mM
для относительной величины:
Рген = Рвыб+tmР
где Мген и Рген - значения средней и относительной величины для генеральной совокупности; Мвыб и Рвыб - значения средней и относительной величины, полученные на выборочной совокупности; mM и mP - ошибки средней и относительной величин; t - доверительный критерий (критерий точности, который устанавливается при планировании исследования и может быть равен 2 или 3); t m - это доверительный интервал или Δ – предельная ошибка показателя, полученного при выборочном исследовании.
Следует отметить, что величина критерия t в определенной мере связана с вероятностью безошибочного прогноза (р), выраженной в %. Ее избирает сам исследователь, руководствуясь необходимостью получить результат с нужной степенью точности. Так, для вероятности безошибочного прогноза 95,5% величина критерия t составляет 2, для 99,7% - 3.
Приведенные оценки доверительного интервала приемлемы лишь для статистических совокупностей с количеством наблюдений более 30. При меньшем объеме совокупности (малых выборках) для определения критерия t пользуются специальными таблицами. В данных таблицах искомое значение находится на пересечении строки, соответствующей численности совокупности (n-1), и столбца, соответствующего уровню вероятности безошибочного прогноза (95,5%; 99,7%), выбранному исследователем. В медицинских исследованиях при установлении доверительных границ любого показателя принята вероятность безошибочного прогноза 95,5% и более. Это означает, что величина показателя, полученная на выборочной совокупности должна встречаться в генеральной совокупности как минимум в 95,5% случаев.
1. Вопросы по теме занятия:
1. Актуальность показателей разнообразия признака в статистической совокупности.
2. Общая характеристика абсолютных показателей вариации.
3. Среднее квадратическое отклонение, расчет, применение.
4. Относительные показатели вариации.
5. Медиана, квартильная оценка.
6. Оценка статистической значимости результатов исследования.
7. Стандартная ошибка средней арифметической, формула расчета, пример использования.
8. Расчет доли и ее стандартной ошибки.
9. Понятие доверительной вероятности, пример использования.
10. Понятие доверительного интервала, его применение.
2. Тестовые задания по теме с эталонами ответов:
1. К АБСОЛЮТНЫМ ПОКАЗАТЕЛЯМ ВАРИАЦИИ ОТНОСИТСЯ
1) коэффициент вариации
2) коэффициент осцилляции
3) лимит
4) медиана
2. К ОТНОСИТЕЛЬНЫМ ПОКАЗАТЕЛЯМ ВАРИАЦИИ ОТНОСИТСЯ
1) дисперсия
2) лимит
3) среднее квадратичное отклонение
4) коэффициент вариации
3. КРИТЕРИЙ, КОТОРЫЙ ОПРЕДЕЛЯЕТСЯ КРАЙНИМИ ЗНАЧЕНИЯМИ ВАРИАНТ В ВАРИАЦИОННОМ РЯДУ
1) лимит
2) амплитуда
3) дисперсия
4) коэффициент вариации
4. РАЗНОСТЬ КРАЙНИХ ВАРИАНТ – ЭТО
1) лимит
2) амплитуда
3) среднее квадратичное отклонение
4) коэффициент вариации
5. СРЕДНИЙ КВАДРАТ ОТКЛОНЕНИЙ ИНДИВИДУАЛЬНЫХ ЗНАЧЕНИЙ ПРИЗНАКА ОТ ЕГО СРЕДНЕЙ ВЕЛИЧИНЫ – ЭТО
1) коэффициент осцилляции
2) медиана
3) дисперсия
4) мода
6. ОТНОШЕНИЕ РАЗМАХА ВАРИАЦИИ К СРЕДНЕЙ ВЕЛИЧИНЕ ПРИЗНАКА – ЭТО
1) коэффициент вариации
2) среднее квадратичное отклонение
3) лимит
4) коэффициент осцилляции
7. ОТНОШЕНИЕ СРЕДНЕГО КВАДРАТИЧНОГО ОТКЛОНЕНИЯ К СРЕДНЕЙ ВЕЛИЧИНЕ ПРИЗНАКА – ЭТО
1) дисперсия
2) коэффициент вариации
3) коэффициент осцилляции
4) амплитуда
8. ВАРИАНТА, КОТОРАЯ НАХОДИТСЯ В СЕРЕДИНЕ ВАРИАЦИОННОГО РЯДА И ДЕЛИТ ЕГО НА ДВЕ РАВНЫЕ ЧАСТИ – ЭТО
1) медиана
2) мода
3) амплитуда
4) лимит
9. В МЕДИЦИНСКИХ ИССЛЕДОВАНИЯХ ПРИ УСТАНОВЛЕНИИ ДОВЕРИТЕЛЬНЫХ ГРАНИЦ ЛЮБОГО ПОКАЗАТЕЛЯ ПРИНЯТА ВЕРОЯТНОСТЬ БЕЗОШИБОЧНОГО ПРОГНОЗА
1) 80%
2) 68%
3) 95%
4) 50%
10. ЕСЛИ 90 ВЫБОРОК ИЗ 100 ДАЮТ ПРАВИЛЬНУЮ ОЦЕНКУ ПАРАМЕТРА В ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ, ТО ЭТО ОЗНАЧАЕТ, ЧТО ДОВЕРИТЕЛЬНАЯ ВЕРОЯТНОСТЬ P РАВНА
1) 10%
2) 90%
3) 68%
4) 50%
11. В СЛУЧАЕ, ЕСЛИ 10 ВЫБОРОК ИЗ 100 ДАЮТ НЕВЕРНУЮ ОЦЕНКУ, ВЕРОЯТНОСТЬ ОШИБКИ РАВНА
1) 90%
2) 50%
3) 20%
4) 10%
12. ГРАНИЦЫ СРЕДНИХ ИЛИ ОТНОСИТЕЛЬНЫХ ВЕЛИЧИН, ВЫХОД ЗА ПРЕДЕЛЫ КОТОРЫХ ВСЛЕДСТВИЕ СЛУЧАЙНЫХ КОЛЕБАНИЙ ИМЕЕТ НЕЗНАЧИТЕЛЬНУЮ ВЕРОЯТНОСТЬ – ЭТО
1) доверительный интервал
2) амплитуда
3) лимит
4) коэффициент вариации
13. МАЛОЙ ВЫБОРКОЙ СЧИТАЕТСЯ ТА СОВОКУПНОСТЬ, В КОТОРОЙ
1) n меньше или равно 100
2) n меньше или равно 30
3) n меньше или равно 40
4) n близко к 0
14. ДЛЯ ВЕРОЯТНОСТИ БЕЗОШИБОЧНОГО ПРОГНОЗА 95% ВЕЛИЧИНА КРИТЕРИЯ t СОСТАВЛЯЕТ
1) 3
2) 2
3) 1
4) 10
15. ДЛЯ ВЕРОЯТНОСТИ БЕЗОШИБОЧНОГО ПРОГНОЗА 99% ВЕЛИЧИНА КРИТЕРИЯ tСОСТАВЛЯЕТ
1) 3
2) 2
3) 1
4) 5
16. ДЛЯ РАСПРЕДЕЛЕНИЙ, БЛИЗКИХ К НОРМАЛЬНОМУ, СОВОКУПНОСТЬ СЧИТАЕТСЯ ОДНОРОДНОЙ, ЕСЛИ КОЭФФИЦИЕНТ ВАРИАЦИИ НЕ ПРЕВЫШАЕТ
1) 50%
2) 10%
3) 33%
4) 90%
17. ВАРИАНТА, ОТДЕЛЯЮЩАЯ ВАРИАНТЫ, ЧИСЛОВЫЕ ЗНАЧЕНИЯ КОТОРЫХ НЕ ПРЕВЫШАЮТ 25% МАКСИМАЛЬНО ВОЗМОЖНОГО В ДАННОМ РЯДУ – ЭТО
1) мода
2) нижний квартиль
3) верхний квартиль
4) квартиль
18. ДАННЫЕ, КОТОРЫЕ НЕ ИСКАЖАЮТ И ПРАВИЛЬНО ОТРАЖАЮТ ОБЪЕКТИВНУЮ РЕАЛЬНОСТЬ, НАЗЫВАЮТСЯ
1) невозможные
2) равновозможные
3) достоверные
4) случайные
19. СОГЛАСНО ПРАВИЛУ "ТРЕХ СИГМ", ПРИ НОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ ПРИЗНАКА В ПРЕДЕЛАХ БУДЕТ НАХОДИТЬСЯ
1) 68,3% вариант
2) 95,5% вариант
3) 99,7% вариант
4) 50,0% вариант
20. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ, СООТВЕТСТВУЮЩИЙ СТЕПЕНИ ВЕРОЯТНОСТИ (n>30), СОСТАВЛЯЕТ
1) 67%
2) 68,3%
3) 95,5%
4) 99,7%
21. КОЭФФИЦИЕНТ ВАРИАЦИИ ПРИМЕНЯЕТСЯ
1) для характеристики нормальности распределения
2) для характеристики однородности совокупности
3) для определения среднеквадратического отклонения
4) для определения необходимого объема выборки
22. ВАРИАНТА, ОТДЕЛЯЮЩАЯ ВАРИАНТЫ ВЕЛИЧИНОЙ ДО 75% ОТ МАКСИМАЛЬНО ВОЗМОЖНЫХ ЗНАЧЕНИЙ – ЭТО
1) нижний квартиль
2) мода
3) верхний квартиль
4) квартиль
23. ВАРИАНТА, ОТДЕЛЯЮЩАЯ ВАРИАНТЫ С ЧИСЛОВЫМ ЗНАЧЕНИЕМ ДО 50% ОТ МАКСИМАЛЬНО ВОЗМОЖНОГО – ЭТО
1) квартиль
2) нижний квартиль
3) мода
4) верхний квартиль
24 КОЭФФИЦИЕНТ ВАРИАЦИИ ВЫРАЖАЕТСЯ
1) в сантиметрах
2) в числе пациентов
3) в числе вариаций
4) в процентах
25. В СЛУЧАЕ СИММЕТРИЧНОСТИ РАСПРЕДЕЛЕНИЯ ОТНОСИТЕЛЬНО СРЕДНЕГО АРИФМЕТИЧЕСКОГО ДЛЯ ЕГО ХАРАКТЕРИСТИКИ ИСПОЛЬЗУЮТСЯ
1) медиана и процентили
2) лимит и среднеквадратичное отклонение
3) среднее арифметическое и среднеквадратичное отклонение
4) среднее арифметическое и процентили
26. В СЛУЧАЕ АСИММЕТРИЧНОСТИ РАСПРЕДЕЛЕНИЯ ОТНОСИТЕЛЬНО СРЕДНЕГО АРИФМЕТИЧЕСКОГО ДЛЯ ЕГО ХАРАКТЕРИСТИКИ ИСПОЛЬЗУЮТСЯ
1) медиана и процентили
2) медиана и среднеквадратичное отклонение
3) среднее арифметическое и среднеквадратичное отклонение
4) среднее арифметическое и процентили
27. ПРИ ЗНАЧЕНИИ КОЭФФИЦИЕНТА ВАРИАЦИИ 15% СТЕПЕНЬ РАЗНООБРАЗИЯ ПРИЗНАКА ОЦЕНИВАЕТСЯ КАК
1) слабая
2) средняя
3) сильная
4) равномерная
28. ГРАНИЦЫ СРЕДНИХ ИЛИ ОТНОСИТЕЛЬНЫХ ВЕЛИЧИН, ВЫХОД ЗА ПРЕДЕЛЫ КОТОРЫХ ВСЛЕДСТВИЕ СЛУЧАЙНЫХ КОЛЕБАНИЙ ИМЕЕТ НЕЗНАЧИТЕЛЬНУЮ ВЕРОЯТНОСТЬ – ЭТО
1) доверительный интервал
2) доверительный критерий
3) стандартная ошибка
4) среднее квадратическое отклонение
29. ДЛЯ РАСЧЕТА КОЭФФИЦИЕНТА ВАРИАЦИИ НЕОБХОДИМА СЛЕДУЮЩАЯ ВЕЛИЧИНА
1) стандартная ошибка
2) медиана
3) среднее квадратическое отклонение
4) доверительный интервал
30. НЕДОСТАТКОМ ЛИМИТА И АМПЛИТУДЫ КАК КРИТЕРИЕВ ВАРИАБЕЛЬНОСТИ ЯВЛЯЕТСЯ
1) необходимость нормального распределения для их расчета
2) зависимость от крайних значений переменных
3) зависимость от числа наблюдений
4) зависимость от средних значений переменных
Эталоны ответов на тестовые задания:
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ |
Занятие №5
Тема: «Методы сравнительной статистики»
Наиболее часто встречающейся и достаточно сложной математико-статистической задачей является сравнение данных, полученных в процессе наблюденийилиэкспериментов, в выборочных совокупностях. Исследователь старается описать результаты наблюдения количественными методами и «на выходе» получает числовой массив тех или иных доступных ему измерений – вариационный ряд. Однако, как правило, содержащаяся в результатах измерений содержательная информация, имеет гораздо большую ценность при сравнении ее с аналогичной информацией, но полученной некоторым иным образом. Например, это может быть ситуация сравнения опытных данных (когда мы как-то повлияли на изучаемый объект или явление) с контрольной группой, в которой никакого воздействия на объект наблюдения не было. Возможно и сравнение двух вариантов опытов. Возможно сравнение двух серий наблюдений, разделенных в пространстве и времени и т.п.
Допустим, что удается заметить какие-либо численные различия в характеристиках сравниваемых рядов. Первым делом возникает вопрос: какова вероятность, что эти различия неслучайны и будут систематически повторяться в дальнейшем при воспроизведении условий эксперимента или наблюдения, т.е. выявленные различия являются статистически значимыми.
Выбор подходящего метода сравнения выборочных совокупностей определяется несколькими факторами: характером сравниваемых признаков (качественные или количественные), числом сопоставляемых групп, зависимостью или независимостью выборок, а также видом распределения признака.
Выборки являются независимыми, если набор объектов исследования в каждую из групп осуществлялся независимо от того, какие объекты исследования включены в другую группу. Так, в частности, происходит при рандомизации, когда распределение объектов происходит случайным образом. Примером сравнения независимых выборок может служить сопоставление данных анализа крови в группе пациентов с аналогичными показателями в группе здоровых.
Группы являются зависимыми (связанными)в динамических исследованиях, когда изучаются одни и те же объекты в разные моменты времени. Например, показатели анализа крови у одних и тех же пациентов до и после лечения.
От вида распределения и типа исследуемого признака зависит выбор подходящего математико-статистического критерия. Критерии делятся на два типа – параметрическиеи непараметрические.
Параметрические критерии – критерии, основанные на оценке параметров распределения, к которым относятся среднее арифметическое, среднеквадратическое отклонение, дисперсия.Они применимы только в том случае, если численные данные подчиняются нормальному распределению. Если распределение отличается от нормального, то следует пользоваться так называемыми непараметрическими критериями.
Непараметрические критерии не основаны на оценке параметров распределения и вообще не требуют, чтобы данные подчинялись какому-то определенному типу распределения. Непараметрические критерии дают более грубые оценки, чем параметрические, но являются более универсальными. А параметрические методы более точны, но лишь в случае, если правильно определено распределение совокупности.
Перед тем как перейти к рассмотрению статистических критериев, введем понятия нулевойи альтернативной гипотез, которые нам потребуются в дальнейшем.
На каждом шаге процесса анализа данных выдвигаются две гипотезы.Первая обозначается и называется нулевой гипотезой. Вторая гипотеза обозначается и носит название альтернативной,т.е. противоположной по смыслу. Под «нулевой гипотезой» подразумевается допущение об отсутствии того или иного интересующего исследователя события, явления или эффекта, а под «альтернативной» – о его наличии. Обе гипотезы, как бы они не были сформулированы, обязательно должны иметь взаимоисключающеесодержание.
Нулевая гипотезане может быть отвергнута, если ее вероятность окажется выше некого наперед заданного уровня α, достаточно близкого к 0, т.е. . Эта величина α носит название уровень значимости нулевой гипотезы.
Альтернативная гипотеза может быть принята лишь в том случае, если ее вероятность достигнет некого наперед заданного уровня β или превзойдет его, т.е. . Эта величина β – уровень доверительной вероятности. Онсоответствует «уровням безошибочных прогнозов», т.е. вероятностям 0.95, 0.99 и 0.999 (область практически достоверных событий). Соответственно, α очерчивает область практически невозможных событий с порогами вероятностей 0.05, 0,01 и 0.001.
Поскольку и – альтернативные гипотезы, то их суммарная вероятность равна единице. Следовательно, рост вероятности одной из гипотез автоматически приводит к снижению вероятности другой. Например, если , это означает то, что будет выполняться условие . И в этом случае нулевая гипотеза может быть отвергнута как событие практически невозможное, а альтернативная должна быть принята как событие практически достоверное. Если же , то . И в этой ситуации нулевая гипотеза не может быть отвергнута, а альтернативная не может быть принята.
Например, в процессе исследования ставится задача доказать наличие статистически значимых различий между результатами наблюдений в опытной и контрольной группах.Это значит, что данные, полученные при применении того или иного статистического критерия, должны позволить отвергнуть нулевую гипотезу об отсутствии указанных различий.
Параметрические критерии
Заключение о случайности или неслучайности различий между выборочными совокупностями при использовании параметрических критериев осуществляется на основании сравнения параметров распределений, т.е. сводных числовых характеристик. Каждый из параметров компактно,в виде одного единственного числа, отражает некие характерные свойства распределения данной случайной величины. Они являются количественными мерами этих свойств. На практике, как правило, рассматривают лишь два параметра – среднее значение, являющееся «мерой положения математического центра» полученного вариационного ряда, и дисперсию, но чаще всего корень из нее – стандартное отклонение, являющиеся мерой вариации. Для этих параметров разработаны два наиболее популярных параметрических критерия: критерий Стьюдента и критерий Фишера.
Критерий Стьюдента (t-критерий)– критерий, основанный на сравнении средних значений выборок. Критерий Стьюдента является наиболее известным. С одной стороны, анализ средних значений сравнительно прост для вычислений. С другой стороны, средние величины наиболее наглядны и понятны.
Наиболее часто t-критерий используется в двух вариантах. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочныйt-критерий). В этом случае есть контрольная группа и опытная группа, состоящая из разных пациентов, количество которых в группах может быть различно. Во втором же случае используется так называемый парный t-критерий, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних. Поэтому эти выборки называют зависимыми, связанными. Например, измеряется содержание лейкоцитов у здоровых животных, а затем у тех же самых животных после облучения определенной дозой излучения. В обоих случаях должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп.
Для того, чтобы определить, является ли нормальным исследуемое распределение, используются критерии Шапиро-Уилка и Колмогорова-Смирнова.