Пример прогнозирования значения одного признака по известному значению другого с помощью уравнения регрессии.

Условие задачи: на основе данных, характеризующих уровень запыленности рабочих мест (см. раздел VIII), необходимо выполнить прогноз уровня пыли при температуре воздуха 23С0.

Задание: построить уравнение регрессии для зависимости между температурой окружающей среды и уровнем запыленности помещения, создать регрессионную функцию и вычислить значение уровня пыли при температуре воздуха 23Со. Определить сигму регрессии и доверительный интервал для прогнозируемого значения уровня пыли.

 

Решение: запустите программу Excel, откройте файл в папке своей учебной группы под именем «Статистика–Фамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Регрессия». На этом листе введите данные и решение задачи, как показано ниже, сохраните изменения и покажите результат работы преподавателю.

 

а) первоначально требуется выполнить вычисление коэффициента корреляции Пирсона с помощью таблицы отклонений (таблица 41) или функцией =КОРРЕЛ(Диапазон1;Диапазон2).

Таблица 41

Вычисление коэффициента корреляции Пирсона

Варианта Температура воздуха (x) Запыленность мг/м3 (y) dx=x-Mx dy=y-My dx*dy dx2 dy2
0,07 2,2 0,153 0,330 4,7 0,0233
0,08 2,2 0,143 0,309 4,7 0,0203
0,08 2,2 0,143 0,309 4,7 0,0203
0,2 1,2 0,023 0,026 1,4 0,0005
0,24 0,2 -0,018 -0,003 0,0 0,0003
0,25 0,2 -0,028 -0,005 0,0 0,0008
0,26 0,2 -0,038 -0,006 0,0 0,0014
0,27 0,2 -0,048 -0,008 0,0 0,0023
0,3 -0,8 -0,078 0,065 0,7 0,0060
0,28 -0,8 -0,058 0,048 0,7 0,0033
0,31 -2,8 -0,088 0,248 8,0 0,0077
0,33 -3,8 -0,108 0,412 14,7 0,0116
Средняя (М) = 21,2 0,223 Сумма (S) = 1,725 39,7 0,0976
n=            
                 

 

=КОРРЕЛ(x1:xn ; y1:yn) =0,88 .

б) вычисление коэффициента регрессии(Ry/x):

Сигма σx = КОРЕНЬ(39,7/12) =СТАНДОТКЛОН(x1:xn) = 1,90
    σy = КОРЕНЬ(0,0976/12) =СТАНДОТКЛОН(y1:yn) = 0,09
Ry/x= 0,88*1,9/0,09   = 0,04
           

 

в) вычисление величины зависимого признака (y) при температуре 23С0:

y = My+Ry/x(x-Mx) При x = 23С0  
y = 0,223+0,04(23-21,2) =ПРЕДСКАЗ(x ; y1:yn ; x1:xn) = 0,30 мг/м3
             

г) вычисление доверительных границ колебаний зависимого признака в генеральной совокупности:

σRy/x= 1,9*КОРЕНЬ(1-0,882) = 0,045 .      
Доверительные границы (2σ): от 0,21 до 0,39 При p<0/05      
                 
Вывод: при температуре воздуха 23Со запыленность составит от 0,21 до 0,39мг/м3.
                     

ЗАДАНИЯ

Запустите программу Excel, откройте требуемый файл в папке своей учебной группы под именем «Статистика–Фамилии студентов». На листе «Регрессия», решите требуемый вариант заданий, сохраните изменения и покажите результат работы преподавателю.

Вариант 1

Выполнены измерения признаков, характеризующих температуру в помещении на рабочих местах работников предприятия и концентрацию вредных веществ (см. вариант 1 заданий раздела IX). Постройте уравнение регрессии для зависимости между температурой окружающей среды и концентрацией вещества в помещении. Определите значение уровня пыли при температуре воздуха 23 Со, вычислите сигму регрессии и доверительный интервал для полученного значения уровня пыли.

 

Вариант 2

Выполнены измерения показателей физического развития школьников, характеризующих их рост стоя и объем грудной клетки (см. вариант 2 заданий раздела IX). Постройте уравнение регрессии для зависимости между ростом и объем грудной клетки. Определите значение объема грудной клетки при росте 175 см. Вычислите сигму регрессии и доверительный интервал для полученного значения роста.

 

Вариант 3

Выполнены измерения показателей деятельности сердечно-сосудистой системы и тренированности спортсменов, среди них частота пульса и систолический объем сердечного выброса (см. вариант 3 заданий раздела IX). Постройте уравнение регрессии для зависимости между пульсом спортсменов и систолическим объемом. Определите значение объема сердечного выброса при пульсе 75 уд/мин. Вычислите сигму регрессии и доверительный интервал для полученного значения пульса.

 

Вариант 4

В городе Н. было проведено изучение зависимости заболеваемости инфарктом миокарда по месяцам года в зависимости от среднемесячной температуры воздуха (см. вариант 4 заданий раздела IX). Постройте уравнение регрессии для зависимости между среднемесячной температуры воздуха и уровнем заболеваемости инфарктом миокарда. Определите значение уровня заболеваемости инфарктом миокарда при температуре воздуха +10 С0. Вычислите сигму регрессии и доверительный интервал для полученного значения показателя заболеваемости.

 


Контрольные вопросы

 

1. Определение статистики.

2. Определение санитарной статистики.

3. Какие этапы статистического исследования Вы знаете?

4. Что входит в 1 этап статистического исследования?

5. Что входит во 2 этап статистического исследования?

6. Что входит в 3 этап статистического исследования?

7. Что входит в 4 этап статистического исследования?

8. Что такое единица наблюдения?

9. Определение понятия "объект наблюдения".

10. Какие виды статистического наблюдения Вы знаете?

11. Понятие о генеральной и выборочной совокупностях.

12. Что такое группировка (определение)?

13. Что такое типологическая группировка?

14. Что такое вариационная группировка?

15. Таблица (определение понятия).

16. Из каких элементов состоят статистические таблицы?

17. Какие типы статистических таблиц вы знаете?

18. Перечислите правила создания макетов статистических таблиц.

19. Для чего применяются относительные величины?

20. Какие относительные величины используются наиболее часто?

21. Как вычислить экстенсивный показатель?

22. Как вычислить интенсивный показатель?

23. Как вычислить показатель соотношения?

24. Дайте определение динамического ряда.

25. Назовите основные показатели динамического ряда.

26. Для чего применяют графические изображения?

27. Какие величины используют для построения графических изображений?

28. Какие показатели можно изобразить внутристолбиковой диаграммой?

29. Какие показатели можно изобразить секторной диаграммой?

30. Какие показатели можно изобразить столбиковой диаграммой?

31. Какие показатели можно изобразить линейной диаграммой?

32. С какой целью используются в медицинских исследованиях средние величины и их параметры?

33. Дайте определение средней величины.

34. Какие требования предъявляются при работе со средними величинами?

35. Дайте определение вариационного ряда

36. Какие типы количественных вариаций различают?

37. Какие учетные признаки можно использовать для построения вариационного ряда и расчета средней арифметической?

38. Назовите основные элементы вариационного ряда

39. Как вычисляется средняя арифметическая простая?

40. Как вычисляется средняя арифметическая взвешенная?

41. Назовите основные свойства средней арифметической величины.

42. Что такое среднее квадратическое отклонение и его значение?

43. Как вычисляется среднее квадратическое отклонение?

44. Понятие достоверности полученных данных (ошибка репрезентативности).

45. Чем определяется величина ошибки репрезентативности?

46. Какова формула ошибки репрезентативности (m) для относительных показателей?

47. Как определяются доверительные границы средней в генеральной совокупности и с какой целью?

48. Как определяется достоверность различий средних величин, для каких целей?

49. Как определяется достоверность различий относительных показателей?

50. Применение критерия соответствия (Хи-квадрат).

51. Принцип расчета критерия Хи-квадрат. Понятие о нулевой гипотезе.

52. Методика расчета ожидаемых чисел.

53. Порядок расчета критерия Хи-квадрат.

54. Для чего выполняется нахождение в таблице или расчет критического уровня критерия соответствия (Хи‑квадрат)?

55. Для чего применяется метод стандартизации?

56. Варианты применения метода стандартизации?

57. В чем суть метода стандартизации?

58. Когда применяют метод стандартизации?

59. Назовите этапы прямого метода стандартизации.

60. Способы выбора (или расчета) стандарта в методе стандартизации.

61. О чем свидетельствуют стандартизованные показатели?

62. Назовите случаи применения стандартизованных показателей в практической деятельности врача.

63. Виды связи между признаками. Примеры связи.

64. Корреляционная зависимость (определение).

65. Функциональная зависимость (определение).

66. Особенности корреляционной связи.

67. Понятие о коэффициенте корреляции.

68. Методика расчета коэффициента линейной корреляции.

69. Методика расчета рангового коэффициента корреляции.

70. Определение достоверности коэффициента корреляции.

71. Градации размера и характер коэффициента корреляции.

72. Определение коэффициента регрессии и методика его расчета.

73. Определение размера признака по величине другого взаимосвязанного с ним признака.

74. Регрессия (определение).

75. Методика расчета уравнения регрессии и сигмы уравнения регрессии.


Тестовые задания

1. Полным определением статистики является …

а) наука об общих методах изучения массовых явлений

б) общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной в конкретных исторических условиях

в) универсальная наука, подвергающая количественному изучению все явления общества и природы

г) наука об особенностях деятельности медицинских учреждений в условиях рыночной экономики и страховой медицины

Решение:статистика - это общественная наука, изучающая количественную сторону массовых общественных явлений в неразрывной связи с их качественной стороной в конкретных исторических условиях.

Правильный ответ:б.

 

2. Предметами изучения медицинской статистики являются:

а) здоровье населения в целом и отдельных возрастно-половых групп;

б) выявление и установление зависимостей между уровнем здоровья и факторами окружающей среды

в) финансовые результаты деятельности медицинских учреждений

г) данные о сети, деятельности, кадрах учреждений здравоохранения

д) оценка статистической достоверности результатов медико-биологических, клинических и экспериментальных исследований

Решение:предметами изучения медицинской статистики являются: здоровье населения в целом и отдельных возрастно-половых групп; выявление и установление зависимостей между уровнем здоровья и факторами окружающей среды; данные о сети, деятельности, кадрах учреждений здравоохранения; оценка статистической достоверности результатов медико-биологических, клинических и экспериментальных исследований.

Правильный ответ:а,б, г, д.

 

3. Объект статистического наблюдения – это …

а) отдельная социальная или биологическая единица наблюдения, подлежащая углубленному изучению и регистрации ее признаков в специальной учетной форме (бланке)

б) место или территория, где осуществляется статистическое исследование

в) статистическая совокупность, состоящая из единиц, о которых должны быть собраны статистические сведения, взятая в определенных границах времени и пространства

г) отдельное ЛПУ, в котором проводится статистическое исследование

Решение:объект статистического наблюдения – это статистическая совокупность, состоящая из единиц, о которых должны быть собраны статистические сведения, взятая в определенных границах времени и пространства.

Правильный ответ:в.

 

 

4. Объектом статистического исследования при изучении детского уличного травматизма является …

а) выборочная часть детского травматизма за определенный период

б) все случаи детского уличного травматизма на определенной территории за определенный период

в) все случаи уличного травматизма на определенной территории за определенный период

г) отдельное ЛПУ, в котором лечились пострадавшие

Решение: объектом статистического исследования при изучении детского уличного травматизма является все случаи детского уличного травматизма на определенной территории за определенный период.

Правильный ответ:б.

 

5. Единица статистического наблюдения – это…

а) составная часть объекта наблюдения, подлежащая изучению и регистрации в соответствии с программой исследования

б) явление, которое подлежит детальному изучению, и все учетные признаки которого могут быть измерены только количественно

в) явление, которое подлежит детальному изучению и его учетные признаки должны носить только качественный, описательный характер

г) место или территория, где осуществляется статистическое исследование

Решение:единица статистического наблюдения – это составная часть объекта наблюдения, подлежащая изучению и регистрации в соответствии с программой исследования.

Правильный ответ:а.

 

6. Статистическое наблюдение может быть:

а) текущим

б) нормированным

в) результативным

г) единовременным.

Решение:статистическое наблюдение может быть единовременным и текущим.

Правильный ответ:а, г.

 

 

7. Методами статистического наблюдения являются:

а) сплошное

б) выборочное

г) нормированное

д) результативное

Решение:методами статистического наблюдения являются: сплошное исследование, при котором изучаются все доступные единицы наблюдения; выборочное - изучается определенная часть единиц наблюдения, наиболее полно характеризующие статистическую совокупность в целом.

Правильный ответ:а, б.

 

 

8. СТАТИСТИЧЕСКАЯ СОВОКУПНОСТЬ – это …

а) группа, состоящая из большого числа относительно однородных элементов (единиц наблюдения), взятых вместе в известных границах времени и пространства

б) явление, которое подлежит детальному изучению, и все учетные признаки которого могут быть измерены только количественно

в) явление, которое подлежит детальному изучению и его учетные признаки должны носить только качественный, описательный характер

г) место или территория, где осуществляется статистическое исследование

Решение:статистическая совокупность - это группа, состоящая из большого числа относительно однородных элементов (единиц наблюдения), взятых вместе в известных границах времени и пространства. Необходимо различать два основных вида статистических совокупностей: генеральная и выборочная.

Правильный ответ:а.

 

9. ГЕНЕРАЛЬНАЯ статистическая СОВОКУПНОСТЬ – это …

а) явление, которое подлежит детальному изучению, и все учетные признаки которого могут быть измерены только количественно

б) явление, которое подлежит детальному изучению и его учетные признаки должны носить только качественный, описательный характер

в) место или территория, где осуществляется статистическое исследование

г) набор всех возможных единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования

Решение:генеральная статистическая совокупность состоит из всех возможных единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования.

Правильный ответ:г.

 

10. ВЫБОРОЧНАЯ статистическая СОВОКУПНОСТЬ – это …

а) явление, которое подлежит детальному изучению, и все учетные признаки которого могут быть измерены только количественно

б) часть генеральной совокупности, отобранная специальным методом и предназначенная для характеристики генеральной совокупности

в) место или территория, где осуществляется статистическое исследование

г) набор всех возможных единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования

Решение:выборочная статистическая совокупность – это часть генеральной совокупности, отобранная специальным методом и предназначенная для характеристики генеральной совокупности.

Правильный ответ:б.

 

11. Учетные признаки - это …

а) совокупность математических критериев, используемых при статистическом исследовании

б) медико-биологические характеристики, регистрируемые у единицы наблюдения в соответствии с целями и задачами исследования

в) относительные величины, сгруппированные по определенным признакам в статистическую таблицу

г) статистические показатели, характеризующие изучаемое явление

Решение:учетные признаки - это медико-биологические характеристики, регистрируемые у единицы наблюдения в соответствии с целями и задачами исследования.

Правильный ответ:б.

 

 

12. В медико-биологических исследованиях используются учетные признаки:

а) сходства

б) различия

в) факторные

г) результативные

д) интервальные

Решение:в медико-биологических исследованиях используются учетные признаки: сходства, различия, факторные, результативные.

Правильный ответ:а, б, в, г.

 

 

13. В медико-биологических исследованиях встречаются следующие типы учетных признаков:

а) непрерывные

б) качественные (описательные или атрибутивные)

в) ранжированные

г) количественные

Решение:в медико-биологических исследованиях встречаются следующие типы учетных признаков: качественные (описательные или атрибутивные) – выражающие словом изучаемое свойство, и количественные – демонстрирующие числом уровень признака.

Правильный ответ:б, г.

 

 

14. Последовательность этапов статистического исследования:

а) статистическое наблюдение

б) разработка программы и составление плана статистического исследования

в) анализ результатов исследования

г) группировка и разработка статистического материала

Решение:последовательность этапов статистического исследования состоит из: 1-й - разработка программы и составление плана статистического исследования; 2-й - статистическое наблюдение; 3-й - группировка и разработка статистического материала; 4-й - анализ результатов исследования.

Правильный ответ:1-б, 2-а, 3-г, 4-в.

 

15. Основными видами работ на первом этапе статистического исследования являются:

а) вычисление статистических показателей;

б) сопоставление статистических данных;

в) графическое изображение показателей;

г) шифровка (кодирование) статистического материала;

д) выявление закономерностей в изучаемых явлениях;

е) обобщение результатов исследования;

ж) группировка статистического материала;

з) составление плана исследования;

и) подготовка программы исследования.

Решение:основными видами работ на первом этапе статистического исследования являются составление плана и подготовка программы исследования.

Правильный ответ:з, и.

 

16. План статистического исследования включает …

а) установление качественных и количественных закономерностей в изучаемых явлениях

б) составление статистических таблиц с результатами сбора материала;

в) вопросы: что и в каком направлении изучать, с обозначением объекта и единиц наблюдения, учетных признаков, методов сбора, разработки и анализа материала

г) вопросы: где, когда, кто и как выполняет исследование

д) вопросы контроля за однородностью статистической совокупности и правила составления статистических таблиц

Решение:план статистического исследования включает вопросы: где, когда, кто и как выполняет исследование.

Правильный ответ:г.

 

17. Программа статистического исследования включает …

а) установление качественных и количественных закономерностей в изучаемых явлениях

б) составление статистических таблиц с результатами сбора материала

в) вопросы: что и в каком направлении изучать, с обозначением объекта и единиц наблюдения, учетных признаков, методов сбора, разработки и анализа материала

г) вопросы: где, когда, кто и как выполняет исследование

д) вопросы контроля за однородностью статистической совокупности и правила составления статистических таблиц

Решение:программа исследования включает вопросы: что и в каком направлении изучать, с обозначением объекта и единиц наблюдения, учетных признаков, методов сбора, разработки и анализа материала.

Правильный ответ:в.

 

 

18. Составление плана и программы статистического исследования производится …

а) на первом этапе

б) на втором этапе

в) на третьем этапе

г) на четвертом этапе

Решение:составление плана и программы производится на первом этапе статистического исследования.

Правильный ответ:а.

 

 

19. Основным видом работ на втором этапе статистического исследования является …

а) вычисление статистических показателей;

б) сбор материала по программе исследования;

в) графическое изображение показателей;

г) шифровка (кодирование) статистического материала;

д) выявление закономерностей в изучаемых явлениях;

е) обобщение результатов исследования;

ж) группировка статистического материала;

з) составление плана и программы исследования.

Решение:основным видом работ на втором этапе статистического исследования является сбор материала в соответствии с программой исследования.

Правильный ответ:б.

 

20. Основными видами работ на третьем этапе статистического исследования являются:

а) шифровка (кодирование) статистического материала

б) сбор материала по программе исследования

в) группировка статистического материала

г) вычисление статистических показателей

д) выявление закономерностей в изучаемых явлениях

е) обобщение результатов исследования

ж) графическое изображение данных

з) составление плана и программы исследования

Решение:основными видами работ на третьем этапе статистического исследования являются: шифровка (кодирование) статистического материала; группировка; вычисление статистических показателей; графическое изображение данных.

Правильный ответ:а, в, г, ж.

 

21. При проведении статистического исследования вычисление показателей, а также графическое представление материала выполняются …

а) на втором этапе

б) на первом этапе

в) на третьем этапе

г) на четвертом этапе

д) на всех этапах

Решение:при проведении статистического исследования вычисление показателей, а также графическое представление материала выполняются на третьем этапе.

Правильный ответ:в.

 

 

22. Основными видами группировок единиц наблюдения являются:

а) вариационная

б) абсолютная

в) типологическая

г) относительная

Решение:основными видами группировок единиц наблюдения являются вариационная и типологическая.

Правильный ответ:а, в.

 

 

23. Основными видами работ на четвертом этапе статистического исследования являются:

а) вычисление статистических показателей

б) сопоставление статистических данных

в) графическое изображение показателей

г) шифровка (кодирование) статистического материала

д) выявление закономерностей в изучаемых явлениях

е) обобщение результатов исследования

ж) группировка статистического материала

Решение:основными видами работ на четвертом этапе статистического исследования являются: сопоставление статистических данных; выявление закономерностей в изучаемых явлениях; обобщение результатов исследования.

Правильный ответ:б, д, е.

 

 

24. При проведении статистического исследования обобщение полученных данных, формирование выводов и предложений выполняется …

а) на втором этапе

б) на первом этапе

в) на третьем этапе

г) на четвертом этапе

д) на всех этапах

Решение:при проведении статистического исследования обобщение полученных данных, формирование выводов и предложений выполняется на четвертом этапе.

Правильный ответ:г.

 

25. Основными вариантами практического использования результатов медико-социального исследования являются:

а) ознакомление аудитории с его результатами (лекции, доклады, семинары)

б) выпуск методических рекомендаций, приказов и инструкций

в) реорганизация деятельности лечебных учреждений

г) получение прибыли от оказания платных медицинских услуг

д) рационализаторские предложения, изобретения, открытия

Решение:основными вариантами практического использования результатов медико-социального исследования являются: ознакомление аудитории с его результатами (лекции, доклады, семинары); выпуск методических рекомендаций, приказов и инструкций; реорганизация деятельности лечебных учреждений; рационализаторские предложения, изобретения, открытия.

Правильный ответ:а, б, в, д.

 

 

26. Видами статистических таблиц являются:

а) простая

б) групповая

в) моментная

г) комбинационная

д) взвешенная

Решение:видами статистических таблиц являются: простая; групповая; комбинационная.

Правильный ответ:а, б, г.

 

 

27. Основными элементами статистических таблиц являются:

а) табличная последовательность

б) табличное подлежащее

в) табличные подразделы

г) табличное сказуемое

д) табличное распределение

Решение:основными элементами статистических таблиц являются табличное подлежащее и табличное сказуемое.

Правильный ответ:б, г.

 

 

28. Статистическая таблица, в которой представлена сводка данных по одному признаку, называется …

а) простой;

б) групповой;

в) вариационной;

г) комбинационной;

Решение:статистическая таблица, в которой представлена сводка данных по одному признаку, называется простой.

Правильный ответ:а.

29. Статистическая таблица, в которой представлены данные по двум связанным между собой признакам, называется …

а) простой

б) групповой

в) вариационной

г) комбинационной

Решение:статистическая таблица, в которой представлены данные по двум связанным между собой признакам, называется групповой.

Правильный ответ:б.

30. Количество связанных между собой признаков изучаемого явления, включаемых в групповую таблицу, составляет …

а) один

б) два

в) три

г) четыре и более

Решение:в групповой таблице представлены два связанных между собой признака.

Правильный ответ:б.

31. Статистическая таблица, в которой представлены данные по трем и более связанным между собой признакам, называется …

а) простой

б) групповой

в) вариационной

г) комбинационной

д) выборочной

Решение:статистическая таблица, в которой представлены данные по трем и более связанным между собой признакам, называется комбинационной.

Правильный ответ:г.

 

 

32. Таблица, показанная на рисунке, является …

Причины смерти по данным