Пункт 10 выполняется на зачетном занятии

Лабораторная работа 1.

Тема: Основные понятия теории вероятностей: частота, вероятность случайного события, закон распределения непрерывной случайной величины; расчет квантилей распределения и вероятности попадания в заданную область; типовые законы распределения непрерывных случайных величин.

 

Лабораторная работа 2.

Тема: Оценивание функции плотности и интегрального закона распределения вероятностей по выборке заданного объема.

 

Лабораторная работа 3.

Тема: Свойства точечных оценок математического ожидания M[x] и дисперсии D[x] (стандартного отклонения SD[x]).

 

Лабораторная работа 4.

Тема: Расчет и анализ свойств интервальных оценок математического ожидания M[x] и дисперсии D[x].

 


I. Порядок выполнения лабораторных работ по дисциплине «Статистические методы исследований»

1. Цикл работ включает 4 занятия, на которых выполняются работы в соответствии с «Заданиями к лабораторным работам».

 

2. Текст «Задания к лабораторным работам» находится в файле Метод_лаб_СМИИ(УиИ).doc. Перед началом работы он копируется в индивидуальную папку на рабочем диске.

 

3. Все файлы, создаваемые в процессе работы, в том числе и файл с отчетами, хранятся в индивидуальной папке на рабочем диске.

 

4. Отчет оформляется индивидуально и хранится в электронном виде на рабочем диске.

 

5. Отчеты по предыдущим работам представляются на следующем занятии в печатном или рукописном виде, отчеты по всем работам представляются на зачетном занятии.

 

6. Каждая лабораторная работа принимается преподавателем после ответов на контрольные вопросы, которые приводятся после текста задания.

 

7. Студент не допускается к выполнению очередной работы, если предыдущая работа не оформлена или две предыдущих работы не защищены.

 


II. Задания к лабораторным работам по дисциплине «Статистические методы в инженерных исследованиях»

Лабораторная работа 1.

Тема: Основные понятия теории вероятностей: частота, вероятность случайного события, закон распределения непрерывной случайной величины; расчет квантилей распределения и вероятности попадания в заданную область; типовые законы распределения непрерывных случайных величин.

Задание.

1. Начать работу с пакетом STATISTICA v.5.5 (из меню ПУСК->STAT->STATISTICA->Stawin.exe или с рабочего стола). Из окна основных разделов анализа (Module Switcher) перейти к работе с модулем Basic Statistics. Ознакомиться с видом рабочего окна и содержанием горизонтального меню модуля.

2. Выбрать позицию New File, создать таблицу, содержащую 4 столбца (Vars) и 1000 строк (Cases), и сохранить с именем 1_ХХХХХi.sta, где 1- номер занятия, ХХХХХ – имя файла (производное от фамилии), i – номер файла. При создании первого файла i=1.

3. Поставить указатель на заголовок первого столбца и нажать правую клавишу мыши (ПКМ). Ознакомиться с содержанием выпадающего меню. Используя позицию Variable Specs… открыть окно свойств переменной (спецификация переменной) и изучить назначение кнопок и позиций окна.

4. Рассчитать частоту случайного события и проанализировать ее поведение при увеличении количества опытов.

Вариант А) случайное событие - выпадения «орла» (1) или «решки» (0) в опыте с подбрасыванием монеты. Для моделирования случайного события выполнить следующие действия:

· первый столбец таблицы обозначить Х1 и заполнить значениями дискретной случайной величины (числами 0 и 1), рассчитанными по формуле

X1=Trunc(rnd(1)+0.5),

Где - Trunc(х) (округление до меньшего целого) и rnd(х) (генерация равномерно распределенных случайных чисел) – стандартные функции из Functions->Math. Формула задается в окне Long Name… и начинается со знака «=». Сохранить таблицу рассчитанных значений.

· В столбце переменной Х1 отметить первые 10 значений, нажимая Shift+¯. Вызвать выпадающее меню (ПКМ) на выделенном блоке и рассчитать среднее по столбцу значений, выбрав Block Stats/Columns->Means.

Переместиться в последнюю строку таблицы (Ctrl+¯) и убедиться, что действительно рассчитано среднее по 10 значениям.

· Повторить все указанные действия (опыты) еще 3 раза для 30, 100 и 1000 значений случайной величины Х1.

 

· Скопировать все средние значения и перенести их во второй столбец, обозначив его M_X1. Выбрав позицию меню Graph->Custom Graphs->2D Graphs, построить зависимость средних от номера опыта.

· Объяснить, какая вероятностная характеристика в данном случае рассчитывается с помощью усреднения значений. Сделать выводы об изменении частоты появления события при разном количестве усредняемых случайных величин.

Сохранить таблицу и графики под именами по схеме 1_XXXXX1.stg. В дальнейшем все таблицы и графики хранить в файлах с аналогичными именами в соответствии с номером выполняемой работы.

Вариант В) случайное событие - выпадения числа от 1 до 6 в опыте с подбрасыванием игральной кости.

· второй столбец таблицы обозначить Х2 и заполнить значениями дискретной случайной величины (числами от 1 до 6), рассчитанными по формуле

X2=Trunc (rnd(6)+1),

Где - Trunc(х) (округление до меньшего целого) и rnd(х) (генерация равномерно распределенных случайных чисел) – стандартные функции из Functions->Math. Формула задается в окне Long Name… и начинается со знака «=». Сохранить таблицу рассчитанных значений.

· В столбце переменной Х2 отметить первые 10 значений, нажимая Shift+¯. Вызвать выпадающее меню (ПКМ) на выделенном блоке и провести расчеты, выбрав Block Stats/Columns->Graphs->Histograms.

· Повторить все указанные действия (опыты) еще 3 раза для 30, 100 и 1000 значений Х2.

· Объяснить, что отображено на графиках, как рассчитать частоту появления события, используя график и рассчитать частоту для N=1000 в следующем свободном столбце таблицы.

· Объяснить изменение вида графиков при увеличении количества опытов.

5. Изучить моделирование случайных величин с типовыми законами распределения вероятности и влияние параметров на характер кривых.

Для этого в главном меню модуля из Analysis ->Startup Panel выбрать позицию Probability Calculator и открыть окно Probability Distribution Calculator. Для заданных в Таблице 1 типов распределений

- рассчитать и записать в отчет значения параметров q1 и q2 для каждого типа распределения при заданном К – номер студента по списку,

- для каждого распределения построить графики:

· Функции плотности распределения

· Функции интегрального закона распределения;

Для расчета функций и построения графиков отметить Graph, отключить функцию Fixed Scaling и нажать кнопку Compute. Для симметричных функций плотности отредактировать разметку горизонтальной оси так, чтобы точно определить положение максимума функции плотности.

- изменяя значения параметров, изучить их влияние на вид функции плотности распределения.

6. Рассчитать значения вероятностей p попадания в интервалы и дополняющих вероятностей q=1-p для распределений и их параметров из Таблицы 1.

Границы интервалов для заданного К рассчитать, используя Таблицу 2.

7. Найти квантили, отвечающие уровню вероятности p, для распределений с соответствующими параметрами из Таблицы 1.

Значения вероятностей заданы в Таблице 3.

Для четных функций плотности распределения рассчитать левую и правую границы симметрично расположенного интервала.

8. Оформить отчет, используя MS WORD. Таблицы переносятся в текстовый файл копированием (Copy Graph из выпадающего меню при нажатии ПКМ на графике) или экспортом в форматах ХХХХХ1.txt или ХХХХХ1.xls (File->Export Data).

 

Контрольные вопросы:

1. Как создать таблицу для размещения 100 значений 22 переменных?

2. Как рассчитать значения переменных, заданных с помощью некоторого аналитического выражения и разместить их в таблице?

3. Какие стандартные функции вы использовали в работе для расчетов?

4. Как рассчитать среднее значение по столбцу (строке) ?

5. Как построить график по значениям в столбце таблицы?

6. Что такое случайное событие? Приведите пример.

7. Какими свойствами обладают случайные события? Классификация случайных событий. Что такое случайная величина? Типы случайных величин Приведите пример.

8. Понятие частоты появления случайного события, ее свойства.

9. Понятие вероятности случайного события. Свойства вероятности случайного события.

10. Функция закона распределения случайной величины в интегральной форме, ее свойства. Пример.

11. Функция закона распределения случайной величины в дифференциальной форме, ее свойства. Пример.

12. Расчет вероятности попадания случайной величины в заданный интервал с использованием закона распределения в интегральной форме. Пример.

13. Расчет вероятности попадания случайной величины в заданный интервал с использованием закона распределения в дифференциальной форме. Пример.

14. Типовые законы распределения: аналитический и графический вид плотности распределения, параметры, типовая ситуация формирования случайной величины.

15. Понятие квантиля распределения и его расчет.

 

Таблица 1. Типы распределений и их параметры

Тип распределения Нормальное Лапласа Логнормальное Экспоненциальное
Параметры -> № варианта ¯ q1; q2 q1; q2 q1; q2 q1
K=1..15   K=16..30 -K/10; K/2   K/10; К/20 -K/10; K/10   K/10; K/10 K/10; K/10   1+K/10; K/20 1+K/10   K/10

 

Таблица 2. Границы интервалов

Тип распределения Нормальное q1, q2 Лапласа q1, q2 Логнормальное q1, q2 Экспоненциальное q1
№ варианта Заданный диапазон
K=1..15     (K/10+1); ¥ (K/10); K/10+0.5)   -¥; (K/10-1)     K/10; ¥     K/10 ; ¥    
K=16..30 (K/20-2); ¥ (K/10); (K/10+1) -¥; (-K/10-1) (K/10+0.05*K); ¥ K/50 ; ¥
             

 

Таблица 3. Значения вероятностей

Тип распределения Нормальное q1, q2 Лапласа q1, q2 Логнормальное q1, q2 Экспоненциальное q1
№ варианта Заданная вероятность попадания в симметричный ( +/-x ) и асимметричный (- ¥; x) интервалы Заданная вероятность попадания в асимметричный интервал (- ¥; x)
K 0.95; 0.99   К/100  

Лабораторная работа 2.

Тема: Оценивание функции плотности и интегрального закона распределения вероятностей по выборке заданного объема.

Задание.

1. Начать работу с модулем Basic Statistics и подготовить таблицу, содержащую 10 столбцов и 10 строк.

2. В первом столбце с именем X10 cгенерировать выборку объема N1=10 случайных величин с нормальным распределением и заданными значениями параметров (см. Таблицу 1). Для этого открыть выпадающее меню на заголовке столбца, выбрать

Variable Specs-> Functions->Distributions-> VNormal -> Insert,

а затем ввести в окно Long Names… формулу для расчета в виде

=Vnormal ( rnd(1); m; s ) .

Сохранить таблицу в файле с соответствующим именем.

3. Перейти к работе с модулем Data Management, открыть таблицу, созданную в предыдущем пункте, скопировать переменную X10 во второй столбец и упорядочить его значения по возрастанию. Для этого выбрать в горизонтальном меню позицию Analysis->Sort.

Упорядоченным данным присвоить имя VX_10, сохранить таблицу. Записать в отчет упорядоченный ряд данных и его название.

4. Построить гистограмму по значениям X_10. Для этого выбрать Graph->Stats 2D Graphs-> Histograms и установить параметры окна:

· необходимое количество интервалов (требует предварительного расчета по формуле r=1+3,2*lg N),

· вывод значений ординат в процентах,

· тип подгоночной кривой – тип теоретического распределения моделируемой случайной величины.

График сохранить для отчета.

5. Построить диаграмму накопленных частот по значениям X_10. Для этого выполнить все действия п.4, отметив дополнительно позицию Cumulative Counts.

6. В таблицу добавить 490 строк и повторить п.п. 2―5 для того же типа распределения, но―объем выборки N2=500. Сгенерированные и упорядоченные данные поместить соответственно в столбцы X_500 и VX_500. Провести расчеты из п.п. 3-5 и сравнить полученные результаты с результатами для X10.

7. Сгенерировать новые случайные величины:

· в столбцах Y1 – Y6 -> Yi=Rnd(1), i=1..6;

· в столбцах Z1 – Z5 Z1=(-1/K)*Ln(1-Y1); Z2=K*Y1, Z3=Y1+K,

Z4=(SYi-1)/Ö(1/6) , i=1, 2; Z5=(SYi-3)/Ö(1/2), i=1,2,…, 6;

где К – номер студента по журналу.

8. Построить гистограммы для величин Y1 и Z1 – Z6 и сделать выводы относительно изменений вида закона распределения вероятностей при различных преобразованиях исходной случайной величины.

9. Построить график по значениям переменной Х_10, выбрав Analyses->Descriptive Statistics->Normal Probability Plots. Объяснить назначение используемого метода анализа.

Пункт 10 выполняется на зачетном занятии

10. Проверить предпосылку о нормальности распределения Z5, используя критерий Пирсона. Для этого выполнить следующие действия:

· Перейти в модуль Nonparametric/Distrib, в горизонтальном меню окна выбрать Analyses-> Startup Panel. В открытом окне отметить Distribution Fitting, а на панели Continues Distributions выбрать тип распределения – Normal и нажать кнопку ОК,

· В окне Distribution Fitting выбрать две переменные для исследования Z5 и Z1, отметить «No» для теста Smirnov-Kolmogorov Test, рассчитать и ввести количество интервалов для построения гистограммы (Categories), отметить позиции Frequency Distributions и Row Frequencies, нажать кнопку ОК,

· Для каждой переменной в окне результатов записать значения Chi-square (выборочное значение статистики хи-квадрат), df (число степеней свободы), p (вероятность, соответствующая Chi-square) и на одном графике построить зависимости значений в столбцах Observed Frequency и Expected Frequency от номера интервала.

· Проанализировать результаты и принять решение относительно выдвинутой гипотезы.

11. Оформить отчет, содержащий расчеты и графики по всем пунктам задания.

 

Контрольные вопросы:

1. Что такое вариационный ряд измерений ? Как его получить ?

2. Что такое гистограмма ? Как строится эта функция ?

3. Как рассчитать оценку вероятности попадания случайной величины в заданный интервал, используя гистограмму ?

4. Что такое диаграмма накопленных частот? Как строится эта функция?

5. Как рассчитать оценку вероятности попадания случайной величины в заданный интервал, используя диаграмму накопленных частот ?

6. Как сгенерировать измерения случайной величины с заданным типовым законом распределения ?

7. Как будет изменяться вид гистограммы (диаграммы накопленных частот) при увеличении числа измерений ?

8. Как влияет линейное (нелинейное) преобразование случайной величины на вид ее распределения ?

9. Как можно практически использовать центральную предельную теорему для формирования случайных величин ?

10. Пояснить, для какой цели могут быть использованы формулы формирования случайных величин Z4 и Z5.


Лабораторная работа 3.

Тема: Свойства точечных оценок математического ожидания M[x] и дисперсии D[x] (стандартного отклонения SD[x]).

Задание.

1. Начать работу в модуле Basic Statistics и подготовить таблицу с 10 столбцами и 1000 строками.

2. Сгенерировать 10 выборок объема N=1000 нормально распределенных случайных величин с заданными параметрами ( см. п.2 в лаб. работе 2). Для этого выбрать позицию горизонтального меню Vars->All Specs и ввести в окне Long Name в первую строку формулу для расчета. В остальные 9 строк формулу перенести копированием. Далее выбрать Vars->Recalculate-> All variables и рассчитать значения всех выборок.. Выборки обозначить Х1―Х10.

3. Рассчитать оценки М[х] для всех выборок по N1=10 значениям. Для этого выделить блок значений, содержащий 10 строк, вызвать выпадающее меню и выбрать Block Stats/Columns->Means.

Увеличивать объем выборки последовательно до 50, 500 и 1000 и повторять расчет оценки M[x].

 

4. По аналогии повторить расчеты для SD[x], выбирая Block Stats/Columns->SDs.

Убедиться, что внизу таблицы появились восемь новых строк, в которых рассчитаны десять оценок М[х] и SD[x] по 10, 50, 500 и 1000 значениям.

 

5. Построить зависимости значений оценок от номера выборки:

· По строкам Mean1_10, Mean1_50, Mean1_100, Mean1_1000―на одном графике;

· по строкам SD1_10, SD1_50, SD1_500, SD1_1000―на втором графике.

Объяснить поведение графиков с точки зрения свойств точечных оценок

 

6. Рассчитать оценки математического ожидания по строкам оценок, полученных в п.5

M[M1_10], M[M1_50], M[M1_500], M[M1_1000],

M[SD1_10], M[SD1_50], M[SD1_500], M[SD1_1000],

Для этого выделить в таблице блок оценок целиком и использовать Block Stats/Rows->Means.

Рассчитать оценки среднеквадратического отклонения по строкам оценок, полученных в п.5

D[M1_10], D[M1_50], D[M1_500], D[M1_1000],

D[SD1_10], D[SD1_50], D[SD1_500], D[SD1_1000],

Для этого выделить в таблице блок оценок целиком и использовать Block Stats/Rows->SD’s.

Убедиться, что рассчитаны два новых столбца с оценками и результирующая таблица имеет вид

X1 X2   X10    
             
             
             
Mean1_10         M[M1_10] D[M1_10]
Mean1_50         M[M1_50] D[M1_50]
Mean1_100         M[M1_100] D[M1_100]
Mean1_1000         M[M1_1000] D[M1_1000]
SD1_10         M[SD1_10] D[SD1_10]
SD1_50         M[SD1_50] D[SD1_50]
SD1_100         M[SD1_100] D[SD1_100]
SD1_1000         M[SD1_1000] D[SD1_1000]

 

7. Построить четыре зависимости полученных оценок:

· Два графика для двух числовых характеристик оценки M[x] и разных объемов выборки―на одном графике (выделены в таблице),

· Два графика для двух числовых характеристик оценки SD[x] и разных объемов выборки―на втором графике,

В отчете пояснить:

· какие свойства оценок можно анализировать по этим графикам,

· поведение графиков с точки зрения свойств точечных оценок.

 

9. Сгенерировать 10 выборок объема N=500 случайных величин с распределением Коши и параметрами q1=К1, q2=8+К1,где К1 – номер бригады. Рассчитать оценки математического ожидания и медианы по выборкам объемов N1=10 и N2=100. Построить два графика оценок для выборок разного объема и объяснить поведение кривых графика.

 

10. Выбрать позицию горизонтального меню Analysis-> Descriptive Statistics, в открывшемся окне выбрать More Statistics, отметить и рассчитать по указанию преподавателя дополнительные статистики для X1―X10 по выборкам N=1000.

11. Оформить отчет, содержащий расчеты и графики по всем пунктам задания.

 

Контрольные вопросы:

1. Что такое точечная оценка? Какие Вы знаете точечные оценки M[x] и D[x]?

2. Какие свойства характеризуют качество точечных оценок ?

3. Какие методы расчета точечных оценок Вы знаете ?

4. Какими свойствами обладает точечная оценка M[x] в виде среднего ?

5. Какие точечные оценки дисперсии вы знаете ?

6. Какими свойствами обладают точечные оценки дисперсии ?

7. Какими свойствами обладают оценки, полученные методом максимального правдоподобия?

8. Какими свойствами обладают оценки, полученные методом наименьших квадратов?

9. Приведите пример оценки математического ожидания, рассчитанной в лабораторной работе, какими свойствами она обладает?

10. Как рассчитать точечную оценку медианы? Какими свойствами она обладает?


Лабораторная работа 4.

Тема: Расчет и анализ свойств интервальных оценок математического ожидания M[x] и дисперсии D[x].

Задание.

1. Начать работу в модуле Basic Statistics и подготовить таблицу с 20 столбцами и 500 строками.

2. Сгенерировать 10 выборок объема N=500 нормально распределенных случайных величин с параметрами из Таблицы 1 аналогично тому, как это сделано на занятии 3. Транспонировать полученную таблицу и сохранить.

3. Рассчитать блочные точечные оценки М[х] и D[x] для всех выборок по N1=10 значениям в каждой строке. Для этого выделить первые 10 столбцов таблицы, вызвать выпадающее меню и выбрать Block Stats/Rows->Means, затем Block Stats/ Rows->SDs. Убедиться в том, что появились два новых столбца, в которых рассчитаны оценки по 10 значениям.

4. Записать в отчет выражения для расчета левой (Lg_M) и правой (Rg_M) границ доверительных интервалов для математического ожидания при заданной доверительной вероятности р=0.95. В двух следующих столбцах рассчитать эти величины. Для расчета использовать спецификацию переменной и окно Long Name… . Следующий свободный столбец обозначить М[х] и заполнить точным значением М[х].

5. Построить на одном графике зависимости значений М[х] , Lg_M и Rg_M от номера выборки. Подсчитать количество случаев К, когда доверительный интервал не включал истинное значение М[х]. Объяснить, что показывает величина К.

6. Повторить п.п. 3-5, рассчитав границы доверительных интервалов по N2=500 значениям. Сравнить результаты, полученные п.п.4 и 5 и объяснить, на что будет влиять объем выборки N.

11. Повторить расчет доверительного интервала для М[х] по выборке объема N2=500 и доверительной вероятности р=0.99. Подсчитать количество случаев К, когда доверительный интервал не включал истинное значение М[х], сравнить с результатом п. 4 и объяснить, на что будет влиять величина доверительной вероятности р.

12. Повторить п.п. 3-7, рассчитывая и анализируя аналогичным образом доверительные интервалы для дисперсии.