Основы математической статистики

A b

2) [ a. b) -множество действительных чисел, расположенных между числами aи b, включая только конец a; [ a, b) -полуинтервал, изображается:


0 a b

Основные операции над множествами:

Ø Объединение: АÈВ={x|xÎA xÎB};

Ø Пересечение: АÇВ={x|xÎA и xÎB};

Ø Разность: А\В={x|xÎA и xÏB};

Ø Дополнение: =I\A={x|xÎI и xÏA}.


Декартово произведение двух множеств.

Декартовым произведением множества X = { x } и множества Y = { y } называется множество всевозможных упорядоченных пар ( x, y ) таких, что x Î X, y ÎY. Обозначается:

X×Y={(x,y) |xÎXиyÎY }.

 

Пример .

 

X={1, 2, 4},Y={6, 7},X×Y={(x,y) |xÎX ; yÎY}=

{( 1, 6 ) ,( 1, 7 ), ( 2, 6 ), ( 2, 7 ), ( 4, 6 ), ( 4, 7 ) }.

 

 

Если в декартовом произведении используются множества бесконечные,

то X × Y нельзя задать в виде конечного множества пар элементов, как в Примере 1. Тогда декартово произведение X × Y удобнее изобразить с помощью чертежа, где элементы x из множества X откладываются на горизонтальной прямой, а элементы y из множества Y на вертикальной прямой, пересекающей первую под прямым углом в точке 0.

 

Пример.

 

X=[2, 4],Y={1, 2, 3, 4}.

 

Y

 

           
           
           
           
X  
           

Вычисление площадей и объемов.

Площадь квадрата со стороной авычисляется по формуле S= а2. Площадь прямо­угольника со сторонами аи bвычисляется по формуле S= аb.

Объем куба с ребром авычисляется по формуле V= а3, площадь поверхности ку­ба вычисляется по формуле S= 6а2.

Площадь поверхности прямоугольного параллелепипеда с измерениями а, b, свы­числяется по формуле S= 2с( а+ b) + 2аb. Объем вычисляется по формуле V= аbс.

Диагональным сечением параллелепипеда (куба) называется сечение, образован­ное двумя противоположными боковыми ребрами и двумя диагоналями оснований, соеди­няющими концы этих ребер.

Основы математической статистики

Статистические данные – сведения о числе объектов какой-либо обширной совокупности, обладающими теми или иными признаками (например, число студентов, родившихся в 1985 году). Являются исходным материалом для любого статистического исследования. На основании статистических данных можно сделать научно обоснованные выводы. Для этого статистические данные должны быть предварительно определённым образом систематизированы и обработаны.

Одним из основных методов обработки статистических данных является выборочный метод. При выборочном исследовании из всей совокупности отбирают некоторым образом определённое число объектов и только их подвергают исследованию.

Выборочная совокупность (выборка) – набор случайно отобранных объектов из генеральной совокупности.

Основными показателями выборки являются:

1) вариант; 2) объем; 3) размах; 4) частота; 5)относительная частота.

Вариант – количественное значение элемента выборки.

Генеральная совокупность – совокупность всех исследуемых объектов. Генеральную совокупность образуют, например, все больные с данным диагнозом, все новорождённые и дети и т. д. Общую сумму членов генеральной совокупности называют её объёмом и обозначают буквой N. Теоретически объём генеральной совокупности ничем не ограничен (N ). Поэтому обычно изучается какая-то часть объектов генеральной совокупности – выборка.

Объём выборки (будем обозначать буквой n) – число объектов выборки (например, из 10000 студентов для контрольной флюорографии отобраны 100 студентов, то объем генеральной совокупности равен 10000, а объем выборки равен 100).

Таблица, в первой строке которой записаны все значения величины (варианты), во второй – соответствующие им частоты, называется таблицей распределения.

числовые характеристики выборки:

1) Размах выборки – это разница между минимальной и максимальной вариантой. На графике – это длина области определения полигона.

2) Мода выборки – это наиболее часто встречающаяся ее варианта.

3) Среднюю варианту в группированном ряду данных называют медианой измерения. Если средних вариант две, то медиана равна их полусумме.

Пример 1.На уроке физкультуры 14 школьников прыгали в высоту, а учитель записывал результаты. Получался такой ряд данных (в сантиметрах) :

125, 110,130, 125, 120, 130, 140, 125,

110, 130, 120, 125, 120, 125.

Требуется сгруппировать данные, составить таблицу их распределения, найти размах, моду и медиану измерения.

Решение. Выпишем все варианты измерения в порядке возрастания(точнее, не убывания), разделяя пробелами группы одинаковых результатов:

110, 110, 120, 120, 120, 125, 125, 125, 125, 125,

130, 130, 130, 140.

Это сгруппированный ряд данных. Размах изменения равен 140 – 130 =30.Варианта 140 встретилось однажды, кратность равна 1. Варианта 110 встретилась дважды, кратность равна 2. Варианта 125 встретилась наибольшее число раз, ее кратность равна 54 это мода измерения. Составляем таблицу распределения:

  Варианта сумма
кратность

Если двигаясь по сгруппированному ряду слева направо отсчитать половину (7) результатов, то мы остановимся на результате 125 см. Следующая половина результатов начинается также со 125. Значит , 125- медиана измерения.

Подчеркнем , что в процессе упорядочивания, группировки данных и составления таблиц распределения с самими данными ничего не происходит: они остаются неизменными. Изменяется только способ их представления. По существу меняется только дизайн информации, способ ее оформления.

Записать в виде вариационного и статистического рядов выборку: 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4.

Определить объем и размах выборки. Вычислить математическое ожидание, построить полигон частот.

Р е ш е н и е:

Математическая статистика позволяет получать обоснованные выводы о параметрах, видах распределений и других видах свойствах случайных величин по конечной совокупности наблюдений над ними – выборке.

Вариационным рядом выборки х1, х2, …, хn называется способ ее записи, при котором элементы упорядочиваются по величине, т. е. записываются в виде последовательности х(1), х(2), …, х(n), где х(1) х(2) х(n). Разность между максимальным и минимальным элементами выборки х(n) х(1) = w называется размахом выборки.

Пусть выборка (х1, х2,…, хn) содержит k различных чисел х1, х2, …, хк, причем хi встречается ni раз (i = 1, 2, …, k). Число ni называется частотой элемента выборки хi.

Очевидно, что .

Статистическим рядом называется последовательность пар i=1i, ni). Обычно статистический ряд записывается в виде таблицы, первая строка которой содержит элементы хi, а вторая - их частоты, третья строка – относительные частоты.

Для данной задачи объем выборки n = 15,

размах выборки w = 10 – 2 = 8.

Упорядочив элементы выборки по величине, получим вариационный ряд:

2, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10.

Различными в данной выборке являются элементы х1 = 2, х2 = 3, х3 = 4, х4 =5, х5 = 7, х6 = 10;их частоты соответственно равны n1 = 3, n2 = 1, n3 = 2, n4 = 3, n5 = 4, n6 = 2. Следовательно, статистический ряд исходной выборки можно записать в виде следующей таблицы:

хi
ni
рi 0,2 0,07 0,13 0,2 0,26 0,13

Для контроля правильности находим ni = 15, рi = 1.

Математическое ожидание приближенно равно (тем точнее, чем больше число испытаний) среднему арифметическому наблюдаемых значений случайной величины.

Математическое ожидание можно найти по одной из трех формул:

; ;

= (2 + 2 + 2 + 3 + 4 + 4 + 5 + 5 + 5 + 7 + 7 + 7 + 7 + 10 + 10) 5,3;

= (2 · 3 + 3 · 1 + 4 · 2 + 5 · 3 + 7 · 4 + 10 · 2) 5,3;

= (2 · 0,2 + 3 · 0,07 + 4 · 0,13 + 5 · 0,2 + 7 · 0,26 + 10 · 0,13) 5,3.

Полигон частот строится следующим образом:

По горизонтали откладываем значения элементов выборки, а по вертикали – соответствующие частоты, соединяем полученные точки ломаной линией. Для данной задачи получим: