Условные законы распределения

Условным законом распределениясоставляющейXпри условии, чтоY=ykназывают совокупность возможных значенийxiи соответствующих этим значениям условных вероятностей, определяемых равенством:

.

Аналогично можно задать условное распределение составляющей Y, причем:

 

19 Числовые характеристики двумерных случайных величин: корреляционный момент и коэффициент корреляции

В качестве числовых характеристик двумерных случайных величин обычно рассматриваются начальные и центральные моменты различных порядков.

Начальным моментом порядка k+s двумерной случайной величины {X,Y} число:

(9.7)

В частности, начальные моменты 1-го порядка:

, ,

представляют собой математические ожидания случайных величин XиY.

Центральным моментом порядка k+s двумерной случайной величины {X,Y} число:

. (9.8)

В частности, центральные моменты 2-го порядка:

, ,

представляют собой дисперсии случайных величин XиY.

Особого внимания заслуживает третий центральный момент 2-го порядка:

, (9.9)

который называется ковариацией(иликорреляционным моментом).

для ковариации может быть преобразовано на основании свойств математического ожидания следующим образом:

. (9.10)

Из определения ковариации следует, что она имеет размерность, равную произведению размерностей величин XиY. Другими словами,величина ковариации зависит от единиц измерения случайных величин. По этой причине для одних и тех же двух величин ковариация имеет различные значения в зависимости от того, в каких единицах были измерены величины. Такая особенность ковариации является недостатком этой числовой характеристики, поскольку сравнение ковариаций различных систем случайных величин становится затруднительным. В связи с этим, чтобы устранить указанный недостаток, вводят новую числовую характеристику –коэффициент корреляции:

. (9.11)

Пример 9.3.Вычислить числовые характеристики двумерной случайной величины, рассмотренной в пример 9.1.

Решение.Используя распределения дляXиY, получим

M[X] = 0+0,76+2,3 = 3,06 M[Y] = 0,6+1,6 = 2,2 D[X] = 13,02–(3,06)2= 3,6564 D[Y] = 7,0–(2,2)2= 2,16 M[X2] = 0+1,52+11,5 = 13,02 M[Y2] = 0,6+6,4 = 7,0 sx= 1,9122 sy= 1,4697
M[XY] = 0+0,4+1,5+0+1,44+3,2 = 6,54
Kxy= 6,54–3,06×2,2 = –0,192

Рассмотрим теперьсвойства коэффициентакорреляции.

Свойство 1.Коэффициент корреляции двух независимых случайных величин равен нулю.

Действительно, пользуясь свойствами математического ожидания (математическое ожидание произведения двух независимых случайных величин равно произведению математических ожиданий сомножителей) и учитывая, что математическое ожидание отклонения равно нулю, получим для ковариации:

Kxy=M[(X–mx)(Y–my)] =M[X–mx]×M[Y–my] = 0.

Следовательно, и коэффициент корреляции тоже равен нулю.

Отметим, что обратное утверждение неверно. Например, пустьY=X2и распределениеXсимметрично относительно начала координат, т.е.M[X]=0, тоM[XY]=M[X3]=0 иM[X]M[Y]=0. Следовательно,Kxy=0 иrxy=0, несмотря на то, что междуXиYимеется функциональная зависимость.

Таким образом, если коэффициент корреляции между двумя случайными величинами равен нулю, то утверждение, что эти случайные величины независимы – не всегда справедливо. Это значит, что может существовать система зависимых случайных величин, коэффициент корреляции которых равен нулю. Поэтому вводится понятие коррелированности.

Две случайные величины называются коррелированными, если их коэффициент корреляции отличен от нуля; если он равен нулю, то эти величины называются некоррелированными.

Итак, из коррелированности двух случайных величин следует их зависимость, но из зависимости еще не вытекает коррелированность. Из независимости двух случайных величин следует их некоррелированность, но из некоррелированности еще нельзя заключить о независимости этих величин. Заранее отметим, что некоррелированность и независимость совпадают только в одном случае, когда случайные величины подчинены нормальному закону распределения.

Свойство 2.Коэффициент корреляции rxy двух случайных величин X и Y не превосходит по абсолютной величине единицы, т.е.

.

Действительно, рассмотрим величину

M[(X–mx)+t(Y–my)]2=D[X]+2tKxy+t2D[Y].

Левая часть равенства неотрицательна при всех значениях t, поэтому квадратный трехчлен, находящийся в правой части, также неотрицателен при всех значенияхt. Следовательно, его дискриминант

Разделив обе части неравенства на sxsy, получим

|rxy|£1.

Свойство 3.Коэффициент корреляции двух случайных величин X и Y равен rxy=±1 тогда и только тогда, когда между величинами X и Y существует линейная функциональная зависимость.

Очевидно, что если rxy=±1, то тогда дискриминант рассмотренного выше квадратного трехчлена равен нулю, т.е. существуют два равных корняt1=t2. Тогда приt=t1получим

M[(X–mx)+t(Y–my)]2=0.

Следовательно, (X–mx)+t(Y–my)=0, или

X = –t1Y+mx+t1my.

Обратное условие, если имеется линейная зависимость, тогда она всегда может быть задана в данном виде при некотором t. Это означает существование равных корнейt1=t2квадратного трехчлена и, следовательно, справедливо равенствоrxy=±1.

Итак, при возрастании |rxy| от 0 до 1 корреляционная связь увеличивается, а при |rxy|=1 она становится линейной функциональной зависимостью. Другими словами, коэффициент корреляции можно рассматривать какмеру линейной зависимостимежду двумя случайными величинамиXиY.

20 Основные понятия математической статистики: генеральная и выборочная совокупность

Математическая статистика– это раздел математики, изучающий приближенные методы отыскания законов распределения и числовых характеристик по результатам эксперимента.

Генеральная совокупность– это множество всех мыслимых значений наблюдений (объектов), однородных относительно некоторого признака, которые смогли быть сделаны.

Выборкаэто совокупность случайно отобранных наблюдений (объектов) для непосредственного изучения из генеральной совокупности.

Статистическое распределение– это совокупность вариант xi и соответствующих им частот ni.

Гистограмма частот – это ступенчатая фигура, состоящая из смежных прямоугольников, построенных га оной прямой, основания которых одинаковы и равны ширине класса, а высота равна или частоте попадания в интервал ni или относительной частоте ni/n. Ширину интервала i можно определить по формуле Стерджеса:

I=(xmax-xmin)/(1+3,32lgn),

Где xmax – максимальное; xmin – минимальное значение вариант, а их разность носит название вариационный размах; n – объем выборки.

 

Полигон частот– ломаная линия, отрезки которой соединяют точки с координатами xi, ni.