Дисперсия и среднеквадратическое отклонение.

При решении практических задач могут встретиться случайные величины, имеющие разные распределения, но одинаковые математические ожидания. При этом у одних из этих величин отклонения значений от математического ожидания небольшие, у других, наоборот, могут быть значительными. Иначе говоря, у величин может быть разный разброс значений вокруг математического ожидания.

Например, для двух дискретных случайных величин, заданных следующими законами:

Х -1 и Y -100
Р 0,3 0,4 0,3 Р 0,2 0,6 0,2

 

математические ожидания равны, т.е. М(Х)=М(Y)=0. Однако, понятно, что это разные случайные величины и, прежде всего, они отличаются разбросом значений по оси абсцисс слева и справа от точки 0 – своего математического ожидания.

Приведенные рассуждения говорят о том, что было бы целесообразно ввести в рассмотрение некоторую числовую характеристику, связанную с разбросом. На первый взгляд может показаться, что такой характеристикой может быть среднее значение всех отклонений возможных значений случайной величины от математического ожидания.

Отклонением случайной величины Х от своего математического ожидания М(Х) называется разность между случайной величиной и ее математическим ожиданием.

Очевидно, что отклонение также является случайной величиной. Найдем среднее значение отклонения, т.е. математическое ожидание отклонения, получим M(XM(X)) = M(X) – M(M(X)) = M(X ) – M(X) = 0.

Итак, математическое ожидание отклонения случайной величины равно нулю. Этот факт можно объяснить также тем, что возможные значения отклонения имеют как положительные, так и отрицательные знаки, поэтому при нахождении среднего значения (математического ожидания) слагаемые взаимно уничтожаются. Избежать этого можно, убрав отрицательные знаки значений отклонения. Для этого эти значения либо берут по абсолютной величине, либо возводят в квадрат. Первый путь используется крайне редко, так как работа с абсолютными величинами вызывает, как правило, серьезные трудности, например, при дифференцировании. Поэтому в качестве характеристики разброса используют математическое ожидание квадрата отклонения.

Дисперсией D(X)случайной величиныХ называется математическое ожидание квадрата отклонения данной случайной величины от своего математического ожидания, т.е.

D(X) = M[(XM(X))2] (6.4)

Само слово "дисперсия" означает "рассеивание".

Нетрудно понять, что вероятности значений случайных величин Х и (XM(X))2 одинаковы. Для того, чтобы величина (XM(X))2 приняла значение, например, (х1M(X))2, достаточно, чтобы случайная величина Х приняла значение х1. Вероятность этого события равна р1, следовательно, и вероятность того, что величина (XM(X))2 примет значение (х1M(X))2 также равна р1. Аналогично обстоит дело и с остальными возможными значениями. Поэтому формула (6.4) с учетом определения математического ожидания случайной величины примет вид:

для дискретной случайной величины с конечным множеством значений

; (6.5)

для непрерывной случайной величины

(6.6)

Несобственный интеграл в формуле (6.6) превращается в определенный интеграл по конечному промежутку , если значения непрерывной случайной величины имеются только в этом промежутке.

Математическое ожидание имеет ту же размерность, что и сама случайная величина, в отличие от дисперсии, которая имеет размерность, равную квадрату размерности случайной величины. Таким образом, дисперсия характеризует не сам разброс, а квадрат разброса значений случайной величины. Для того чтобы определить сам средний разброс находят квадратный корень из дисперсии и получают новую числовую характеристику, называемую среднеквадратическим отклонением.

Среднеквадратическим отклонением (Х) случайной величины Х называется квадратный корень из дисперсии, т.е.

.

Пример 6.6. Найти дисперсию дискретной случайной величины, заданной следующим рядом распределения

Х
Р 0,3 0,5 0,2

Решение. Найдем вначале математическое ожидание данной случайной величины, получим М(Х)=1·0,3+2·0,5+5·0,2=2,3.

Найдем закон распределения величины (Х - М(Х))2:

(Х - М(Х))2 (1 - 2,3)2 (2 – 2,3)2 (5 – 2,3)2
Р 0,3 0,5 0,2

После вычислений, получим

(Х - М(Х))2 1,69 0,09 7,29
Р 0,3 0,5 0,2

Найдем математическое ожидание полученной случайной величины: D(X) = M[(XM(X))2]=1,69·0,3+0,09·0,5+7,29·0,2=2,01.

Пример 6.7. Найти дисперсию непрерывной случайной величины, заданной своей функцией плотности: f(x)=0,5x при хÎ(0,2); для остальных х функция плотности равна нулю.

Решение. По формуле (6.2) найдем математическое ожидание, получим

.

По формуле (6.6) найдем дисперсию, при этом несобственный интеграл превратится в определенный по заданному промежутку (0,2):

.

Для вычисления дисперсии часто применяется другая формула, которая легко получается из формулы (6.4).

Теорема 6.1.Дисперсия случайной величины равна разности между математическим ожиданием квадрата этой случайной величины и квадратом математического ожидания:

D(X) = M(X2) – M2(X) (6.7)

Доказательство. Преобразуем формулу (6.4), используя свойства математического ожидания, получим

Теорема доказана.

Пример 6.8. Решим пример 6.6, используя формулу (6.7). Математическое ожидание было найдено, оно равно М(Х)=2,3. Теперь найдем закон распределения величины Х2, получим

 

Х2
Р 0,3 0,5 0,2

Найдем М(Х2) = 1·0,3 + 4·0,5 + 25·0,2 = 7,3. Тогда дисперсия равна

D(Х) = 7,3 – (2,3)2 = 2,01.

Очевидно, что применение формулы (6.7) значительно упрощает процесс нахождения дисперсии. Понятно, что эту же формулу можно применять и для нахождения дисперсии непрерывной случайной величины.

 

Свойства дисперсии

 

Дисперсия случайной величины обладает следующими свойствами:

1. Дисперсия постоянной величины равна нулю, т.е. D(C) = 0, где С – постоянная величина.

Доказательство. По определению дисперсии с использованием свойства математического ожидания, получим

D(С) = M[(СM(С))2]= M[(СС)2] =М(0)= 0.

Этот результат достаточно очевиден, так как постоянная величина принимает всего одно значение, поэтому разброс значений отсутствует.

Свойство доказано.

2. Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат, т.е. D(СX) = С2D(X).

Доказательство. По определению дисперсии с использованием свойств математического ожидания, получим

D(СХ) = M[(СХM(СХ))2]= M[(СХСM(Х))2]= M[С2(ХM(Х))2]=

= С2M[(ХM(Х))2]= С2D(X).

Свойство доказано.

3. Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин, т.е., если величины Х и Y независимы, то

D(X + Y) = D(X) + D(Y).

Доказательство. Для доказательства применим формулу (6.7) и свойства математического ожидания, получим

D(X+Y) = M((X+Y)2) – M2(X+Y)= M(X2+2XY+Y2) – (M(X+Y))2=

= M(X2) + M(2XY) + M(Y2) – (M(X)+M(Y))2 = M(X2) + 2M(X)M(Y) + M(Y2) – – M2(X) –2M(X)M(Y) - M2(Y) = M(X2) – M2(X) + M(Y2) – M2(Y) = D(X) + D(Y).

Свойство доказано.

Следствие. Дисперсия суммы нескольких независимых величин равна сумме дисперсий этих величин.

Доказательство можно провести методом математической индукции.

4. Дисперсия разности двух независимых случайных величин равна сумме их дисперсий, т.е. D(X Y) = D(X) + D(Y).

Доказательство. Применяя второе и третье свойства дисперсии, получим D(X Y) = D(X) + D(– Y) = D(X) + (–1)2D(Y) = D(X) + D(Y).

Свойство доказано.

Доказанное свойство также легко распространить на любое конечное число независимых случайных величин.

Пример 6.9. Найти дисперсию дискретной случайной величины Х, равной числу появлений события А в n независимых испытаниях, если вероятность появления А в каждом испытании постоянна и равна р.

Решение. Пусть случайная величина Х – число появлений события А в n испытаниях.

Введем в рассмотрение еще n случайных величин:

Х1 – число появлений события А в первом испытании;

Х2 – число появлений события А во втором испытании;

…………………………………………………………….

Хn – число появлений события А в n – ом испытании.

Очевидно, что Х=Х1+Х2+…+Хn. Величины Х1, Х2, …, Хn взаимно независимы, так как исход каждого испытания не зависит от исходов остальных. Воспользуемся следствием четвертого свойства дисперсии, получим

D(X) = D(X1) + D(X2) + …+ D(Xn).

Найдем дисперсию величины Х1. Ряд распределения этой величины имеет вид:

Х1
Р 1р р

 

Тогда М(Х1) = р; М(Х12) = р; D(X1) = рр2 = р(1 – p)=pq.

Очевидно, что дисперсия каждой из остальных случайных величин также равна pq. Поэтому

D(X) = D(X1)+D(X2)+…+D(Xn) = npq.

Если исследуется некоторая случайная величина, у которой значения являются достаточно большими числами, то существует возможность перейти от этой величины к более простым величинам, называемым центрированной и стандартной.