Числовые характеристики случайных величин и их статистическая оценка

Числовые характеристики случайных велин позволяют описывать распределение СВ одним параметром, что удобно при практическом применении.

1. Характеристики центра распределения

Математи́ческое ожида́ние – среднее значение случайной величины.

  • Если X {\displaystyle X} — дискретная случайная величина, имеющая распределение

P ( X = x i ) = p i , ∑ i = 1 ∞ p i = 1 {\displaystyle \mathbb {P} (X=x_{i})=p_{i},\;\sum \limits _{i=1}^{\infty }p_{i}=1}

то её математическое ожидание:

M [ X ] = ∑ i = 1 ∞ x i p i {\displaystyle M[X]=\sum \limits _{i=1}^{\infty }x_{i}\,p_{i}}

  • Если F X ( x ) {\displaystyle F_{X}(x)} — функция распределения случайной величины, то её математическое ожидание задаётся интегралом:

2. Характеристики рассеянья случайной величины

Диспе́рсия случа́йной величины́ – мера разброса случайной величины, численно равная математическому ожидаю квадрата отклонения СВ от ее математического ожидания.

Пусть – случайная величина, тогда дисперсией называется

.

· Если случайная величина X {\displaystyle X} дискретная, то

D [ X ] = ∑ i = 1 n p i ( x i − M [ X ] ) 2 {\displaystyle D[X]=\sum _{i=1}^{n}{p_{i}(x_{i}-M[X])^{2}}}

· Если случайная величина X {\displaystyle X} непрерывна, то:

D [ X ] = ∫ − ∞ ∞ f ( x ) ( x − M [ X ] ) 2 d x {\displaystyle D[X]=\int _{-\infty }^{\infty }{f(x)(x-M[X])^{2}dx}}

Среднеквадратическое отклонение (стандартное отклонение, СКО) равно квадратному корню из дисперсии СВ:

.

Достоинство СКО – оно измеряется в единицах измерения самой случайной величины, а не ее квадрата, как дисперсия.

3. Характеристики связи случайных величин

Важной характеристикой совместного распределения двух случайных величин является ковариация (или корреляционный момент). Ковариация определяется как математическое ожидание произведения отклонений случайных величин:

.

Основное свойство ковариации: ковариация двух независимых случайных величин X и Y равна нулю.

Линейный коэффициент корреляции (или коэффициент корреляции Пирсона). Коэффициент корреляции рассчитывается по формуле:

.

Свойства коэффициента корреляции:

1. Коэффициент корреляции изменяется в пределах от -1 до +1.

2. Коэффициент корреляции двух независимых СВ – 0.

3. Если две величины жестко линейно связаны, то их коэффициент корреляции -1 или +1.

 

Оценка числовых характеристик случайных величин на основе

Экспериментальных данных

 

Пусть x i {\displaystyle x_{i}} i-й элемент выборки; n {\displaystyle n} – объём выборки.

Оценка математического ожидания – среднее значение:

Оценка среднеквадратического отклонения:

Оценка коэффициента корреляции:

 

Статистические функции в Excel:

Среднее значение: =СРЗНАЧ(диапазон)

Дисперсия: =ДИСП(диапазон)

Среднеквадратическое отклонение: =СТАНДОТКЛОН(диапазон)

Коэффициент корреляции: =КОРРЕЛ(диапазон 1;диапазон 2)

 

Задание 3. Найти оценки математического ожидания, дисперсии и среднеквадратического отклонения для данных из задания 1.

Корреляционный анализ

 

Важной характеристикой совместного распределения двух случайных величин (СВ) является ковариация (или корреляционный момент). Ковариация определяется как математическое ожидание произведения отклонений случайных величин от их среднего:

.

Основное свойство ковариации: ковариация двух независимых случайных величин X и Y равна нулю.

Линейный коэффициент корреляции (или коэффициент корреляции Пирсона). Коэффициент корреляции рассчитывается по формуле:

,

где σ – среднеквадратическое отклонение (стандартное отклонение, СКО) равно квадратному корню из дисперсии СВ:

.

Свойства коэффициента корреляции:

1. Коэффициент корреляции изменяется в пределах от -1 до +1.

2. Коэффициент корреляции двух независимых СВ равен нулю.

3. Если две величины функционально линейно связаны, то их коэффициент корреляции -1 или +1.

4. Для двух величин, связанных нелинейной функциональной связью, коэффициент корреляции может принимать различные значения в диапазоне от -1 до +1. Для примера, если две величины связаны квадратичной зависимостью, то коэффициент корреляции между ними равен нулю.

 

Таким образом, коэффициент корреляции показывает близость связи между двумя СВ к линейной.

Оценка коэффициента корреляции случайных величин на основе

экспериментальных данных

 

Пусть x i {\displaystyle x_{i}}Xiи Yii-й элемент выборки СВ X и Y соответственно; n {\displaystyle n} – объём выборки.

Оценка коэффициента корреляции определяется формулой:

 

Для представления коэффициента корреляции нескольких случайных величин А, В, С, D и т.д. удобно использовать корреляционную таблицу:

 

  А В С D ...
A rAA=1 rAB rAC rAD ...
B   rВВ=1 rBC rBD ...
C     rСС=1 rCD ...
D       rDD=1 ...
... ... ... ... ... ...

 

Замечания:

1. На главной диагонали корреляционной матрицы стоят 1, rAA=rВВ= rСС=... =1 так как, по сути, это коэффициент корреляции между двумя линейно связанными величинами с коэффициентом пропорциональности 1.

2. Коэффициент корреляции не меняется от перестановки порядка переменных, т.е. rAB = rBA, таким образом, корреляционная таблица симметрична относительно главной диагонали, и ее нижнюю часть можно не заполнять.

Задание 4. Построение корреляционной матрицы

1. Сгенерировать столбец А содержавший N=1000 значений нормально распределенных случайных чисел с параметрами: матожидание Мх=10, СКО s=3 – N(10, 3).

2. Сформировать столбцы B-E, также содержащие по 1000 значений на основе следующих формул:

1) B=2A+3,

2) С=-3A+6,

3) D=5A+N(0, 15),

4) Е=N(2, 2)

5) F=(A-10)2.

Где N(Мх, σ) – нормально распределенная случайная величина с математическим ожиданием Мхи СКО σ.

Переписать в тетрадь по 10 первых строк каждого из сгенерированных столбцов в виде таблицы.

Найти корреляционную матрицу парных коэффициентов корреляции между А, B, С, D, Е и F используя функцию Excel:

Коэффициент корреляции: =КОРРЕЛ(диапазон 1;диапазон 2)

Объясните полученный результат.