Свойства функции распределения

Приведем ряд свойств функции распределения, непосредственно следующих из ее определения.

1. Функция распределения принимает значения из промежутка : .

2. Функция распределения – неубывающая функция, т.е. при .

3. Вероятность того, что случайная величина примет значение из полуинтервала , равна разности :

4. .

5. Если , то .

6. Если , то .

ВОПРОС 15

Плотность распределения системы случайных величин.

Двумерная величина (X,Y) является непрерывной, если ее функция распределения F(х,у) представляет собой непрерывную, дифференцируемою функцию по каждому из аргументов и существует вторая смешанная производная .

Рассмотрим на плоскости x0y прямоугольник ΔR_xy, примыкающий к точке (x,y), с размерами Δx, Δy и найдем вероятность попадания в него случайной точки (X,Y). Согласно (10.6)

.

Будем неограниченно уменьшать оба размера прямоугольника Δx→∞, Δy→∞ и вычисляем предел:

Совместной плотностью вероятности или плотностью совместного распределения называется функция

(10.11)

Плотность f(x,y) обладает следующими свойствами:

f(x,y)≥0;

Геометрически совместная плотность f(x,y) системы двух случайных величин представляет собой некоторую поверхность распределения.

Аналогично вводится понятие элемента вероятности:.

Элемент вероятности с точностью до бесконечно малых величин равен вероятности попадания случайной точки (X,Y) в элементарный прямоугольник ΔR_xy, примыкающий к точке (x,y), с размерами Δx, Δy.

Аналогично тому, как было рассмотрено в случае одномерной случайной величины, определим вероятность попадания случайной точки (X,Y) в область D:

(10.12)

Функция распределения системы (X,Y) через совместную плотность определяется так:

. (10.13)

Совместная плотность распределения системы случайных величин (X,Y) позволяет вычислить одномерные законы распределения случайных величин X и Y :

; . (10.14)

Одномерные плотности распределения составляющих системы случайных величин называют маргинальными плотностями распределения.

ВОПРОС 17

Пусть даны две случайные величины X и Y . Наиболее

полную характеристику их связи дают либо условные функ-

ции распределения F(x/y), F(y/x), либо условные плотности

ρ(x/y), ρ(y/x). Иногда достаточны менее полные характеристи-

ки, но более просто определяемые. К таким и относятся услов-

ные математические ожидания или функции регрессии одной

случайной величины на другую.

Для дискретных случайных величин X и Y условные ма-

тематические ожидания мы определили в подразделе 3.1. Для

непрерывных величин полагают:

M[X/Y = y] =

_ +∞

−∞

xρ(x/y)dx, (3.18)

M[Y/X = x] =

_ +∞

−∞

yρ(y/x)dy.

Условное математическое ожидание M[X/Y = y], как это сле-

дует из (3.18), есть некоторая функция ψ(y) аргумента y. Её

называют функцией регрессии случайной величины X на слу-

чайную величину Y . График функции x = ψ(y) называют кри-

вой регрессии случайной величины X на Y . Соотношение (3.19)

определяет функцию ϕ(x), называемую функцией регрессии Y

на X, а её график называют кривой регрессии Y на X.

Функции ϕ(x) и ψ(y) дают представление о виде зависимо-

сти случайных величин X и Y . Графики этих функций получа-

ются при экспериментальном исследовании вида зависимости

двух случайных величин.

Если случайные величины X и Y независимы, то кривые

регрессии являются прямыми, параллельными осям координат,

пересекающимися в точке (mx,my).

Для характеристики степени отклонения эксперименталь-

ных точек от кривой регрессии применяют условные диспер-

сии, определяемые для непрерывных величин соотношениями

ВОПРОС 18

Для двумерной случайной величины характеристики ее составляющих и , , , никак не отражают зависимости между и или ее отсутствия. Поэтому вводится еще одна числовая характеристика − корреляционный момент или ковариация.

Определение. Ковариацией или корреляционным моментом случайных величин и называется математическое ожидание произведения отклонений этих величин от их математических ожиданий:

.

Используя формулы для математических ожиданий, получаем

для дискретных величин ,

для непрерывных величин .

Ковариация характеризует зависимость величин.

Свойства корреляционного момента

1. Для независимых случайных величин и .

2. Если , то случайные величины и зависимы.

3. . (Для доказательства достаточно раскрыть скобки под знаком математического ожидания в определении.) В частности

для дискретных величин ,

для непрерывных величин .

4. . (Свойство сразу вытекает из 3.)

5. . (Выразите дисперсию через математические ожидания.)

6. .

7. . (Доказательство этого свойства можно найти в [1, гл.14, § 17].)

Ковариация имеет размерность произведения размерностей случайных величин и и зависит от того, в каких единицах измерялись величины. Для получения безразмерной характеристики вводится понятие коэффициента корреляции.

Определение. Коэффициентом корреляции случайных величин и называется отношение корреляционного момента к произведению средних квадратических отклонений этих случайных величин:

.

Свойства коэффициента корреляции

1. Для независимых случайных величин и .

2. . Коэффициент корреляции по абсолютной величине не превосходит единицы.

3. Если , то случайные величины и связаны линейной зависимостью, т.е. .

Определение. Случайные величины и называются некоррелированными, если , и коррелированными, если .

Следует помнить, что понятия некоррелированности и независимости не совпадают, несмотря на внешнее сходство. Независимые величины − некоррелированные, но обратное неверно. Коррелированные величины − зависимые, но обратное неверно. Любые коррелированные величины всегда зависимые, любые независимые величины всегда некоррелированные.

Пример.У случайных величин и , , , , . Найдите и .

Решение. .

.

Ответ. , .

ВОПРОС 19

Генеральная совокупность – это множество всех подлежащих обследованию по некоторому признаку (признакам) объектов.

Выборочная совокупность (выборка) - это специальным образом отобранная часть генеральной совокупности, отражающая ее основные свойства, и предназначенная для формирования содержательных суждений о всей генеральной совокупности, оценки ее параметров.

Количество единиц статистической совокупности (генеральной, выборочной) называется ее объемом.

Если при формировании выборки отобранный объект перед отбором следующего возвращается в генеральную совокупность и вновь может участвовать в отборе, то выборку называют повторной, в противном случае - бесповторной. На практике обычно используют бесповторные выборки.

Выборка должна правильно представлять пропорции генеральной совокупности, то есть быть репрезентативной (представительной). А для этого она должна быть соответствующим образом сформирована. В практике наибольшее распространение получили следующие способы отбора:

1. Собственно-случайная или простая выборка представляет собой жеребьевку или лото, с помощью которых единицы из генеральной совокупности отбираются в выборочную в случайном порядке.

2. Механическая выборка – применяется в тех случаях, когда генеральная совокупность каким-либо образом упорядочена (ранжирована, пронумерована и т.д.). Для проведения механической выборки устанавливается пропорция отбора, которая определяется соотнесением объемов выборочной и генеральной совокупностей. Отбор единиц осуществляется в соответствии с установленной пропорцией через равные интервалы.

3. Типический отбор применяется, если генеральную совокупность можно разбить на несколько типических групп, при этом отбор из каждой группы происходит случайным или механическим способом.

4. Серийная выборка – особый способ отбора из генеральной совокупности, когда случайно или механически выбирают не отдельные единицы, а целые их серии, внутри которых ведется сплошное наблюдение.

Каждый способ отбора предполагает использование особого метода формирования выборочной совокупности.

Но выборочная совокупность как часть генеральной совокупности не может быть во всех отношениях ей адекватной. Поэтому всегда могут иметь место некоторые отклонения ее параметров от соответствующих параметров генеральной совокупности – ошибки наблюдения: разность между соответствующими характеристиками генеральной и выборочной совокупностей.

Ошибки наблюдения складываются из ошибок репрезентативности и регистрации. Ошибками репрезентативности –это ошибки представительности – порождены тем, что выборка является лишь частью генеральной совокупности. Они бывают:систематические – из-за нарушений правил отбора; случайные – из-за обследования только части совокупности. Ошибки регистрации –следствиенедостаточной квалификации,неточностей, погрешностей, искажений (присущи и сплошному наблюдению).

Основная задача выборочного метода заключается в том, чтобы на основе изучения выборочной совокупности получить такие выборочные характеристики, которые как можно более точно отражали бы соответствующие характеристики генеральной совокупности. А достичь этого можно только в том случае, когда разность между выборочными и генеральными характеристиками будет достаточно мала. С этой точки зрения основная задача выборочного метода сводится к минимизации ошибок репрезентативности.

Теоретической основой выборочного метода является закон больших чисел. Так, неравенство Чебышева применительно к выборке может быть записана в следующем виде:

где: - выборочная средняя арифметическая,

- генеральная средняя арифметическая,

s - среднее квадратное отклонение в генеральной совокупности,

n – объем выборки,

ε > 0 – любое число.

Теорема Чебышева в этом случае формулируется так: с вероятностью, сколько угодно близкой к единице (достоверности), можно утверждать, что при достаточно большом объеме выборки n и ограниченной дисперсии генеральной совокупности s² разность выборочной и генеральной средних будет сколько угодно малa.

В математической статистике очень большое внимание уделяется вопросам определения величины допущенной ошибки выборочного исследования и возможных ее пределов.

Одним из важнейших условий минимизации ошибок репрезентативности является требование, чтобы используемые выборочные оценки параметров генеральной совокупности были «хорошими», то есть обладали определенными свойствами (несмещенность, состоятельность, эффективность, достаточность).

ВОПРОС 23

Ме́тод моме́нтов — метод оценки неизвестных параметров распределений в математической статистике и эконометрике, основанный на предполагаемых свойствах моментов (Пирсон, 1894 г.). Идея метода заключается в замене истинных соотношений выборочными аналогами.

ВОПРОС 25

30. Статистические гипотезы, ошибки 1-го и 2-го рода, уровень значимости.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.

Вероятность совершить ошибку первого рода принято обозначать через ; ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0.05 или 0.01. Если, например, принят уровень значимости, равный 0.05, то это означает, что в пяти случаях из ста мы рискуем допустить ошибку первого рода (отвергнуть правильную гипотезу).

Пусть дана выборка из неизвестного совместного распределения , и поставлена бинарная задача проверки статистических гипотез:

где — нулевая гипотеза, а — альтернативная гипотеза. Предположим, что задан статистический критерий

,

31. Статистический критерий проверки нулевой гипотезы.

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Эту величину обозначают через U или Z, если она распределена нормально, F или v^{2 –}по закону Фишера-Снедекора, T – по закону Стьюдента, c² – по закону «хи квадрат» и т. д. Все эти случайные величины обозначим через К.

Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки нулевой гипотезы.

Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин, и таким образом получают частное (наблюдаемое) значение критерия.

Наблюдаемым значением К_набл назначают значение критерия, вычисленное по выборкам.

32. Критическая область. Область принятия гипотезы, критические точки.

После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества, одно из которых содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если области принятия гипотезы – гипотезу принимают.

Так как критерий K – одномерная случайная величина, то все ее возможные значения принадлежат некоторому интервалу и, соответственно, должны существовать точки, разделяющие критическую область и область принятия гипотезы. Такие точки называются критическими точками.

Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством , где – положительное число.

Левосторонней называют критическую область, определяемую неравенством , где – отрицательное число.

Двусторонней называют критическую область, определяемую неравенствами , где . В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами или равносильным неравенством . Различия между вариантами критических областей иллюстрирует следующий рисунок.

Рис. 1. Различные варианты критических областей a) правосторонняя, b) левосторонняя, с) двусторонняя

Резюмируя, сформулируем этапы проверки статистической гипотезы:

Формулируется нулевая гипотеза ; Определяется критерий K, по значениям которого можно будет принять или отвергнуть и выбирается уровень значимости ; По уровню значимости определяется критическая область; По выборке вычисляется значение критерия K, определяется, принадлежит ли оно критической области и на основании этого принимается или .

⇐ Назад
12