Побудова варіаційнного ряду

Перший спосіб:

виділимо потрібну змінну (стовпчик) - натиснемо праву клавішу мишки - виберемо Quiq Stats Graphs (швидкі статистики і графіки) - Values / Stats of Vars (значення і статистики ) - спостерігаємо варіаційний ряд і вибіркове среднє (mean) і стандартне відхилення ( SD ).

Другий спосіб:

ввійдемо в модуль Data Menagement (подвійний клік лівою клавішою мишки на чистому полі і вибір модуля у вікні Module Switcher; якщо модуль уже завантажений, то Alt+Tab до появи модуля) - Analysis Sort - встановлюємо ім’я змінної, тип сортування: Ascen (по зростанню ) чи Desc ( по спаданню) - OK.

Функція емпіричного розподілу

Перший спосіб:

Graphs - Stats 2D Graphs - Histogram - у з’явившомуся вікні встановимо: Graph Type : Regular, Cumulative Counts (накопичені частоти), Fit Type (підбираючий тип) : Exponential (для нашого прикладу) чи off (без підбору), Variablles: x, Categories (число інтервілів групування) : 250 - OK.

Спостерігаємо графік функції емпіричного розподілу (рис. 3.2). Графік можна відредагувати: змінити лінії, точки, фон, шкали, підписи; для цього необхідно підвести стрілку в потрібне місце і двічі клікнути лівою клавішою мишки. Виводимо його на друк чи зберігаємо.

Рисунок 3.2 – Функція емпіричного розподілу

 

Другий спосіб :

упорядкуємо за зростанням нашу вибірку (див. Побудова варіаціоного ряду);

створимо нову змінну F для значень функції:

клавіша Var - Add - ... ( див. Генерація вибірки) - виділимо нову змінну NEWVAR - права клавіша мишки - Variable Specs ... - Name: F - Long name: = V0/50

(оператор V0 створює масив цілих чисел) ; побудуємо графік:

Graphs - Custom Graphs - 2D Graph - в новому вікні установимо: в полі X: x, в полі Y: F, Step Plot (сходинки, але не Line Plot - лінії) - OK.

Спостерігаємо функцію емпіричного розподілу (з точністю до дрібного групування з 250 інтервалами).

Групування даних

Analysis Frequency Tables - у вікні Frequency Tables задамо No of exact intervals: 10 (10 інтервалів групування; чи Step size: 2, starting at: 0), в полі Display options відмітимо Cumulative frequences ( накопичені частоти ), Percentages (проценти - відносні частоти), Cumulative Percentages (накопичені частоти ) - OK.

Спостерігаємо таблицю групованих даних. Виводимо її на друк і зберігаємо.

Побудова гістограми частот

Graphs - Stats 2D Graphs - Histograms - в появившомуся вікнівстановлюємо: ім’я змінної, Graph Type: Regular, Fit Type; off ( без підбору ) чи потрібний тип, число інтервалів групування Categories: чи Auto (автоматичний вибір числа інтервалів) - OK.

Спостерігаємо гістограму (рис. 3.3). Відредагуємо графік, якщо необхідно. Виводимо на друк і зберігаємо.

 

Рисунок 3.3 – Гістограма.

Вибіркові характеристики

перший спосіб: на заголовку стовчика з вибіркою клікнемо правою клавішою мишки - Quick Basic Stats... - Descriptives of var - отримоємо таблицю з характеристиками: mean (среднє), Confid 95% ( довірчі інтервали нижній і верхній з рівнем довіри 0.95 ), Sum ( сума ), Minimum, Maximum, Range ( розмах ), Variance ( дисперсія ), Std. Dev. ( стандартне відхилення ) тощо. Порівняємо вибіркове среднє, медіану і стандартне відхилення з відповідними теоретичними значеннями. Це ж, також можна зробити через меню: Anflisis - Quick Basic Stats ...

Другий спосіб : на заголовку стовчика з вибіркою клікнемо правою клавішою мишки - Block Stats / Columns (блок статистик по колонках ) - виділимо необходідне або All.

Опис двомірних вибірок

Ввід даних: задамо нову таблицю 2´32, назвемо стовпчики X і Y. Заповнимо таблицю вручну заданими в табл.2 значеннями.

Діаграма розсіювання:

Graphs - Stats 2D Graphs... - Scatterplots... - вводимо значення по осях X і Y (натиснувши на кнопку Variables і вибравши змінні ) - OK.

Роздрукуємо діаграму (рис. 3.4) або збережемо.

Вибіркові характеристики.

Виділимо ті змінні, по яких потрібно вибіркові характеристики - клікнемо правою клавішою мишки - Quick Basic Stats - Descriptivs of VARS... Спостерігаємо таблицю вибіркових характеристик (тих же, що инше). Віддрукуємо таблицю чи збережемо.

Вибіркові характеристики можна внести в таблицю даних, в кінець відповідних стовпчиків. Виділимо потрібні стовпчики, дальше див. другу частину п. Вибіркові характеристики..

 

Рисунок 3.4 – Діаграма розсіювання

 

Визначимо кореляційну матрицю:

Analysis - Correlation matrices - Two lists - First list: All - Second list: All - OK - Cancel (відміна пропозиції на нову матрицю).

Матрицю віддруковуємо чи зберігаємо.

двомірна гістограма (рис. 6).

Graphs - Stat 3D Sequential Graphs - Bivariate Gistogram - встановимо по осях X і Y потрібні змінні ( кнопкою Variables), задамо число інтервалів по кажній осі - OK.

Роздрукуємо гістограму.

 

ОФОРМЛЕННЯ ЗВІТУ

 

Звіт про виконану роботу повинен містити пояснювальну записку із розрахунками та графіками, а також аналіз результатів розрахунку.

 

КОНТРОЛЬНІ ЗАПИТАННЯ

 

1. Що таке вибірки?

2. Що таке варіаційний ряд?

3. Дайте визначення медіані.

4. Наведіть вибіркові характеристики.


Лабораторна робота № 4

Визначення статистичного зв’язку між геологічними ознаками за допомогою кореляції

 

МЕТА І ЗАДАЧІ

Метою роботи, яка виконується, є отримання студентами практичних навикiв по обробцi геологiчних даних методами математичної статистики з використанням сучасної обчислювальної технiки.

При виконанні цiєї роботи перед студентами постає задача: оцінити залежність між геолого-промисловими параметрами застосувавши кореляційний аналіз даних і оцінити їх зв’язок та дати рекомендації для використання результатів в практичних цiлях.

У процесi виконання роботи студенти повиннi:

- знати суть методу кореляційного аналізу;

- приймати рiшення за результатами оцінки залежності між геолого-промисловими парамерами.

 

ОСНОВНI ТЕОРЕТИЧНI ПОЛОЖЕННЯ

 

Аналіз результатів спостережень з метою вивчення кореляційних зв’язків називається кореляційно-регресійним аналізом.

Мета його – оцінка форми і тісноти зв’язку. При цьому необхідно пам’ятати, що однією з характеристик положення ряду розподілу на числовій осі є середнє арифметичне значення випадкової величини. Тому з метою вивчення форми зв’язку для кожного значення аргументу ми вираховуємо середнє арифметичне (зважене по частоті) значення функції, яке називається умовним середнім.

Кореляційною залежністю називається така залежність між двома випадковими ознаками, коли при зміні однієї величини змінюється відповідне умовне середнє значення іншої величини.

Кожному значенню Хi відповідає одне значення умовної середньої Yx-i. Тому залежність між значеннями Xi і є уже не випадковою, а функціональною. В загальному випадку функціональна залежність виражається як:

 

 

і називається кореляційною залежністю. Рівняння є рівнянням регресії Y відносно X. Функція f(x) називається регресією Y відносно X, а її графік - лінією регресії Y відносно X.

Необхідно відмітити, що кореляційний аналіз - це не просто аналіз сукупності декількох величин, а аналіз, який направлений на виявлення і вивчення систем, що утворюють деякі з величин, що входять в дану сукупність. При вивченні системи випадкових величин недостатньо дослідити яку небудь одну із складових системи або кожну з них окремо. Так у системи з’являються додаткові властивості, в даному випадку пов’язані з тим, що між компонентами системи можуть існувати зв’язки і залежності. Тому, окрім задач, які пов’язані з вивченням властивостей однієї окремо взятої випадкової величини, виникають нові додаткові задачі по виявленню зв’язку між компонентами системи.

Система декількох випадкових величин називається багатомірною випадковою величиною або багатомірним випадковим вектором.

Числовою характеристикою двомірної випадкової величини є коефіцієнт кореляції r. Цей коефіцієнт характеризує силу і напрямок лінійної залежності між значеннями X і Y. Коефіцієнт кореляції може приймати будь-які значення від мінус 1 до плюс 1.

Якщо r > 0, то говорять про додатню кореляцію або про прямий зв’язок між X і Y; якщо r < 0, то говорять про від’ємну кореляцію або зворотній зв’язок між X і Y.

Якщо r = (+1) або r = (-1), то між компонентами двомірної величини існує тісний функціональний зв’язок. Чим дальше абсолютна величина (r) від одиниці і ближче до нуля, тим слабший зв’язок. При r = 0 зв’язок відсутній.

Після визначення коефіцієнта кореляції необхідно оцінити статистичну значимість останнього. Вона оцінюється його абсолютною величиною і залежить від об’єму вибірки N. При цьому перевіряють гіпотезу про рівність нулю, досліджуваного критерію Стьюдента t:

який порівнюють з табличним значенням при заданому рівні значимості та числі степенів свободи V = N - 2. Якщо обчислений критерій t за абсолютною величиною менший чи рівний табличному, то обчислений коефіцієнт кореляції - статистично значимий (надійний).

Кореляційний аналіз дає найбільш надійні результати при нормальному розподілу величин.

 

ПОСТАНОВКА ГЕОЛОГІЧНОЇ ЗАДАЧІ

На нафтовому родовищі пробурено n свердловин, в яких було вивчено пористість і нафтонасиченість продуктивного горизонту.

Необхідно визначити, як залежить нафтонасиченість продуктивного горизонту від пористості для планування дослідно-промислової експлуатації цього горизонту та визначити кореляційні зв’язки між цими характеристиками.

 

ПОСЛІДОВНІСТЬ ВИКОНАННЯ РОБОТИ

Для вирішення поставленої задачі студент повинен отримати у викладача свій варіант завдання, що знаходяться в додатку А.1 і виконати роботу в наступній послідовності:

1. Графічно оцінити кореляційний зв’язок між пористістю (m) та нафтонасиченністю (bн) продуктивного горизонту за отриманими даними. Для цього необхідно побудувати точкову діаграму залежності m від bн, де по осі абсцис відкладають значення m, а по осі ординат bн. По характеру розташування точок слід зробити висновок про лінійність зв’язку m та bн.

2. Обчислити середні значення пористості та нафтонасиченості за формулою:

3. Визначити коваріацію пористості та нафтонасиченості за формулою:

4. Визначити середньоквадратичні відхилення пористості та нафтонасиченості:

5. Обчислити коефіцієнт кореляції:

6. Перевірити отриманий коефіцієнт парної кореляції на значимість (надійність), для чого:

6.1. Обчислити статистику критерію Стьюдента за формулою:

,

6.2. Знайти критичне значення критерію Стьюдента для рівня значимості a = 0.05 по таблиці розподілу Стьюдента (додаток А.2). Число ступенів свободи k при цьому визначається із співвідношення k=N-2. Порівнявши t і tкр, слід зробити висновок про надійність коефіцієнта кореляції, якщо t>tкр, то коефіцієнт кореляції можна вважати надійним, що дозволяє судити про наявність лінійного зв’язку між ознаками, що вивчаються.

 

 

ОФОРМЛЕННЯ ЗВІТУ

 

Звіт про виконану роботу повинен містити пояснювальну записку із розрахунками та графіком, аналіз результатів розрахунку, де на основі аналізу коефіцієнта кореляції слід зробити висновок про тісноту зв’язку між парамерами.

 

КОНТРОЛЬНІ ЗАПИТАННЯ

 

1. Який аналіз називають кореляційно-регресійним ?

2. Що називають коефіцієнтом кореляції ?

3. Які значення може приймати коефіцієнт кореляції?

4. Коли зв’язок між парамерами вважається надійним?

5. Коли зв’язок між парамерами вважається прямим ?

6. Коли зв’язок між парамерами вважається зворотним ?

7. Чим описується зв’язок між парамерами ?

8. Яким буває зв’язок між парамерами ?

 

 


Лабораторна робота № 5