Коефіцієнт рангової кореляції Кендалла

 

Знаходиться за формулою: , де К – статистика Кендалла (при відсутності зв’язаних рангів). Для визначення К потрібно ранжувати об’єкти по одній змінній в порядку зростання рангів (1, 2,…,n) і визначити відповідні їм ранги ( ) по іншій змінній. Статистика К дорівнює загальному числу інверсій ( порушень порядку, коли більше число стоїть зліва від меншого) в ранговій послідовності (ранжуванні) . При повному співпадінні ранжувань маємо К=0 і ; при повній протилежності, можна показати, що К=n(n-1)/2 і . В усіх інших випадках |τ|<1.

При перевірці значущості τ виходять з того, що у випадку справедливості нульової гіпотези про відсутність кореляційного зв’язку між змінними (при n>10) τ має наближено нормальний закон розподілу з математичним сподіванням, рівним нулю, і середнім квадратичним відхиленням . Тому τ значущий на рівні α, якщо значення статистики більше критичного , де .

 

◄ Приклад 3 В результаті анкетного опитування для 10 найважливіших видів обладнання, що використовуються судноводіями під час

вахти, отримані наступні ранги по важливості обладнання Х і по частоті його використання Y ( див. табл. 2). Обчислити ранговий коефіцієнт Кендалла і оцінити його значущість на рівні α=0,05.

 

Таблиця 2

Ранг Тип обладнання Всього
А Б В Г Д Е Є Ж З І
Важливість обладнання, Х -
Частота використання,Y -
Кількість інверсій К=13

Розв’язання. Знайдемо, наприклад, кількість інверсій при рангу n=6 по змінній Х (результати обчислень розташуємо в останньому рядку таблиці 2). Тоді відповідний ранг по змінній Y і, враховуючи подальші ранги, маємо ранжування по Y (9,10,8,7,5). З пар чисел (перестановок) (9,10), (9,8), (9,7), (9,5) присутні інверсії (порушення порядку, коли більше число стоїть зліва від меншого) у трьох останніх парах, тобто число інверсій рівне 3. Аналогічно визначаємо й інші значення кількості інверсій і знаходимо їх суму K=13. Тепер за формулою рангової кореляції Кендалла: . Оцінимо значущість τ. Статистика , табличне критичне значення

. Оскільки , то ранговий коефіцієнт кореляції Кендалла значущий на 5%-ому рівні. Зв'язок між даними змінними помірний. ►

Порівнюючи коефіцієнти рангової кореляції ρ (Спірмена) і τ (Кендалла), можна відмітити, що має деякі переваги перед ρ при дослідженні його статистичних властивостей (наприклад, можливістю приблизної побудови довірчого інтервала для τ) і великою зручністю його перерахунку при додаванні до n статистично досліджених об’єктів нових.

Значення коефіцієнтів ρ і τ тісно пов’язані між собою. При помірно великих значеннях n (n>10) і при умові, що абсолютні величини значень цих коефіцієнтів не надто близькі до одиниці, їх зв’язує просте приблизне співвідношення . Рангові коефіцієнти кореляції ρ і τ можуть бути використані також для оцінки тісноти зв’язку між простими кількісними змінними, які виміряні в інтервальних шкалах. Знаходження цих коефіцієнтів не вимагає нормального розподілу змінних, лінійного зв’язку між ними (хоча і припускає монотонність функції регресії, яка відображає цей зв’язок). Але необхідно враховувати, що при переході від початкових значень змінних до їх рангів відбувається значена втрата інформації. Чим тісніший зв'язок, чим менше кореляційна залежність між змінними відрізняється від лінійної, тим ближче коефіцієнт Спірмена ρ до коефіцієнта парної кореляції r.

 

Додаток 3