Дисперсиялық талдауды жүргізу әдісі

Кіріспе

Медициналық-биологиялық зерттеулерде бір топты екінші топпен салыстыру тәсілдерімен қатар бір мезгілде бірнеше таңдамаларды салыстыруды қажет ететін есептер жиі кездеседі. Бұл жағдайда топтардың орта мәндерін жұп-жұбымен (әр топты әрқайсысымен) салыстыру тиімсіз болуы мүмкін, себебі салыстыру санының көптігінің салдарынан туатын I текті қателіктің жоғары мәні нәтижелер қорытындысының дұрыс жасалмауына әкеліп соғар еді. Сондықтан, салыстырылып отырған барлық топтардың арасында айырмашылықтың бар-жоғын бірден анықтау үшін бір ортақ статистикалық критерий қолданамыз. Дисперсиялық талдауды ағылшын ғалымы, математик және генетик Рональд Фишер XX ғасырдың 20-жылдарында жасап ұсынған. Дисперсиялық талдау бірнеше деңгейлермен сипатталатын факторлардың ықпалын оқып үйрену үшін қолданылады. Дисперсиялық талдау негізіне зерттеліп отырған жиынтықтыңбарлық элементтерінің орта мәннен ауытқуын талдау жатады. Ауытқу өлшемі ретіндеауытқулардың орта квадраты – дисперсия алынады. Айталық, бізде бірнеше қалыпты таралған және дисперсиялары бірдей К бас жиынтықтары бар және берілген α мәнділік деңгейі бойынша олардыңорта мәндерініңтеңдігі жөніндегі нөлдік жорамалды тексеру қажет болсын. Ол үшін әрбір бас жиынтықтан таңдама ала отырып, алынған К таңдама орта мәндер арасындағы айырмашылықтың мәнді немесе мәнді еместігін анықтау қажет.     Дисперсиялық талдау(Analysis Of Variance - ANOVA) Дисперсиялық талдауды ағылшын ғалымы, математик және генетик Рональд Фишер XX ғасырдың 20-жылдарында жасап ұсынған. Дисперсиялық талдау– бұл екіден артық топтардың орта мәндерін салыстыру үшін, яғни бірнеше тәуелсіз топтардың бір бас жиынтыққа жататындығын немесе жатпайтындығын анықтау үшін қолданылатын талдау әдісі. Орта мәндердің арасындағы айырмашылықтарды анықтау үшіндисперсиялар қолданылады. Дисперсиялық талдау бірнеше деңгейлермен сипатталатын факторлардың ықпалын оқып үйрену үшін қолданылады. Дисперсиялық талдау негізіне зерттеліп отырған жиынтықтыңбарлық элементтерінің орта мәннен ауытқуын талдау жатады. Ауытқу өлшемі ретіндеауытқулардың орта квадраты – дисперсия алынады. Айталық, бізде бірнеше қалыпты таралған және дисперсиялары бірдей К бас жиынтықтары бар және берілген α мәнділік деңгейі бойынша олардыңорта мәндерініңтеңдігі жөніндегі нөлдік жорамалды тексеру қажет болсын. Ол үшін әрбір бас жиынтықтан таңдама ала отырып, алынған К таңдама орта мәндер арасындағы айырмашылықтың мәнді немесе мәнді еместігін анықтау қажет. Барлық К бас жиынтықтары бір – бірімен ұқсас, яғни олардың дисперсиялары ғана емес, орта мәндері де бірдей деп ойлауға болады. Алайда бас жиынтықтардың әрқайсысы тәжірибеге енетін бір немесе бірнеше сапалы факторлардың ықпалына ұшырайды және соның нәтижесінде орта мәндер өзгеруі мүмкін. Мысалы, гипертониямен ауыратын аурулардың бірнешеуікездейсоқтүрде К топқа бөлінген және әр топқа дәрінің белгілі бір түрін қабылдау белгіленген. Нәтижесінде артериялық қысымның өзгеруі көрсеткішінің орта мәні бақылауға алынады. Бұлмысалда дәрі – бақыланатын көрсеткіштің шамасына ықпал ететін фактор, артериялық қысымның өзгеруініңкөрсеткіші – фактордың ықпалына «жауап». Көп жағдайда «жауапты» нәтижелік белгідеп те атайды. Дәрінің түрлері –фактордың деңгейлері. Факторлық белгілер(фактор) – зерттелетін құбылысқа ықпал ететін белгілер. Нәтижелікбелгілер(факторға жауап) – факторлық белгілердің ықпалы нәтижесінде өзгеретін белгілер. Дисперсиялық талдау міндеттері:белгіленген немесе кездейсоқ болулары мүмкін бірнеше деңгейлермен сипатталатын факторлардың ықпалын зерттеу. Мысалы, А факторы – үш деңгейден тұратын аурудың ауырлығы: жеңіл, орта, ауыр. Фактор- соңғы нәтижеге әсер ететін нәрсе. Фактордың деңгейі-фактордың нақты жүзеге асуын. Жауап- өлшенетін белгінің мәні. Дисперсиялық талдау бірнеше деңгейлермен сипатталатын факторлардың ықпалын оқып үйрену үшін қолданылады. Айталық,X1,X2,…,Xk- бас жиынтықтары бар болсын. 1. Барлығы қалыпты таралған; 2. Барлық бас жиынтықтардың дисперсиялары бірдей. Берілген α мәнділік деңгейі бойынша орта мәндердің теңдігі жөніндегі нөлдік жорамалды тексеру керек: Н 0: Басқаша айтқанда, алынған k таңдама орта мәндердің айырмашылықтарының мәнділігін айқындау қажет. Алайда, бас жиынтықтардың әрқайсысына бір немесе бірнеше сапалық факторлар ықпал етеді және олар орта мәндерді өзгертулері мүмкін. Дисперсиялық талдаудың негізгі идеясы: Таңдама дисперсияны екі компенентке бөлу: · Факторлық дисперсия, · Қалдық дисперсия. Жалпы ортаға қарасты, топтардың орта мәндерінің шашырауын сипаттайтын факторлық дисперсияны топаралық дисперсия деп атайды. Топтардың түзетілген таңдама дисперсиялары үшін орта арифметикалық мән болып табылатын қалдық дисперсияны топішілік дисперсия деп атайды. Бір фактордың ықпалы тексерілетін дисперсиялық талдау бірфакторлыдеп аталады (ANOVA). Екі немесе одан да көп факторлардың ықпалын зерттеу үшінкөпфакторлыдисперсиялық талдау (MANOVA – Multivariate ANOVA)қолданылады. Бірфакторлы дисперсиялық талдау Дисперсиялық талдауды жүргізу әдісі: 1. Нөлдік және балама жорамалдарды құрамыз: Н0: топтық бас орта мәндер тең, және таңдама орталар арасындағы айырмашылықтар кездейсоқ, фактор оларға ықпал етпейді. H1: таңдама орталар арасындағы айырмашылықтар кездейсоқ емес және оларға фактор ықпал етеді. 2. α мәнділік деңгейі беріледі ( мысалы, α=0,05 немесе α=0,01). 3. Есептеледі MSфактжәне MSкалд Егер , онда нөлдік жорамал қабылданады. Егер , онда Фишер статистикасыесептеледі. 4. Fтәжесептегеннен кейін, Fсыникесте бойынша Фишер таралуының сыни мәндерін табады. Ол k-1 және k(r-1) еркіндік дәрежелерінің сандарына сәйкес келуі керек. 5. Fтәжжәне Fсынисалыстырылады. Егер Fтәж< Fсыни, онда берілген мәнділік деңгейінде Н 0нөлдік жорамалы қабылданады және фактор орта мәнге ықпал етпейді деген қорытынды жасалынады. Егер Fтәж> Fсыни, онда нөлдік жорамал жоққа шығарылады және фактор ықпалы маңызды деп танылады. Дисперсиялық талдау кестесі:
Вариациялар, дисперсиялар Квадраттарының қосындысы (ауытқулар) Еркіндік дәрежелерінің саны Орта квадрат MS
Топаралық (фактор А) k-1  
Топішілік (қалдық) k(r-1)    
Жалпы kr-1    

 

Сыныулар номері Фактор денгейі
A1 A2 Ak
x11 x12 x1k
x21 x22 x2k
...    
nj
Топталган орта мән
Жалпы орта мән

Фактордың әр деңгейі бойынша элементтердің таңдама топтық орта мәндері:

Ауытқулардың квадраттарының жалпы қосындысы:

немесе ,

мұндағы ,

Ауытқулардың квадраттарының факторлық қосындысы:

немесе

Ауытқулардың квадраттарының қалдық қосындысы:

мәндердің шашырау дәрежесін сипаттайды.

- жалпы дисперсия

- факторлық дисперсия

-қалдық дисперсия

Топтар бір фактордың деңгейлері арқылы анықталады. Бас жиынтықтағы айнымалы әр топта қалыпты таралған және барлық топтардың дисперсиялары бірдей.

Айырмашылықтын шамасын бағалау үшін таңдама орта мәндердің шашылуын топ ішіндегі мәндердің шашылуымен салыстыру қажет.

Салыстырылатын топтар саны фактордың (тәуелсіз айнымалы)деңгейлеріне сәйкес анықталады. Мысалы:фактор - жыл мезгілі болса, онда оның деңгейлері – қыс, көктем, жаз, күз. Салыстыралатын топ саны – 4. Фактор – емдеу тәсілдерінің түрі болса, онда оның деңгейлері: стандартты әдіспен емдеу, жаңа емдеу түріжәне плацебо (бақылау тобы) болуы мүмкін.Салыстырылатын топ саны – 3.

Дисперсиялық талдау жүргізу үшін сапалық белгілер (жыныс, профессия) де, сандық белгілер де (иньекция саны,аурулар саны) қолданылады.

Таңдама деректерді әдетте кесте түрінде бейнелейді, К деңгейдентұратын А факторы үшін кестенің түрі төмендегідей болады:

 

 

11-кесте

Сынау нөмірі А факторының деңгейлері
А1 А2 ... Ак
... nj x11 x21 ... x12 x22 ... ... ... ... ... x1k x2k ...
Топтық орта мән топ1 топ2 ... топ k
           

Келтірілген кестеде таңдамалар (бақылау топтары) фактор деңгейлеріне сәйкес және баған түрінде орналасқан. Таңдаманың әрбір элементіндегі бірінші индекс –таңдамадағы элементтің нөмірін, ал екінші индекс – топ нөмірін көрсетеді.

Топтық орта мән – әр топтағы элементтердің орта арифметикалық мәні:

njсаны j – ші таңдаманың көлемі, бақылаудың жалпы саны n = n1+n2+…+nk.

Жалпы алғанда, njсаны әртүрлі, алайда біз барлық таңдамалар көлемі тең болған жағдайды қарастырумен шектелеміз.

Дисперсиялық талдаудың негізгі идеясытаңдама дисперсияны екі компонентке (құрамдас бөлікке) бөлуге негізделген, олардың біреуі орта мәндердің өзгергіштігінефактордың ықпал етуіне сәйкес келеді (факторлық дисперсия), ал екіншісі кездейсоқ себептерден туған және ортамәндердің өзгергіштігінеықпал етпейтін дисперсия (қалдық дисперсия).

Топаралық дисперсия - фактордың таңдама орта мәндердің өзгергіштігіне ықпал етуінен туған дисперсия, оны факторлық дисперсиядеп атайды және MSфактор(Mean Sqare) арқылы белгілейді.

Топішілік дисперсия – кездейсоқсебептерден туған және орта мәндердің өзгергіштігіне ықпал етпейтін дисперсия, оны қалдық дисперсиядеп атайды және MSқалдықарқылы белгілейді.

Топтық орта мәндердің теңдігі жөніндегі нөлдік жорамалда топаралықдисперсия топішілік дисперсияға ұқсас. Егер салыстырылып отырған топтар арасында айырмашылық бар болса, онда топаралық дисперсия топішілік дисперсиядан үлкен болады. Фишер критерийі осы екі дисперсияның қатынасына негізделген.

ANOVA үшін Фишер критерийініңF статистикасы топаралық дисперсияның топішілік дисперсияға қатынасы арқылы анықталады.

F статистикасы (к- 1) және (n-к) еркіндік дәрежелеріне сәйкес келетін Фишер таралуына бағынады.

Факторлық дисперсия:

формуласы арқылы есептеледі.

Мұндағы – k орта мәндерден тұратын таңдаманың ( таңдама дисперсиясы.

Қалдық дисперсияны есептеу формуласы

мұндағы - i-ші таңдаманың дисперсиясы

үшін еркіндік дәржесінің саны (к – 1), мұндағы к-топтар саны.

үшін еркіндік дәрежесінің саны к·(r- 1), мұндағы r-әр топтағы мәндер саны, к - топтар саны,

Факторлық дисперсия- топтық орта мәндердің шашырауын сипаттайды

Қалдық дисперсия– топтардың ішіндегі шашырауды сипаттайды.

Дисперсиялық талдауды жүргізу әдісі

К тәуелсіз таңдамалар бар болсын және олардың әрқайсысы жеке топты анықтайды. Таңдамалар көлемдері - nі, орта мәндер және орта квадраттық ауытқулар. Si (i= 1,2,…,k) болсын.

Таңдамалардың жалпы көлемі:n = n1+n2+…+nk

1. Нөлдік және балама жорамалдарды анықтаймыз:

Н0: Бас жиынтықтың барлық топтық орта мәндерітең:

Н1: Бас жиынтықтың барлық топтық орта мәндері тең емес (ең болмағанда бір топтық ортаныңбасқалардан айырмашылығы бар).

2. Қажетті деректерді K таңдамалардан алу. мен есептеу, егер < болса,онда Н0 қабылданады,егер болса, онда Fкритерийін есептейміз.

3. Критерий статистикасын есептеу:Fбақ

4. α мәнділік деңгейіне сәйкес (α = 0,05 немесе α= 0,01) Фишер таралуының сыни мәнін арнайы кестеден табу.

5. F критерийінің статистикасын сыни нүктемен салыстыру

6. Н0жорамалға қатысты шешім қабылдау: Егер Fбақ< Fсыниболса, онда берілген мәнділік деңгейінде нөлдік жорамал қабылданады.

Егер Fбақ> Fсыниболса, онда нөлдік жорамал жоққа шығарылады

және фактордыңықпалы маңызды болып табылады.

Дисперсиялық талдауды қолдануға қойылатын шарттар:

1. Әрбір таңдама басқа таңдамалардан тәуелсіз.

2. Әрбір таңдама зерттелетінбас жиынтықтан кездейсоқ түрде алынған.

3. Бас жиынтық қалыпты таралған.

4. Топтардың бас дисперсиялары бірдей.

Ескерту:Бұл талаптарды орындау аса маңызды. Сондықтандисперсиялықталдауды жүргізбес бұрын алдымен барлық салыстырылатын топтардың таралуын қалыптылыққа тексеру және осы топтардағыдисперсиялардың теңдігін тексеру қажет.

Бұл шарттардың ең болмағанда біреуі бұзылған жағдайда дисперсиялық талдауды қолдануға болмайды. Мұндай жағдайда бір факторлы ANOVA-ның параметрлік емес аналогы Крускал – Уоллис критерийін қолдану қажет.