Дисперсиялық талдауды жүргізу әдісі
Кіріспе
Медициналық-биологиялық зерттеулерде бір топты екінші топпен салыстыру тәсілдерімен қатар бір мезгілде бірнеше таңдамаларды салыстыруды қажет ететін есептер жиі кездеседі. Бұл жағдайда топтардың орта мәндерін жұп-жұбымен (әр топты әрқайсысымен) салыстыру тиімсіз болуы мүмкін, себебі салыстыру санының көптігінің салдарынан туатын I текті қателіктің жоғары мәні нәтижелер қорытындысының дұрыс жасалмауына әкеліп соғар еді. Сондықтан, салыстырылып отырған барлық топтардың арасында айырмашылықтың бар-жоғын бірден анықтау үшін бір ортақ статистикалық критерий қолданамыз. Дисперсиялық талдауды ағылшын ғалымы, математик және генетик Рональд Фишер XX ғасырдың 20-жылдарында жасап ұсынған. Дисперсиялық талдау бірнеше деңгейлермен сипатталатын факторлардың ықпалын оқып үйрену үшін қолданылады.
Дисперсиялық талдау негізіне зерттеліп отырған жиынтықтыңбарлық элементтерінің орта мәннен ауытқуын талдау жатады. Ауытқу өлшемі ретіндеауытқулардың орта квадраты – дисперсия алынады.
Айталық, бізде бірнеше қалыпты таралған және дисперсиялары бірдей К бас жиынтықтары бар және берілген α мәнділік деңгейі бойынша олардыңорта мәндерініңтеңдігі жөніндегі нөлдік жорамалды тексеру қажет болсын. Ол үшін әрбір бас жиынтықтан таңдама ала отырып, алынған К таңдама орта мәндер арасындағы айырмашылықтың мәнді немесе мәнді еместігін анықтау қажет.
Дисперсиялық талдау(Analysis Of Variance - ANOVA)
Дисперсиялық талдауды ағылшын ғалымы, математик және генетик Рональд Фишер XX ғасырдың 20-жылдарында жасап ұсынған.
Дисперсиялық талдау– бұл екіден артық топтардың орта мәндерін салыстыру үшін, яғни бірнеше тәуелсіз топтардың бір бас жиынтыққа жататындығын немесе жатпайтындығын анықтау үшін қолданылатын талдау әдісі. Орта мәндердің арасындағы айырмашылықтарды анықтау үшіндисперсиялар қолданылады.
Дисперсиялық талдау бірнеше деңгейлермен сипатталатын факторлардың ықпалын оқып үйрену үшін қолданылады.
Дисперсиялық талдау негізіне зерттеліп отырған жиынтықтыңбарлық элементтерінің орта мәннен ауытқуын талдау жатады. Ауытқу өлшемі ретіндеауытқулардың орта квадраты – дисперсия алынады.
Айталық, бізде бірнеше қалыпты таралған және дисперсиялары бірдей К бас жиынтықтары бар және берілген α мәнділік деңгейі бойынша олардыңорта мәндерініңтеңдігі жөніндегі нөлдік жорамалды тексеру қажет болсын. Ол үшін әрбір бас жиынтықтан таңдама ала отырып, алынған К таңдама орта мәндер арасындағы айырмашылықтың мәнді немесе мәнді еместігін анықтау қажет.
Барлық К бас жиынтықтары бір – бірімен ұқсас, яғни олардың дисперсиялары ғана емес, орта мәндері де бірдей деп ойлауға болады. Алайда бас жиынтықтардың әрқайсысы тәжірибеге енетін бір немесе бірнеше сапалы факторлардың ықпалына ұшырайды және соның нәтижесінде орта мәндер өзгеруі мүмкін.
Мысалы, гипертониямен ауыратын аурулардың бірнешеуікездейсоқтүрде К топқа бөлінген және әр топқа дәрінің белгілі бір түрін қабылдау белгіленген. Нәтижесінде артериялық қысымның өзгеруі көрсеткішінің орта мәні бақылауға алынады. Бұлмысалда дәрі – бақыланатын көрсеткіштің шамасына ықпал ететін фактор, артериялық қысымның өзгеруініңкөрсеткіші – фактордың ықпалына «жауап». Көп жағдайда «жауапты» нәтижелік белгідеп те атайды. Дәрінің түрлері –фактордың деңгейлері.
Факторлық белгілер(фактор) – зерттелетін құбылысқа ықпал ететін белгілер.
Нәтижелікбелгілер(факторға жауап) – факторлық белгілердің ықпалы нәтижесінде өзгеретін белгілер.
Дисперсиялық талдау міндеттері:белгіленген немесе кездейсоқ болулары мүмкін бірнеше деңгейлермен сипатталатын факторлардың ықпалын зерттеу.
Мысалы, А факторы – үш деңгейден тұратын аурудың ауырлығы: жеңіл, орта, ауыр.
Фактор- соңғы нәтижеге әсер ететін нәрсе.
Фактордың деңгейі-фактордың нақты жүзеге асуын.
Жауап- өлшенетін белгінің мәні.
Дисперсиялық талдау бірнеше деңгейлермен сипатталатын факторлардың ықпалын оқып үйрену үшін қолданылады.
Айталық,X1,X2,…,Xk- бас жиынтықтары бар болсын.
1. Барлығы қалыпты таралған;
2. Барлық бас жиынтықтардың дисперсиялары бірдей.
Берілген α мәнділік деңгейі бойынша орта мәндердің теңдігі жөніндегі нөлдік жорамалды тексеру керек:
Н ![]() ![]() ![]() ![]()
Фактордың әр деңгейі бойынша элементтердің таңдама топтық орта мәндері: Ауытқулардың квадраттарының жалпы қосындысы:
мұндағы Ауытқулардың квадраттарының факторлық қосындысы:
Ауытқулардың квадраттарының қалдық қосындысы:
Топтар бір фактордың деңгейлері арқылы анықталады. Бас жиынтықтағы айнымалы әр топта қалыпты таралған және барлық топтардың дисперсиялары бірдей. Айырмашылықтын шамасын бағалау үшін таңдама орта мәндердің шашылуын топ ішіндегі мәндердің шашылуымен салыстыру қажет. Салыстырылатын топтар саны фактордың (тәуелсіз айнымалы)деңгейлеріне сәйкес анықталады. Мысалы:фактор - жыл мезгілі болса, онда оның деңгейлері – қыс, көктем, жаз, күз. Салыстыралатын топ саны – 4. Фактор – емдеу тәсілдерінің түрі болса, онда оның деңгейлері: стандартты әдіспен емдеу, жаңа емдеу түріжәне плацебо (бақылау тобы) болуы мүмкін.Салыстырылатын топ саны – 3. Дисперсиялық талдау жүргізу үшін сапалық белгілер (жыныс, профессия) де, сандық белгілер де (иньекция саны,аурулар саны) қолданылады. Таңдама деректерді әдетте кесте түрінде бейнелейді, К деңгейдентұратын А факторы үшін кестенің түрі төмендегідей болады:
11-кесте
Келтірілген кестеде таңдамалар (бақылау топтары) фактор деңгейлеріне сәйкес және баған түрінде орналасқан. Таңдаманың әрбір элементіндегі бірінші индекс –таңдамадағы элементтің нөмірін, ал екінші индекс – топ нөмірін көрсетеді. Топтық орта мән – әр топтағы элементтердің орта арифметикалық мәні: njсаны j – ші таңдаманың көлемі, бақылаудың жалпы саны n = n1+n2+…+nk. Жалпы алғанда, njсаны әртүрлі, алайда біз барлық таңдамалар көлемі тең болған жағдайды қарастырумен шектелеміз. Дисперсиялық талдаудың негізгі идеясытаңдама дисперсияны екі компонентке (құрамдас бөлікке) бөлуге негізделген, олардың біреуі орта мәндердің өзгергіштігінефактордың ықпал етуіне сәйкес келеді (факторлық дисперсия), ал екіншісі кездейсоқ себептерден туған және ортамәндердің өзгергіштігінеықпал етпейтін дисперсия (қалдық дисперсия). Топаралық дисперсия - фактордың таңдама орта мәндердің өзгергіштігіне ықпал етуінен туған дисперсия, оны факторлық дисперсиядеп атайды және MSфактор(Mean Sqare) арқылы белгілейді. Топішілік дисперсия – кездейсоқсебептерден туған және орта мәндердің өзгергіштігіне ықпал етпейтін дисперсия, оны қалдық дисперсиядеп атайды және MSқалдықарқылы белгілейді. Топтық орта мәндердің теңдігі жөніндегі нөлдік жорамалда топаралықдисперсия топішілік дисперсияға ұқсас. Егер салыстырылып отырған топтар арасында айырмашылық бар болса, онда топаралық дисперсия топішілік дисперсиядан үлкен болады. Фишер критерийі осы екі дисперсияның қатынасына негізделген. ANOVA үшін Фишер критерийініңF статистикасы топаралық дисперсияның топішілік дисперсияға қатынасы арқылы анықталады. F статистикасы (к- 1) және (n-к) еркіндік дәрежелеріне сәйкес келетін Фишер таралуына бағынады. Факторлық дисперсия: формуласы арқылы есептеледі. Мұндағы Қалдық дисперсияны есептеу формуласы мұндағы Факторлық дисперсия- топтық орта мәндердің шашырауын сипаттайды Қалдық дисперсия– топтардың ішіндегі шашырауды сипаттайды. |
Дисперсиялық талдауды жүргізу әдісі
К тәуелсіз таңдамалар бар болсын және олардың әрқайсысы жеке топты анықтайды. Таңдамалар көлемдері - nі, орта мәндер және орта квадраттық ауытқулар. Si (i= 1,2,…,k) болсын.
Таңдамалардың жалпы көлемі:n = n1+n2+…+nk
1. Нөлдік және балама жорамалдарды анықтаймыз:
Н0: Бас жиынтықтың барлық топтық орта мәндерітең:
Н1: Бас жиынтықтың барлық топтық орта мәндері тең емес (ең болмағанда бір топтық ортаныңбасқалардан айырмашылығы бар).
2. Қажетті деректерді K таңдамалардан алу. мен есептеу, егер
<
болса,онда Н0 қабылданады,егер
болса, онда Fкритерийін есептейміз.
3. Критерий статистикасын есептеу:Fбақ
4. α мәнділік деңгейіне сәйкес (α = 0,05 немесе α= 0,01) Фишер таралуының сыни мәнін арнайы кестеден табу.
5. F критерийінің статистикасын сыни нүктемен салыстыру
6. Н0жорамалға қатысты шешім қабылдау: Егер Fбақ< Fсыниболса, онда берілген мәнділік деңгейінде нөлдік жорамал қабылданады.
Егер Fбақ> Fсыниболса, онда нөлдік жорамал жоққа шығарылады
және фактордыңықпалы маңызды болып табылады.
Дисперсиялық талдауды қолдануға қойылатын шарттар:
1. Әрбір таңдама басқа таңдамалардан тәуелсіз.
2. Әрбір таңдама зерттелетінбас жиынтықтан кездейсоқ түрде алынған.
3. Бас жиынтық қалыпты таралған.
4. Топтардың бас дисперсиялары бірдей.
Ескерту:Бұл талаптарды орындау аса маңызды. Сондықтандисперсиялықталдауды жүргізбес бұрын алдымен барлық салыстырылатын топтардың таралуын қалыптылыққа тексеру және осы топтардағыдисперсиялардың теңдігін тексеру қажет.
Бұл шарттардың ең болмағанда біреуі бұзылған жағдайда дисперсиялық талдауды қолдануға болмайды. Мұндай жағдайда бір факторлы ANOVA-ның параметрлік емес аналогы Крускал – Уоллис критерийін қолдану қажет.