Charakteristiky variability 3 страница
Zpracování dat o slovní proměnné spočívá ve vytvoření statistické tabulky, tzv. tabulky rozdělení četností, jejíž obecné schéma uvádí tabulka 1.1.
Tabulka 1.1 | ||||
Obměna | Četnost | |||
proměnné | absolutní | relativní | ||
ai | ni | ![]() | ||
a1
a2
![]() | n1
n2
![]() | p1
p2
![]() | ||
Celkem | ![]() | ![]() |
V políčkách tabulky jsou číselné hodnoty nebo smluvené značky, z nichž jsou nejčastější:
· x | – pro číselné hodnoty menší než polovina použité měrné jednotky, – pro neznámou hodnotu, – pro případy, kdy by hodnota neměla logicky smysl. |
Jedná-li se o nominální proměnnou, jejíž obměny nelze seřadit podle velikosti, nemá smysl postupné přičítání jak absolutních, tak relativních četností, tj. nemají smysl kumulativní četnosti.
Zpracování dat o slovní proměnné do formy grafu spočívá ve znázornění struktury statistického souboru podle obměn uvažované slovní proměnné grafem či diagramem. Nejčastěji se v tomto případě používají sloupkové diagramy, u kterých výšky sloupků představují počet prvků příslušejících dané obměně slovní proměnné a šířky sloupků jsou stejné, a plošné grafy, u kterých obsah určitého geometrického obrazce v rovině odpovídá 100 % a části tohoto obrazce v rovině odpovídají příslušným relativním četnostem v procentech. Z nejčastěji používaných plošných grafů můžeme uvést výsečové grafy.
Modus slovní proměnné, neboli modální obměna, je obměna s největší četností, značíme . Variabilita představuje měnlivost či nepodobnost hodnot uvažované proměnné. Variabilita slovní proměnné se nazývá mutabilita. Variabilitu slovní proměnné měříme mírou mutability
![]() | (1.4) |
Výraz ve vzorci (1.4)
![]() | (1.5) |
nazýváme nominální variance. Protože platí
![]() |
můžeme míru mutability (1.4) zapsat také
![]() | (1.6) |
a nominální varianci
![]() | (1.7) |
Míra mutability se pohybuje od nuly (při nulové mutabilitě) do jedné (při maximální mutabilitě). Nominální variance se pohybuje od nuly (při nulové mutabilitě) do čísla o něco málo menšího než jedna (při maximální mutabilitě).
Příklad 1.1
U 50 náhodně vybraných studentů druhého ročníku Vysoké školy finanční a správní byly zjištěny údaje týkající se nejčastěji používaného dopravního prostředku z místa bydliště do školy, které se nacházejí v tabulce 1.2.
Tabulka 1.2 | ||||||
Číslo studenta | Dopravní prostředek | Číslo studenta | Dopravní prostředek | |||
tramvaj autobus vlak metro metro vlak tramvaj metro autobus autobus autobus vlak metro auto vlak vlak metro metro auto autobus autobus tramvaj autobus vlak metro | vlak autobus vlak autobus vlak vlak vlak auto autobus vlak vlak vlak vlak autobus vlak auto autobus vlak tramvaj tramvaj vlak metro tramvaj metro metro |
Sestavte tabulku rozdělení četností nejčastěji používaného dopravního prostředku z místa bydliště do školy 50 náhodně vybraných studentů Vysoké školy finanční a správní. Získané četnosti interpretujte a znázorněte graficky.
Řešení:
Nejčastěji používaný dopravní prostředek z místa bydliště do školy je slovní nominální proměnná, která má k = 5 obměn: auto, autobus, metro, tramvaj a vlak. Z tabulky 1.2 je zřejmé, že z výběrového statistického souboru 50 studentů používají n1 = 4 studenti nejčastěji při cestě do školy auto, n2 = 12 studentů autobus, n3 = 10 studentů metro, n4 = 6 studentů tramvaj a n5 = 18 studentů vlak. Rozsah výběrového statistického souboru n = 50 studentů. Příslušné relativní četnosti vypočteme s využitím vztahu (1.2)
![]() |
![]() |
![]() |
![]() |
![]() |
Nyní již sestavíme tabulku rozdělení četností, viz tabulka 1.3.
Tabulka 1.3 | ||||
Dopravní | Četnosti | |||
prostředek | absolutní | relativní | ||
auto autobus metro tramvaj vlak | 0,08 0,24 0,20 0,12 0,36 | |||
Celkem | 1,00 |
Je vidět, že z výběrového statistického souboru 50 studentů jezdí pouze 4 studenti nejčastěji do školy autem, což představuje 8 % studentů (po vynásobení relativních četností stem), 12 studentů, kteří představují 24 % studentů, jezdí nejčastěji do školy autobusem, 10 studentů, což je 20 % studentů, jezdí nejčastěji do školy metrem, 6 studentů, tj. 12 %, jezdí nejčastěji do školy tramvají a nejvíce studentů, tj. 18, kteří tvoří 36 % studentů, jezdí nejčastěji do školy vlakem. Grafickým zobrazením struktury slovní proměnné může být výsečový graf, viz obrázek 1.1, nebo sloupkový graf, viz obrázek 1.2.
Obrázek 1.1
Obrázek 1.2
Příklad 1.2
Tabulka 1.4 obsahuje údaje o druhu vlastnictví bytu 40 náhodně vybraných domácností.
Tabulka 1.4 | |||||||
Číslo domácnosti | Druh vlastnictví bytu | Číslo domácnosti | Druh vlastnictví bytu | ||||
nájemní nájemní vlastní družstevní vlastní nájemní družstevní družstevní vlastní vlastní družstevní družstevní nájemní nájemní vlastní vlastní nájemní družstevní vlastní družstevní | vlastní družstevní družstevní družstevní nájemní nájemní družstevní vlastní vlastní vlastní nájemní družstevní nájemní nájemní vlastní družstevní vlastní nájemní družstevní družstevní | ||||||
Vypočtěte míru mutability a nominální varianci.
Řešení:
Rozsah výběrového statistického souboru n = 40 domácností. Druh vlastnictví bytu je slovní nominální proměnná, která má k = 3 obměny: družstevní, nájemní a vlastní, přičemž n1 = 15 domácností bydlí v družstevním bytě, n2 = 12 domácností bydlí v nájemním bytě a n3 = 13 domácností bydlí ve vlastním bytě. K výpočtu použijeme tabulku 1.5.
Tabulka 1.5 | ||||||
Druh vlastnictví bytu |
![]() |
![]() |
![]() |
![]() | ||
družstevní nájemní vlastní | ||||||
Celkem | 1 062 |
Z tabulky 1.5 získáváme
![]() | a | ![]() |
S využitím vztahu (1.6) vypočteme míru mutability
![]() |
a dosazením do vztahu (1.5) vypočteme nominální varianci
![]() |
Ukazuje se, že druh vlastnictví bytu je dosti proměnlivý, 68,1 % dvojic domácností mělo různý druh vlastnictví bytu.
Cvičení
1.U 50 náhodně vybraných studentů druhého ročníku Vysoké školy finanční a správní byly zjištěny údaje týkající se hlavního studovaného jazyka, které se nacházejí v tabulce 1.6.
Tabulka 1.6 | ||||||
Číslo studenta | Hlavní studovaný jazyk | Číslo studenta | Hlavní studovaný jazyk | |||
angličtina angličtina angličtina angličtina angličtina angličtina angličtina němčina angličtina angličtina angličtina francouzština angličtina angličtina angličtina angličtina angličtina angličtina němčina němčina němčina angličtina angličtina angličtina angličtina | angličtina angličtina němčina němčina ruština angličtina němčina ruština ruština angličtina němčina němčina angličtina ruština angličtina angličtina angličtina francouzština francouzština angličtina francouzština francouzština francouzština angličtina němčina |
Sestavte tabulku rozdělení četností hlavního studovaného jazyka 50 náhodně vybraných studentů Vysoké školy finanční a správní. Určete modus.
2. Tabulka 1.7 obsahuje údaje o rodinném stavu 34 náhodně vybraných pedagogů Vysoké školy finanční a správní.
Tabulka 1.7 | ||||||
Číslo pedagoga | Rodinný stav | Číslo pedagoga | Rodinný stav | |||
ženatý vdovec ženatý vdaná vdaná svobodný ženatý ženatý svobodný vdaná vdaná ženatý ženatý svobodný rozvedený ženatý svobodná | rozvedená ženatý svobodná vdova vdaná vdaná ženatý vdaná vdaná ženatý ženatý ženatý svobodná svobodný rozvedený ženatý vdaná |
Vypočtěte míru mutability a nominální varianci.
Výsledky
1.
Hlavní studovaný | Četnosti | |
Jazyk | absolutní | relativní |
angličtina francouzština němčina ruština | 0,60 0,12 0,20 0,08 | |
Celkem | 1,00 |
angličtina
2.
Rodinný stav | ![]() |
ženatý/vdaná svobodný/svobodná rozvedený/rozvedená vdovec/vdova | |
Celkem |
M = 0,544
nomvar = 0,528
1.4 Elementární zpracování dat o číselné proměnné
1.4.1 Prosté rozdělení četností
V případě číselné proměnné nabývající pouze několika málo obměn se tabulka rozdělení četností tvoří stejným způsobem, jako tabulka rozdělení četností u slovní proměnné pouze s tím rozdílem, že se obměny proměnné uspořádají podle velikosti. Proto u číselné proměnné mají smysl i kumulativní absolutní četnosti a kumulativní relativní četnosti, které vznikají postupným přičítáním absolutních četností (v případě kumulativních absolutních četností) a postupným přičítáním relativních četností (v případě kumulativních relativních četností). Výsledkem zpracování dat o číselné proměnné, která nabývá pouze několika málo obměn, je tabulka rozdělení absolutních a relativních četností a kumulativních absolutních a relativních četností, jejíž obecné schéma udává tabulka 1.8.
Tabulka 1.8 | ||||
Obměna | Četnost | Kumulativní četnost | ||
proměnné | absolutní | relativní | absolutní | relativní |
xi | ni | ![]() | ||
x1
x2
x3
![]() | n1
n2
n3
![]() | p1
p2
p3
![]() | n1
n1 + n2
n1 + n2 + n3
![]() ![]() | p1
p1 + p2
p1 + p2 + p3
![]() ![]() |
Celkem | ![]() | ![]() | ![]() | ![]() |
V tabulce 1.8 jsou obměny proměnné xi, i = 1, 2, ..., k, uspořádané vzestupně od nejmenší po největší tak, že x1 < x2 < x3 < ... < xk . Kumulativní absolutní četnosti informují o tom, kolik statistických jednotek souboru má hodnotu sledované proměnné menší nebo rovnou příslušné obměně proměnné, a kumulativní relativní četnosti po vynásobení stem podávají informaci o tom, jaké procento statistických jednotek souboru má hodnotu proměnné menší nebo rovnou dané obměně proměnné.
Jedná-li se o elementární zpracování hodnot číselné proměnné s několika málo obměnami, můžeme znázornit rozdělení četností proměnné v pravoúhlé soustavě souřadnic tak, že obměny proměnné x1, x2, x3, ..., xk znázorníme na vodorovné ose a jejich absolutní či relativní četnosti na svislé ose, získáme tak body (x1, n1), (x2, n2), (x3, n3), ..., (xk, nk) v případě absolutních četností a body (x1, p1), (x2, p2), (x3, p3), ..., (xk, pk) v případě relativních četností. Jestliže tyto body spojíme, získáváme polygon četností, neboli mnohoúhelník četností. Srovnáváme-li rozdělení četností dané proměnné v různých statistických souborech s různými rozsahy, je vhodnější na svislou osu nanášet relativní četnosti. Nanášíme-li na svislou osu kumulativní absolutní četnosti nebo lépe kumulativní relativní četnosti, získáváme neklesající lomenou čáru kumulativních četností, které říkáme (název není zcela přesný) součtová křivka či S–křivka nebo ogiva, což znamená lomený oblouk.
Pro grafické znázorňování struktury souboru podle obměn číselné proměnné můžeme rovněž sestavovat sloupkové grafy i různé plošné grafy, např. výsečové grafy.
Obměna s největší absolutní i relativní četností vzhledem k nejbližšímu okolí se nazývá modus či modální obměna číselné proměnné a v této obměně proměnné je vrchol rozdělení četností.
Podle počtu vrcholů rozlišujeme jednovrcholová rozdělení četností, neboli unimodální rozdělení četností, která mají jeden vrchol a vyskytují se nejčastěji, a vícevrcholová rozdělení četností, neboli multimodální rozdělení četností, která mají více vrcholů. V případě jednovrcholových rozdělení četností rozlišujeme dva druhy těchto rozdělení, a sice v prvním případě modus leží mezi minimální a maximální obměnou proměnné, viz obrázek 1.3, a v druhém případě se jedná o J–rozdělení, kdy modus je buď minimální nebo maximální obměna proměnné, viz obrázek 1.4.
Obrázek 1.3