Charakteristiky variability 3 страница

Zpracování dat o slovní proměnné spočívá ve vytvoření statistické tabulky, tzv. tabulky rozdělení četností, jejíž obecné schéma uvádí tabulka 1.1.

 

  Tabulka 1.1
  Obměna Četnost  
  proměnné absolutní relativní  
  ai ni  
  a1 a2 ak n1 n2 nk p1 p2 pk  
    Celkem  

 

V políčkách tabulky jsou číselné hodnoty nebo smluvené značky, z nichž jsou nejčastější:

· x – pro číselné hodnoty menší než polovina použité měrné jednotky, – pro neznámou hodnotu, – pro případy, kdy by hodnota neměla logicky smysl.

Jedná-li se o nominální proměnnou, jejíž obměny nelze seřadit podle velikosti, nemá smysl postupné přičítání jak absolutních, tak relativních četností, tj. nemají smysl kumulativní četnosti.

Zpracování dat o slovní proměnné do formy grafu spočívá ve znázornění struktury statistického souboru podle obměn uvažované slovní proměnné grafem či diagramem. Nejčastěji se v tomto případě používají sloupkové diagramy, u kterých výšky sloupků představují počet prvků příslušejících dané obměně slovní proměnné a šířky sloupků jsou stejné, a plošné grafy, u kterých obsah určitého geometrického obrazce v rovině odpovídá 100 % a části tohoto obrazce v rovině odpovídají příslušným relativním četnostem v procentech. Z nejčastěji používaných plošných grafů můžeme uvést výsečové grafy.

Modus slovní proměnné, neboli modální obměna, je obměna s největší četností, značíme . Variabilita představuje měnlivost či nepodobnost hodnot uvažované proměnné. Variabilita slovní proměnné se nazývá mutabilita. Variabilitu slovní proměnné měříme mírou mutability

 

  (1.4)

 

Výraz ve vzorci (1.4)

 

  (1.5)

 

nazýváme nominální variance. Protože platí

 

 

můžeme míru mutability (1.4) zapsat také

 

  (1.6)

 

a nominální varianci

 

  (1.7)

 

Míra mutability se pohybuje od nuly (při nulové mutabilitě) do jedné (při maximální mutabilitě). Nominální variance se pohybuje od nuly (při nulové mutabilitě) do čísla o něco málo menšího než jedna (při maximální mutabilitě).

Příklad 1.1

U 50 náhodně vybraných studentů druhého ročníku Vysoké školy finanční a správní byly zjištěny údaje týkající se nejčastěji používaného dopravního prostředku z místa bydliště do školy, které se nacházejí v tabulce 1.2.

 

 

  Tabulka 1.2
  Číslo studenta Dopravní prostředek   Číslo studenta Dopravní prostředek  
  tramvaj autobus vlak metro metro vlak tramvaj metro autobus autobus autobus vlak metro auto vlak vlak metro metro auto autobus autobus tramvaj autobus vlak metro   vlak autobus vlak autobus vlak vlak vlak auto autobus vlak vlak vlak vlak autobus vlak auto autobus vlak tramvaj tramvaj vlak metro tramvaj metro metro  

 

Sestavte tabulku rozdělení četností nejčastěji používaného dopravního prostředku z místa bydliště do školy 50 náhodně vybraných studentů Vysoké školy finanční a správní. Získané četnosti interpretujte a znázorněte graficky.

 

Řešení:

Nejčastěji používaný dopravní prostředek z místa bydliště do školy je slovní nominální proměnná, která má k = 5 obměn: auto, autobus, metro, tramvaj a vlak. Z tabulky 1.2 je zřejmé, že z výběrového statistického souboru 50 studentů používají n1 = 4 studenti nejčastěji při cestě do školy auto, n2 = 12 studentů autobus, n3 = 10 studentů metro, n4 = 6 studentů tramvaj a n5 = 18 studentů vlak. Rozsah výběrového statistického souboru n = 50 studentů. Příslušné relativní četnosti vypočteme s využitím vztahu (1.2)

 

 
 
 
 

 

Nyní již sestavíme tabulku rozdělení četností, viz tabulka 1.3.

 

  Tabulka 1.3
  Dopravní Četnosti  
  prostředek absolutní relativní  
  auto autobus metro tramvaj vlak 0,08 0,24 0,20 0,12 0,36  
  Celkem 1,00  

 

Je vidět, že z výběrového statistického souboru 50 studentů jezdí pouze 4 studenti nejčastěji do školy autem, což představuje 8 % studentů (po vynásobení relativních četností stem), 12 studentů, kteří představují 24 % studentů, jezdí nejčastěji do školy autobusem, 10 studentů, což je 20 % studentů, jezdí nejčastěji do školy metrem, 6 studentů, tj. 12 %, jezdí nejčastěji do školy tramvají a nejvíce studentů, tj. 18, kteří tvoří 36 % studentů, jezdí nejčastěji do školy vlakem. Grafickým zobrazením struktury slovní proměnné může být výsečový graf, viz obrázek 1.1, nebo sloupkový graf, viz obrázek 1.2.

 

Obrázek 1.1

Obrázek 1.2

 

Příklad 1.2

Tabulka 1.4 obsahuje údaje o druhu vlastnictví bytu 40 náhodně vybraných domácností.

 

  Tabulka 1.4
  Číslo domácnosti Druh vlastnictví bytu   Číslo domácnosti Druh vlastnictví bytu  
  nájemní nájemní vlastní družstevní vlastní nájemní družstevní družstevní vlastní vlastní družstevní družstevní nájemní nájemní vlastní vlastní nájemní družstevní vlastní družstevní   vlastní družstevní družstevní družstevní nájemní nájemní družstevní vlastní vlastní vlastní nájemní družstevní nájemní nájemní vlastní družstevní vlastní nájemní družstevní družstevní  
               

 

Vypočtěte míru mutability a nominální varianci.

 

 

Řešení:

Rozsah výběrového statistického souboru n = 40 domácností. Druh vlastnictví bytu je slovní nominální proměnná, která má k = 3 obměny: družstevní, nájemní a vlastní, přičemž n1 = 15 domácností bydlí v družstevním bytě, n2 = 12 domácností bydlí v nájemním bytě a n3 = 13 domácností bydlí ve vlastním bytě. K výpočtu použijeme tabulku 1.5.

 

  Tabulka 1.5
  Druh vlastnictví bytu          
  družstevní nájemní vlastní  
  Celkem   1 062  

 

Z tabulky 1.5 získáváme

 

  a

 

S využitím vztahu (1.6) vypočteme míru mutability

 

 

a dosazením do vztahu (1.5) vypočteme nominální varianci

 

 

Ukazuje se, že druh vlastnictví bytu je dosti proměnlivý, 68,1 % dvojic domácností mělo různý druh vlastnictví bytu.

 

Cvičení

 

1.U 50 náhodně vybraných studentů druhého ročníku Vysoké školy finanční a správní byly zjištěny údaje týkající se hlavního studovaného jazyka, které se nacházejí v tabulce 1.6.

 

 

  Tabulka 1.6
  Číslo studenta Hlavní studovaný jazyk   Číslo studenta Hlavní studovaný jazyk  
  angličtina angličtina angličtina angličtina angličtina angličtina angličtina němčina angličtina angličtina angličtina francouzština angličtina angličtina angličtina angličtina angličtina angličtina němčina němčina němčina angličtina angličtina angličtina angličtina   angličtina angličtina němčina němčina ruština angličtina němčina ruština ruština angličtina němčina němčina angličtina ruština angličtina angličtina angličtina francouzština francouzština angličtina francouzština francouzština francouzština angličtina němčina  

 

Sestavte tabulku rozdělení četností hlavního studovaného jazyka 50 náhodně vybraných studentů Vysoké školy finanční a správní. Určete modus.

 

2. Tabulka 1.7 obsahuje údaje o rodinném stavu 34 náhodně vybraných pedagogů Vysoké školy finanční a správní.

 

 

  Tabulka 1.7
  Číslo pedagoga   Rodinný stav   Číslo pedagoga   Rodinný stav  
  ženatý vdovec ženatý vdaná vdaná svobodný ženatý ženatý svobodný vdaná vdaná ženatý ženatý svobodný rozvedený ženatý svobodná   rozvedená ženatý svobodná vdova vdaná vdaná ženatý vdaná vdaná ženatý ženatý ženatý svobodná svobodný rozvedený ženatý vdaná  

 

Vypočtěte míru mutability a nominální varianci.

 

Výsledky

1.

Hlavní studovaný Četnosti
Jazyk absolutní relativní
angličtina francouzština němčina ruština 0,60 0,12 0,20 0,08
Celkem 1,00

angličtina

 

2.

Rodinný stav
ženatý/vdaná svobodný/svobodná rozvedený/rozvedená vdovec/vdova
Celkem

M = 0,544

nomvar = 0,528

1.4 Elementární zpracování dat o číselné proměnné

1.4.1 Prosté rozdělení četností

 

V případě číselné proměnné nabývající pouze několika málo obměn se tabulka rozdělení četností tvoří stejným způsobem, jako tabulka rozdělení četností u slovní proměnné pouze s tím rozdílem, že se obměny proměnné uspořádají podle velikosti. Proto u číselné proměnné mají smysl i kumulativní absolutní četnosti a kumulativní relativní četnosti, které vznikají postupným přičítáním absolutních četností (v případě kumulativních absolutních četností) a postupným přičítáním relativních četností (v případě kumulativních relativních četností). Výsledkem zpracování dat o číselné proměnné, která nabývá pouze několika málo obměn, je tabulka rozdělení absolutních a relativních četností a kumulativních absolutních a relativních četností, jejíž obecné schéma udává tabulka 1.8.

 

Tabulka 1.8
Obměna Četnost Kumulativní četnost
proměnné absolutní relativní absolutní relativní
xi ni    
x1 x2 x3 xk n1 n2 n3 nk p1 p2 p3 pk n1 n1 + n2 n1 + n2 + n3 p1 p1 + p2 p1 + p2 + p3
  Celkem

 

V tabulce 1.8 jsou obměny proměnné xi, i = 1, 2, ..., k, uspořádané vzestupně od nejmenší po největší tak, že x1 < x2 < x3 < ... < xk . Kumulativní absolutní četnosti informují o tom, kolik statistických jednotek souboru má hodnotu sledované proměnné menší nebo rovnou příslušné obměně proměnné, a kumulativní relativní četnosti po vynásobení stem podávají informaci o tom, jaké procento statistických jednotek souboru má hodnotu proměnné menší nebo rovnou dané obměně proměnné.

Jedná-li se o elementární zpracování hodnot číselné proměnné s několika málo obměnami, můžeme znázornit rozdělení četností proměnné v pravoúhlé soustavě souřadnic tak, že obměny proměnné x1, x2, x3, ..., xk znázorníme na vodorovné ose a jejich absolutní či relativní četnosti na svislé ose, získáme tak body (x1, n1), (x2, n2), (x3, n3), ..., (xk, nk) v případě absolutních četností a body (x1, p1), (x2, p2), (x3, p3), ..., (xk, pk) v případě relativních četností. Jestliže tyto body spojíme, získáváme polygon četností, neboli mnohoúhelník četností. Srovnáváme-li rozdělení četností dané proměnné v různých statistických souborech s různými rozsahy, je vhodnější na svislou osu nanášet relativní četnosti. Nanášíme-li na svislou osu kumulativní absolutní četnosti nebo lépe kumulativní relativní četnosti, získáváme neklesající lomenou čáru kumulativních četností, které říkáme (název není zcela přesný) součtová křivka či S–křivka nebo ogiva, což znamená lomený oblouk.

Pro grafické znázorňování struktury souboru podle obměn číselné proměnné můžeme rovněž sestavovat sloupkové grafy i různé plošné grafy, např. výsečové grafy.

Obměna s největší absolutní i relativní četností vzhledem k nejbližšímu okolí se nazývá modus či modální obměna číselné proměnné a v této obměně proměnné je vrchol rozdělení četností.

Podle počtu vrcholů rozlišujeme jednovrcholová rozdělení četností, neboli unimodální rozdělení četností, která mají jeden vrchol a vyskytují se nejčastěji, a vícevrcholová rozdělení četností, neboli multimodální rozdělení četností, která mají více vrcholů. V případě jednovrcholových rozdělení četností rozlišujeme dva druhy těchto rozdělení, a sice v prvním případě modus leží mezi minimální a maximální obměnou proměnné, viz obrázek 1.3, a v druhém případě se jedná o J–rozdělení, kdy modus je buď minimální nebo maximální obměna proměnné, viz obrázek 1.4.

 

Obrázek 1.3