Charakteristiky variability 9 страница

Z interpretačního hlediska je jistou nevýhodou rozptylu to, že je vyjádřen ve čtvercích měrové jednotky příslušné číselné proměnné.

 

Směrodatná odchylka

 

Variabilitu je rovněž možné popisovat pomocí nezáporné druhé odmocniny z rozptylu, která nese název směrodatná odchylka

 

(1.60)

 

Směrodatná odchylka n hodnot x1, x2, ..., xn, které nemusí být uspořádány, je definována jako kvadratický průměr odchylek jednotlivých hodnot sledované proměnné od jejich aritmetického průměru

 

  (1.61)

 

Směrodatná odchylka udává, jak se v průměru ve zkoumaném statistickém souboru odchylují jednotlivé hodnoty sledované proměnné od jejich aritmetického průměru. Směrodatná odchylka je uvedena ve stejných měrových jednotkách jako sledovaná proměnná, což je její značnou výhodou. Jestliže chceme symbolicky rozlišit směrodatnou odchylku základního souboru a směrodatnou odchylku výběrového souboru, tak směrodatná odchylka základního souboru se označuje zpravidla s a směrodatná odchylka výběrového souboru s.

 

Průměrná odchylka

 

Průměrná odchylka n hodnot, x1, x2, ..., xn, které nemusí být uspořádány, je definována jako aritmetický průměr absolutních hodnot odchylek jednotlivých hodnot sledované proměnné od jejich aritmetického průměru

 

  (1.62)

 

Jsou-li hodnoty proměnné setříděny do tabulky rozdělení četností, vypočítá se průměrná odchylka

 

    (1.63)

 

Průměrná odchylka je uvedena ve stejných měrových jednotkách jako sledovaná proměnná.

 

Kvantilové odchylky

 

Kvantilové odchylkyjsou definovány jako aritmetický průměr kladných odchylek sousedních kvantilů.

Kvartilová odchylka je definována jako aritmetický průměr kladných odchylek sousedních kvartilů

 

  (1.64)

 

V čitateli vztahu (1.64) je kvartilové rozpětí. Kvartilová odchylka se uvádí ve stejných měrových jednotkách jako sledovaná proměnná.

 

Charakteristiky relativní variability

 

Pomocí charakteristik absolutní variability nelze srovnávat variabilitu proměnné u dvou nebo více statistických souborů, které se výrazně liší polohou sledované proměnné, nebo variabilitu dvou nebo více proměnných, které jsou vyjádřeny v různých měrových jednotkách. V těchto případech používáme charakteristiky relativní variability, které vliv polohy proměnné nebo vliv měrové jednotky proměnné vylučují, neboť dávají do poměru charakteristiku absolutní variability k aritmetickému průměru nebo k mediánu.

 

Variační koeficient

 

Variační koeficient je nejznámější charakteristikou relativní variability. Je definován jako podíl směrodatné odchylka a aritmetického průměru

 

  (1.65)

 

Variační koeficient je bezrozměrné číslo, po vynásobení stem udává variabilitu v procentech. Velmi hrubé pravidlo říká, že variační koeficient vyšší než 50 % značí poměrně velkou nesourodost statistického souboru. Variační koeficient po vynásobení stem udává, z kolika procent se směrodatná odchylka podílí na aritmetickém průměru.

Skutečnost, že variační koeficient je možné interpretovat v procentech, může zavádět uživatele v tom smyslu, že za definiční obor variačního koeficientu považují pouze interval od 0 do 1 nebo v procentech od 0 % do 100 %, což je veliký omyl. Protože směrodatná odchylka může být obecně větší než aritmetický průměr vypočtený ze stejných hodnot jako směrodatná odchylka, může být tedy variační koeficient větší než 1 nebo v procentech větší než 100 %. Protože aritmetický průměr může být obecně i záporné číslo a směrodatná odchylka je nezáporné číslo, může být tedy variační koeficient i číslo záporné. Variační koeficient se tedy obecně pohybuje v intervalu (-¥, +¥).

Variační koeficient se používá mimo jiné hlavně tehdy, srovnáváme-li variabilitu hodnot dvou nebo více různorodých proměnných vyjádřených zpravidla v různých měrových jednotkách. Variační koeficient používáme rovněž při srovnávání variability hodnot stejné proměnné ve dvou nebo více statistických souborech, jestliže se aritmetické průměry dané proměnné v těchto statistických souborech podstatně liší.

Rovněž variační koeficient má některé důležité vlastnosti:

1. Přičteme-li ke všem hodnotám, resp. odečteme-li od všech hodnot, proměnné libovolnou kladnou konstantu (a > 0), variační koeficient se zmenší  
 
  (1.66)
 
  resp. zvětší  
 
  (1.67)
 
2. Násobíme-li, resp. dělíme-li, všechny hodnoty proměnné libovolnou nenulovou konstantou (k ≠ 0) variační koeficient se nezmění  
 
  (1.68)
       

 

Ze vztahů (1.66) a (1.67) vyplývá, že i při stejné absolutní variabilitě dvou nebo více statistických souborů mohou mít tyto statistické soubory různou relativní variabilitu, protože při

 

(1.69)

 

je

 

(1.70)

 

Při stejné relativní variabilitě ve dvou nebo více statistických souborech může existovat různá absolutní variabilita těchto statistických souborů.

 

Charakteristika komplexní variability

 

Protože směrodatná odchylka měří objektivně absolutní variabilitu a variační koeficient měří objektivně relativní variabilitu, byla zkonstruována charakteristika komplexní variability hodnot kardinální proměnné, která měří variabilitu hodnot jak z hlediska absolutních rozdílů mezi hodnotami proměnné, tak z hlediska podílů hodnot proměnné.

Charakteristika komplexní variability hodnot kardinální proměnné je z n hodnot x1, x2, ..., xn, které nemusí být uspořádány a kde xi > 0, i = 1, 2, ..., n, definována

 

    (1.71)

 

Upravíme čitatele vztahu (1.71)

 

           

 

neboť platí, že

 

 

 

a

 

 

 

Čitatel vztahu (1.71) je tedy

 

  (1.72)

 

Jestliže dosadíme vztah (1.72) do vztahu (1.71), získáváme

 

   

 

tedy

 

    (1.73)

 

Výraz v závorce vztahu (1.73)

 

    (1.74)

 

je kovariance hodnot proměnné x a logaritmů hodnot proměnné x, kterou značíme c(x, ln x). Charakteristiku komplexní variability hodnot kardinální proměnné můžeme tedy zapsat

 

  (1.75)

 

Charakteristika komplexní variability hodnot kardinální proměnné má opět některé důležité vlastnosti:

1. Přičteme-li ke všem hodnotám proměnné libovolnou kladnou konstantu (a > 0), charakteristika komplexní variability hodnot kardinální proměnné se zmenší.
2. Odečteme-li od všech hodnot proměnné kladnou konstantu a < xmin, charakteristika komplexní variability hodnot kardinální proměnné se zvětší.
3. Násobíme-li všechny hodnoty proměnné kladnou konstantou (k > 0), charakteristika komplexní variability hodnot kardinální proměnné se násobí touto konstantou.

 

Příklad 1.17

Ze 42 hodnot xi, i = 1, 2, …, 42 byl vypočítán aritmetický průměr a rozptyl sx2 = 2,5. Při kontrole bylo zjištěno, že chybí tři jednotky s hodnotami x43 = 4,2, x44 = 7,3 a x45 = 9,6. Opravte uvedený aritmetický průměr a rozptyl.

 

Řešení:

Vyjdeme ze vzorce prostého aritmetického průměru (1.12). Musíme však odlišovat původní (špatnou) hodnotu aritmetického průměru od nové (správné) hodnoty aritmetického průměru. Rovněž původní (špatný) počet statistických jednotek npuv = 42 a nový (správný) počet statistických jednotek nnov = 45 (po přičtení chybějících tří statistických jednotek). Původní aritmetický průměr je

 

 

odtud součet původních 42 hodnot je

 

 

K tomuto součtu původních 42 hodnot je třeba přičíst chybějící tři hodnoty

 

 

Tím jsme získali součet všech 45 hodnot. Nyní vypočteme opravený aritmetický průměr

 

 

tj. správný aritmetický průměr je

 

 

Nyní je třeba opravit rozptyl. Vyjdeme přitom z prostého rozptylu ve výpočtovém tvaru (1.50)

 

 

tedy špatný rozptyl

 

 

odtud součet čtverců původních 42 hodnot

 

 

Potřebujeme ale součet čtverců všech 45 hodnot

 

 

Nyní vypočteme opravený rozptyl všech 45 hodnot

 

 

Opravený rozptyl tedy je

 

 

Příklad 1.18

Sledovali jsme proměnnou x a dodatečně jsme zjistily chyby u dvou jednotek. Místo 90 má být správně 100 a místo 125 má být správně 155. Ostatních 18 údajů je správných. Opravte vypočítaný aritmetický průměr a rozptyl, byl-li aritmetický průměr 115 a rozptyl 900.

 

Řešení:

Počet statistických jednotek se v tomto případě nemění, a tedy npuv = nnov = n = 18 + 2 = 20 (18 správných hodnot a 2 špatné hodnoty). Nejprve opět opravíme vypočítaný aritmetický průměr a opět vyjdeme ze vzorce prostého aritmetického průměru (1.12)

 

 

Odtud součet 20 hodnot, mezi kterými jsou ale i dvě špatné hodnoty, je

 

 

Tento součet 20 hodnot je však špatný, neboť místo 90 je třeba započítat 100 (tedy o 10 více) a místo 125 je třeba započítat 155 (tedy o 30 více). Získáme tak opravený součet 20 hodnot

 

 

Nyní již známe správný součet 20 hodnot a můžeme tedy vypočítat správný aritmetický průměr

 

 

opravený aritmetický průměr je tedy

 

 

Nyní přistoupíme k rozptylu. Opět vyjdeme z prostého rozptylu ve výpočtovém tvaru (1.50)

 

 

odtud součet čtverců 20 hodnot, mezi nimiž jsou i dvě hodnoty nesprávné, je

 

 

Místo 902 je třeba započítat 1002 (nelze přičíst 102) a místo 1252 je třeba započítat 1552 (nelze přičíst 302)

 

 
 

 

což je opravený součet čtverců 20 hodnot. Nyní vypočteme opravený rozptyl

 

 

opravený rozptyl je tedy

 

 

Příklad 1.19

Obchodní firma odebírá určitý druh zboží od čtyř výrobců. První výrobce dodává zboží v průměru za 210 Kč a směrodatná odchylka jeho ceny (cena během roku kolísá) je 30 Kč, dodávky tohoto výrobce tvoří 20 % celkového odběru firmy. Odběrní cena od druhého výrobce je v průměru 198 Kč se směrodatnou odchylkou 32 Kč a jeho podíl na celkových dodávkách firmy je 10 %. Odběrní cena od třetího výrobce je v průměru 220 Kč se směrodatnou odchylkou 34 Kč, podíl tohoto výrobce na celkových dodávkách firmy je 40 %. Podíl posledního výrobce je 30 % a zboží dodává v průměru za 200 Kč se směrodatnou odchylkou 33 Kč. Stanovte průměrnou cenu výrobku a celkový rozptyl ceny, se kterým musí obchodní firma počítat od všech výrobců.

 

Řešení:

Jedná se o čtyři výrobce, statistický soubor je tedy rozdělen do k = 4 dílčích podsouborů, přičemž známe aritmetické průměry v jednotlivých dílčích podsouborech

 

 

směrodatné odchylky v jednotlivých dílčích podsouborech

 

 

a relativní četnosti v jednotlivých dílčích podsouborech

 

 

Nejprve je třeba vypočítat rozptyly six2 v dílčích podsouborech. Potřebné výpočty jsou obsaženy v tabulce 1.34.

 

Tabulka 1.34  
i
0,2 0,1 0,4 0,3 302 = 322 = 342 = 332 = 1 024 1 156 1 089 210 ∙ 0,2 = 198 ∙ 0,1 = 220 ∙ 0,4 = 200 ∙ 0,3 = 19,8 900 ∙ 0,2 = 1 024 ∙ 0,1 = 1 156 ∙ 0,4 = 1 089 ∙ 0,3 = 102,4 462,4 326,7
Celkem X X 1,0   X   209,8   1 071,5
                       

 

               
            (210 − 209,8)2 ∙ 0,2 = (198 − 209,8)2 ∙ 0,1 = (220 − 209,8)2 ∙ 0,4 = (200 − 209,8)2 ∙ 0,3 = 0,008 13,924 41,616 28,812    
              84,360    

 

Z tabulky 1.34 získáváme

 

 

Protože neznáme absolutní četnosti ni, i = 1, 2, 3, 4, v jednotlivých dílčích podsouborech, ale známe pouze relativní četnosti pi, i = 1, 2, 3, 4, k výpočtu použijeme vždy vzorec vyjádřený pomocí relativních četností. Celkový aritmetický průměr za celý statistický soubor dohromady vypočteme s využitím vztahu (1.13)