Charakteristiky variability 9 страница

⇐ Назад

Z interpretačního hlediska je jistou nevýhodou rozptylu to, že je vyjádřen ve čtvercích měrové jednotky příslušné číselné proměnné.

Směrodatná odchylka

Variabilitu je rovněž možné popisovat pomocí nezáporné druhé odmocniny z rozptylu, která nese název směrodatná odchylka

(1.60)

Směrodatná odchylka n hodnot x₁, x₂, ..., x_n, které nemusí být uspořádány, je definována jako kvadratický průměr odchylek jednotlivých hodnot sledované proměnné od jejich aritmetického průměru

(1.61)

Směrodatná odchylka udává, jak se v průměru ve zkoumaném statistickém souboru odchylují jednotlivé hodnoty sledované proměnné od jejich aritmetického průměru. Směrodatná odchylka je uvedena ve stejných měrových jednotkách jako sledovaná proměnná, což je její značnou výhodou. Jestliže chceme symbolicky rozlišit směrodatnou odchylku základního souboru a směrodatnou odchylku výběrového souboru, tak směrodatná odchylka základního souboru se označuje zpravidla s a směrodatná odchylka výběrového souboru s.

Průměrná odchylka

Průměrná odchylka n hodnot, x₁, x₂, ..., x_n, které nemusí být uspořádány, je definována jako aritmetický průměr absolutních hodnot odchylek jednotlivých hodnot sledované proměnné od jejich aritmetického průměru

(1.62)

Jsou-li hodnoty proměnné setříděny do tabulky rozdělení četností, vypočítá se průměrná odchylka

(1.63)

Průměrná odchylka je uvedena ve stejných měrových jednotkách jako sledovaná proměnná.

Kvantilové odchylky

Kvantilové odchylkyjsou definovány jako aritmetický průměr kladných odchylek sousedních kvantilů.

Kvartilová odchylka je definována jako aritmetický průměr kladných odchylek sousedních kvartilů

(1.64)

V čitateli vztahu (1.64) je kvartilové rozpětí. Kvartilová odchylka se uvádí ve stejných měrových jednotkách jako sledovaná proměnná.

Charakteristiky relativní variability

Pomocí charakteristik absolutní variability nelze srovnávat variabilitu proměnné u dvou nebo více statistických souborů, které se výrazně liší polohou sledované proměnné, nebo variabilitu dvou nebo více proměnných, které jsou vyjádřeny v různých měrových jednotkách. V těchto případech používáme charakteristiky relativní variability, které vliv polohy proměnné nebo vliv měrové jednotky proměnné vylučují, neboť dávají do poměru charakteristiku absolutní variability k aritmetickému průměru nebo k mediánu.

Variační koeficient

Variační koeficient je nejznámější charakteristikou relativní variability. Je definován jako podíl směrodatné odchylka a aritmetického průměru

(1.65)

Variační koeficient je bezrozměrné číslo, po vynásobení stem udává variabilitu v procentech. Velmi hrubé pravidlo říká, že variační koeficient vyšší než 50 % značí poměrně velkou nesourodost statistického souboru. Variační koeficient po vynásobení stem udává, z kolika procent se směrodatná odchylka podílí na aritmetickém průměru.

Skutečnost, že variační koeficient je možné interpretovat v procentech, může zavádět uživatele v tom smyslu, že za definiční obor variačního koeficientu považují pouze interval od 0 do 1 nebo v procentech od 0 % do 100 %, což je veliký omyl. Protože směrodatná odchylka může být obecně větší než aritmetický průměr vypočtený ze stejných hodnot jako směrodatná odchylka, může být tedy variační koeficient větší než 1 nebo v procentech větší než 100 %. Protože aritmetický průměr může být obecně i záporné číslo a směrodatná odchylka je nezáporné číslo, může být tedy variační koeficient i číslo záporné. Variační koeficient se tedy obecně pohybuje v intervalu (-¥, +¥).

Variační koeficient se používá mimo jiné hlavně tehdy, srovnáváme-li variabilitu hodnot dvou nebo více různorodých proměnných vyjádřených zpravidla v různých měrových jednotkách. Variační koeficient používáme rovněž při srovnávání variability hodnot stejné proměnné ve dvou nebo více statistických souborech, jestliže se aritmetické průměry dané proměnné v těchto statistických souborech podstatně liší.

Rovněž variační koeficient má některé důležité vlastnosti:

1.	Přičteme-li ke všem hodnotám, resp. odečteme-li od všech hodnot, proměnné libovolnou kladnou konstantu (a > 0), variační koeficient se zmenší

	(1.66)

	resp. zvětší

	(1.67)

2.	Násobíme-li, resp. dělíme-li, všechny hodnoty proměnné libovolnou nenulovou konstantou (k ≠ 0) variační koeficient se nezmění

	(1.68)

Ze vztahů (1.66) a (1.67) vyplývá, že i při stejné absolutní variabilitě dvou nebo více statistických souborů mohou mít tyto statistické soubory různou relativní variabilitu, protože při

(1.69)

(1.70)

Při stejné relativní variabilitě ve dvou nebo více statistických souborech může existovat různá absolutní variabilita těchto statistických souborů.

Charakteristika komplexní variability

Protože směrodatná odchylka měří objektivně absolutní variabilitu a variační koeficient měří objektivně relativní variabilitu, byla zkonstruována charakteristika komplexní variability hodnot kardinální proměnné, která měří variabilitu hodnot jak z hlediska absolutních rozdílů mezi hodnotami proměnné, tak z hlediska podílů hodnot proměnné.

Charakteristika komplexní variability hodnot kardinální proměnné je z n hodnot x₁, x₂, ..., x_n, které nemusí být uspořádány a kde x_i > 0, i = 1, 2, ..., n, definována

(1.71)

Upravíme čitatele vztahu (1.71)

neboť platí, že

Čitatel vztahu (1.71) je tedy

(1.72)

Jestliže dosadíme vztah (1.72) do vztahu (1.71), získáváme

tedy

(1.73)

Výraz v závorce vztahu (1.73)

(1.74)

je kovariance hodnot proměnné x a logaritmů hodnot proměnné x, kterou značíme c(x, ln x). Charakteristiku komplexní variability hodnot kardinální proměnné můžeme tedy zapsat

(1.75)

Charakteristika komplexní variability hodnot kardinální proměnné má opět některé důležité vlastnosti:

1.	Přičteme-li ke všem hodnotám proměnné libovolnou kladnou konstantu (a > 0), charakteristika komplexní variability hodnot kardinální proměnné se zmenší.
2.	Odečteme-li od všech hodnot proměnné kladnou konstantu a < x_min, charakteristika komplexní variability hodnot kardinální proměnné se zvětší.
3.	Násobíme-li všechny hodnoty proměnné kladnou konstantou (k > 0), charakteristika komplexní variability hodnot kardinální proměnné se násobí touto konstantou.

Příklad 1.17

Ze 42 hodnot x_i, i = 1, 2, …, 42 byl vypočítán aritmetický průměr a rozptyl s_x² = 2,5. Při kontrole bylo zjištěno, že chybí tři jednotky s hodnotami x₄₃ = 4,2, x₄₄ = 7,3 a x₄₅ = 9,6. Opravte uvedený aritmetický průměr a rozptyl.

Řešení:

Vyjdeme ze vzorce prostého aritmetického průměru (1.12). Musíme však odlišovat původní (špatnou) hodnotu aritmetického průměru od nové (správné) hodnoty aritmetického průměru. Rovněž původní (špatný) počet statistických jednotek n_puv = 42 a nový (správný) počet statistických jednotek n_nov = 45 (po přičtení chybějících tří statistických jednotek). Původní aritmetický průměr je

odtud součet původních 42 hodnot je

K tomuto součtu původních 42 hodnot je třeba přičíst chybějící tři hodnoty

Tím jsme získali součet všech 45 hodnot. Nyní vypočteme opravený aritmetický průměr

tj. správný aritmetický průměr je

Nyní je třeba opravit rozptyl. Vyjdeme přitom z prostého rozptylu ve výpočtovém tvaru (1.50)

tedy špatný rozptyl

odtud součet čtverců původních 42 hodnot

Potřebujeme ale součet čtverců všech 45 hodnot

Nyní vypočteme opravený rozptyl všech 45 hodnot

Opravený rozptyl tedy je

Příklad 1.18

Sledovali jsme proměnnou x a dodatečně jsme zjistily chyby u dvou jednotek. Místo 90 má být správně 100 a místo 125 má být správně 155. Ostatních 18 údajů je správných. Opravte vypočítaný aritmetický průměr a rozptyl, byl-li aritmetický průměr 115 a rozptyl 900.

Řešení:

Počet statistických jednotek se v tomto případě nemění, a tedy n_puv = n_nov = n = 18 + 2 = 20 (18 správných hodnot a 2 špatné hodnoty). Nejprve opět opravíme vypočítaný aritmetický průměr a opět vyjdeme ze vzorce prostého aritmetického průměru (1.12)

Odtud součet 20 hodnot, mezi kterými jsou ale i dvě špatné hodnoty, je

Tento součet 20 hodnot je však špatný, neboť místo 90 je třeba započítat 100 (tedy o 10 více) a místo 125 je třeba započítat 155 (tedy o 30 více). Získáme tak opravený součet 20 hodnot

Nyní již známe správný součet 20 hodnot a můžeme tedy vypočítat správný aritmetický průměr

opravený aritmetický průměr je tedy

Nyní přistoupíme k rozptylu. Opět vyjdeme z prostého rozptylu ve výpočtovém tvaru (1.50)

odtud součet čtverců 20 hodnot, mezi nimiž jsou i dvě hodnoty nesprávné, je

Místo 90² je třeba započítat 100² (nelze přičíst 10²) a místo 125² je třeba započítat 155² (nelze přičíst 30²)

což je opravený součet čtverců 20 hodnot. Nyní vypočteme opravený rozptyl

opravený rozptyl je tedy

Příklad 1.19

Obchodní firma odebírá určitý druh zboží od čtyř výrobců. První výrobce dodává zboží v průměru za 210 Kč a směrodatná odchylka jeho ceny (cena během roku kolísá) je 30 Kč, dodávky tohoto výrobce tvoří 20 % celkového odběru firmy. Odběrní cena od druhého výrobce je v průměru 198 Kč se směrodatnou odchylkou 32 Kč a jeho podíl na celkových dodávkách firmy je 10 %. Odběrní cena od třetího výrobce je v průměru 220 Kč se směrodatnou odchylkou 34 Kč, podíl tohoto výrobce na celkových dodávkách firmy je 40 %. Podíl posledního výrobce je 30 % a zboží dodává v průměru za 200 Kč se směrodatnou odchylkou 33 Kč. Stanovte průměrnou cenu výrobku a celkový rozptyl ceny, se kterým musí obchodní firma počítat od všech výrobců.

Řešení:

Jedná se o čtyři výrobce, statistický soubor je tedy rozdělen do k = 4 dílčích podsouborů, přičemž známe aritmetické průměry v jednotlivých dílčích podsouborech

směrodatné odchylky v jednotlivých dílčích podsouborech

a relativní četnosti v jednotlivých dílčích podsouborech

Nejprve je třeba vypočítat rozptyly s_ix² v dílčích podsouborech. Potřebné výpočty jsou obsaženy v tabulce 1.34.

Tabulka 1.34
i
			0,2 0,1 0,4 0,3	30² = 32² = 34² = 33² =	1 024 1 156 1 089	210 ∙ 0,2 = 198 ∙ 0,1 = 220 ∙ 0,4 = 200 ∙ 0,3 =	19,8	900 ∙ 0,2 = 1 024 ∙ 0,1 = 1 156 ∙ 0,4 = 1 089 ∙ 0,3 =	102,4 462,4 326,7
Celkem	X	X	1,0		X		209,8		1 071,5


						(210 − 209,8)² ∙ 0,2 = (198 − 209,8)² ∙ 0,1 = (220 − 209,8)² ∙ 0,4 = (200 − 209,8)² ∙ 0,3 =	0,008 13,924 41,616 28,812
							84,360

Z tabulky 1.34 získáváme

Protože neznáme absolutní četnosti n_i, i = 1, 2, 3, 4, v jednotlivých dílčích podsouborech, ale známe pouze relativní četnosti p_i, i = 1, 2, 3, 4, k výpočtu použijeme vždy vzorec vyjádřený pomocí relativních četností. Celkový aritmetický průměr za celý statistický soubor dohromady vypočteme s využitím vztahu (1.13)

⇐ Назад

Далее ⇒