Medián

V teórii pravdepodobnosti a štatistike sa medián opisuje ako číslo, ktoré oddeľuje vyššiu polovicu vzorky, populácie alebo rozdelenia pravdepodobnosti od nižšej polovice. Medián konečného zoznamu čísel možno zistiť tak, že sa všetky pozorovania usporiadajú od najnižšej hodnoty po najvyššiu a vyberie sa stredná hodnota. Ak je pozorovaní párny počet, medián nie je jednoznačný, preto sa často berie priemer dvoch stredných hodnôt.
Najviac polovica populácie má hodnoty menšie ako medián a najviac polovica má hodnoty väčšie ako medián. Ak obe skupiny obsahujú menej ako polovicu populácie, potom sa časť populácie presne rovná mediánu. Napríklad, ak a < b < c, potom medián zoznamu {a, b, c} je b, a ak a < b < c < d, potom medián zoznamu {a, b, c, d} je priemerom b a c, t. j. je to (b + c)/2.

Medián sa môže použiť, keď je rozdelenie skreslené alebo keď nie sú známe konečné hodnoty. Nevýhodou je náročnosť jeho teoretického spracovania [Ako odkazovať a prepojiť na zhrnutie alebo text].

Medián nejakej premennej sa označuje buď ako alebo ako

Miery štatistického rozptylu

Ak sa medián používa ako parameter umiestnenia v deskriptívnej štatistike, existuje niekoľko možností pre mieru variability: rozsah, medzikvartilové rozpätie, priemerná absolútna odchýlka a mediánová absolútna odchýlka. Keďže medián je rovnaký ako druhý kvartil, jeho výpočet je znázornený v článku o kvartiloch.

Pri práci s počítačmi by populácia celých čísel mala mať celočíselný medián. Pre populáciu celých čísel so párnym počtom prvkov teda existujú dva mediány známe ako dolný medián a horný medián [Ako odkazovať a prepojiť na zhrnutie alebo text]. Pre populáciu s pohyblivou rádovou čiarkou leží medián niekde medzi dvoma strednými prvkami, v závislosti od rozdelenia[Ako odkazovať a odkazovať na zhrnutie alebo text].
Medián je stredná hodnota po usporiadaní údajov podľa ľubovoľného poradia[Ako odkazovať a odkazovať na zhrnutie alebo text].

Doporučujeme:  Úvod do objektivistickej epistemológie

Mediány rozdelení pravdepodobnosti

Pre každé rozdelenie pravdepodobnosti na reálnej priamke s kumulatívnou distribučnou funkciou F, bez ohľadu na to, či ide o akýkoľvek druh spojitého rozdelenia pravdepodobnosti, najmä absolútne spojité rozdelenie (a teda má funkciu hustoty pravdepodobnosti), alebo diskrétne rozdelenie pravdepodobnosti, spĺňa medián m nerovnosti

v ktorom sa používa Riemann-Stieltjesov integrál. Pre absolútne spojité rozdelenie pravdepodobnosti s funkciou hustoty pravdepodobnosti ƒ máme

Mediány jednotlivých rozdelení: Mediány určitých typov rozdelení sa dajú ľahko vypočítať z ich parametrov: Medián normálneho rozdelenia so strednou hodnotou μ a rozptylom σ2 je μ. V skutočnosti pre normálne rozdelenie platí, že stredná hodnota = medián = modus. Medián rovnomerného rozdelenia v intervale [a, b] je (a + b) / 2, čo je tiež stredná hodnota. Medián Cauchyho rozdelenia s parametrom polohy x0 a parametrom mierky y je x0, parameter polohy. Medián exponenciálneho rozdelenia s parametrom miery λ je prirodzený logaritmus 2 delený parametrom miery: ln 2/λ. Medián Weibullovho rozdelenia s tvarovým parametrom k a parametrom mierky λ je λ(ln 2)1/k.

Mediány v popisnej štatistike

Medián sa používa predovšetkým pri šikmých rozdeleniach, ktoré reprezentuje inak ako aritmetický priemer. Uvažujme viacnásobnú množinu { 1, 2, 2, 2, 3, 9 }. Medián je v tomto prípade 2, rovnako ako modus, a možno ho považovať za lepší ukazovateľ centrálnej tendencie ako aritmetický priemer 3,166.

Výpočet mediánov je obľúbenou technikou v súhrnnej štatistike a pri sumarizácii štatistických údajov, pretože je jednoduchý na pochopenie a ľahko sa vypočítava, pričom poskytuje mieru, ktorá je odolnejšia voči prítomnosti odľahlých hodnôt ako priemer.

Medián je tiež centrálny bod, ktorý minimalizuje priemer absolútnych odchýlok; vo vyššie uvedenom príklade by to bolo (1 + 0 + 0 + 0 + 0 + 1 + 7) / 6 = 1,5 pri použití mediánu, zatiaľ čo pri použití priemeru by to bolo 1,944. V jazyku teórie pravdepodobnosti je hodnota c, ktorá minimalizuje

Doporučujeme:  Informačný súbor (teória hier)

je medián rozdelenia pravdepodobnosti náhodnej premennej X. Všimnite si však, že c nie je vždy jednoznačné, a preto nie je vo všeobecnosti dobre definované.

Nerovnosť týkajúca sa stredných hodnôt a mediánov

Pri spojitých rozdeleniach pravdepodobnosti je rozdiel medzi mediánom a strednou hodnotou menší alebo rovný jednej štandardnej odchýlke. Pozrite si nerovnosť parametrov umiestnenia a mierky.

Efektívny výpočet mediánu vzorky

Hoci triedenie n položiek trvá vo všeobecnosti O(n log n) operácií, pomocou algoritmu „rozdeľ a panuj“ možno vypočítať medián n položiek len s O(n) operáciami (v skutočnosti možno touto metódou vždy nájsť k-tý prvok zoznamu hodnôt; nazýva sa to problém výberu).

Jednoduché vysvetlenie mediánu vzorky

Ako príklad si vypočítame medián nasledujúcej populácie čísel: 1, 5, 2, 8, 7.

Začnite triedením čísel: 1, 2, 5, 7, 8.

V tomto prípade je 5 mediánom, pretože keď sú čísla zoradené, je to stredné číslo.

Pre sadu párnych čísel:

Ako príklad tohto scenára vypočítame medián nasledujúcej populácie čísel: 1, 5, 2, 10, 8, 7.

Opäť začnite triedením čísel: 1, 2, 5, 7, 8, 10.

V tomto prípade by 5 aj 7 boli mediánom dátových bodov.

Iné odhady mediánu

Ak sú údaje reprezentované štatistickým modelom, ktorý špecifikuje určitú rodinu rozdelení pravdepodobnosti, potom možno odhady mediánu získať prispôsobením tejto rodiny rozdelení pravdepodobnosti údajom a výpočtom teoretického mediánu prispôsobeného rozdelenia. Pozri napríklad Paretovu interpoláciu.

Mediány v oblasti informatiky

V informatike sa na určenie stredného indexu zoradeného poľa často používa výpočet mediánu. Stredný index sa vypočíta ako (A + B)/2, kde A je index najmenšej hodnoty a B je index najväčšej hodnoty. Joshua Bloch, softvérový inžinier spoločnosti Google, vyslovil názor, že ak je (A + B) väčšie ako maximálna povolená veľkosť celého čísla, dôjde k aritmetickému pretečeniu. Navrhol, aby sa použil alternatívny výpočet mediánu: A + ((B – A)/2) by sa tomuto problému vyhol. Všimnite si, že uvedené výpočty sú určené pre binárne vyhľadávanie a podobné algoritmy a nepredstavujú skutočný matematický medián.

Doporučujeme:  Benígne paroxyzmálne polohové vertigo

Tento článok obsahuje materiál z distribúcie Median na PlanetMath, ktorý je licencovaný pod GFDL.

Priemer (aritmetický, geometrický) – Medián – Modus – Výkon – Rozptyl – Smerodajná odchýlka

Testovanie hypotéz – Významnosť – Nulová hypotéza/alternatívna hypotéza – Chyba – Z-test – Studentov t-test – Maximálna pravdepodobnosť – Štandardné skóre/Z skóre – P-hodnota – Analýza rozptylu

Funkcia prežitia – Kaplan-Meier – Logrank test – Miera zlyhania – Modely proporcionálnych rizík

Normálna (zvonová krivka) – Poissonova – Bernoulliho

Zmiešavajúca premenná – Pearsonov koeficient korelácie súčinu a momentu – Korelácia poradia (Spearmanov koeficient korelácie poradia, Kendallov koeficient korelácie poradia tau)

Lineárna regresia – Nelineárna regresia – Logistická regresia