Hranice spoľahlivosti (štatistika)

V štatistike je interval spoľahlivosti (CI) alebo hranica spoľahlivosti intervalový odhad populačného parametra. Namiesto odhadu parametra pomocou jednej hodnoty sa uvádza interval, ktorý pravdepodobne zahŕňa daný parameter. Intervaly spoľahlivosti sa teda používajú na označenie spoľahlivosti odhadu. To, s akou pravdepodobnosťou interval obsahuje parameter, sa určuje pomocou úrovne spoľahlivosti alebo koeficientu spoľahlivosti. Zvýšením požadovanej úrovne spoľahlivosti sa interval spoľahlivosti rozšíri.

CI sa môže použiť napríklad na opis spoľahlivosti výsledkov prieskumu. V prieskume volebných zámerov môže byť výsledkom, že 40 % respondentov má v úmysle voliť určitú stranu. Interval spoľahlivosti 95 % pre podiel v celej populácii, ktorý mal v deň prieskumu rovnaký zámer, môže byť 36 % až 44 %. Za rovnakých podmienok je výsledok prieskumu s malým intervalom spoľahlivosti spoľahlivejší ako výsledok s veľkým intervalom spoľahlivosti a jednou z hlavných vecí, ktoré kontrolujú túto šírku v prípade prieskumov obyvateľstva, je veľkosť opýtanej vzorky. Intervaly spoľahlivosti a intervalové odhady majú vo všeobecnosti uplatnenie v celom rade kvantitatívnych štúdií.

Ak je štatistika prezentovaná s intervalom spoľahlivosti a tvrdí sa, že je štatisticky významná, základný test, ktorý vedie k tomuto tvrdeniu, sa vykonal na hladine významnosti 100 % mínus hladina spoľahlivosti intervalu. Ak tento test viedol k chybe typu I, štatistika a jej interval spoľahlivosti nebudú mať žiadny vzťah k základnému parametru.

V tomto stĺpcovom grafe horné konce stĺpcov označujú priemery pozorovaní a červené úsečky predstavujú intervaly spoľahlivosti, ktoré ich obklopujú. Rozdiel medzi dvoma populáciami vľavo je významný. Je však častým omylom predpokladať, že dva parametre, ktorých 95 % intervaly spoľahlivosti sa neprekrývajú, sa významne líšia na 5 % hladine [1][2].

Pre daný podiel p (kde p je úroveň spoľahlivosti) je interval spoľahlivosti pre populačný parameter interval, ktorý sa vypočíta z náhodnej vzorky základnej populácie tak, že ak by sa výber vzorky opakoval mnohokrát a interval spoľahlivosti by sa prepočítal z každej vzorky podľa rovnakej metódy, podiel p intervalov spoľahlivosti by obsahoval príslušný populačný parameter. V neobvyklých prípadoch môže súbor spoľahlivosti pozostávať zo súboru niekoľkých samostatných intervalov, ktoré môžu zahŕňať polokonečné intervaly, a je možné, že výsledkom výpočtu intervalu spoľahlivosti môže byť súbor všetkých hodnôt od mínus nekonečna po plus nekonečno.

Intervaly spoľahlivosti zohrávajú vo frekvenčnej štatistike podobnú úlohu ako interval spoľahlivosti v bayesovskej štatistike. Intervaly spoľahlivosti a intervaly vierohodnosti sa však líšia nielen matematicky, ale majú aj diametrálne odlišnú interpretáciu.

V aplikačnej praxi sa intervaly spoľahlivosti zvyčajne uvádzajú na úrovni spoľahlivosti 95 %.Pri grafickom znázornení však môžu intervaly spoľahlivosti zobrazovať niekoľko úrovní spoľahlivosti, napríklad 50 %, 95 % a 99 %.

Intervaly spoľahlivosti ako náhodné intervaly

Intervaly spoľahlivosti sa konštruujú na základe daného súboru údajov: x označuje súbor pozorovaní v súbore údajov a X sa používa pri úvahách o výsledkoch, ktoré mohli byť pozorované z tej istej populácie, pričom X sa považuje za náhodnú premennú, ktorej pozorovaný výsledok je X = x. Interval spoľahlivosti je určený dvojicou funkcií u(.) a v(.) a interval spoľahlivosti pre daný súbor údajov je definovaný ako interval (u(x), v(x)). Na dokončenie definície intervalu spoľahlivosti je potrebné jasne pochopiť veličinu, pre ktorú CI poskytuje intervalový odhad. Predpokladajme, že touto veličinou je w. Vlastnosť pravidiel u(.) a v(.), vďaka ktorej sa interval (u(x),v(x)) najviac približuje tomu, aký by bol interval spoľahlivosti pre w, súvisí s vlastnosťami množiny náhodných intervalov daných (u(X),v(X)): to znamená, že koncové body sa považujú za náhodné premenné. Táto vlastnosť je pravdepodobnosť pokrytia alebo pravdepodobnosť c, že náhodný interval obsahuje w,

Tu sú koncové body U = u(X) a V = v(X) štatistiky (t. j. pozorovateľné náhodné premenné), ktoré sú odvodené z hodnôt v súbore údajov. Náhodný interval je (U, V).

Intervaly spoľahlivosti pre odvodzovanie

Na to, aby vyššie uvedený postup poskytoval životaschopný prostriedok štatistického odvodzovania, je potrebné ešte niečo ďalšie: väzba medzi odhadovanou veličinou a rozdelením pravdepodobnosti výsledku X. Predpokladajme, že toto rozdelenie pravdepodobnosti je charakterizované nepozorovateľným parametrom θ, ktorý je odhadovanou veličinou, a ďalšími nepozorovateľnými parametrami φ, ktoré nie sú predmetom bezprostredného záujmu. Tieto ostatné veličiny φ, o ktoré nie je bezprostredný záujem, sa nazývajú rušivé parametre, pretože štatistická teória musí ešte nájsť nejaký spôsob, ako sa s nimi vysporiadať.

Definícia intervalu spoľahlivosti pre θ pre ľubovoľné číslo α medzi 0 a 1 je interval

a u(X) a v(X) sú pozorovateľné náhodné premenné, t. j. na to, aby sme poznali hodnoty u(X) a v(X), nemusíme poznať hodnoty nepozorovateľných veličín θ, φ.

Číslo 1 – α (niekedy uvádzané ako percento 100 %-(1 – α)) sa nazýva úroveň spoľahlivosti alebo koeficient spoľahlivosti. Väčšina štandardných kníh preberá túto konvenciu, kde α bude malé číslo. Tu sa používa na označenie pravdepodobnosti, keď má náhodná premenná X rozdelenie charakterizované . Dôležitou súčasťou tejto špecifikácie je, že náhodný interval (U, V) pokrýva neznámu hodnotu θ s vysokou pravdepodobnosťou bez ohľadu na to, aká je skutočná hodnota θ.

Všimnite si, že sa tu nemusí odkazovať na explicitne danú parametrizovanú rodinu rozdelení, hoci sa tak často deje. Tak ako náhodná premenná X pojmovo zodpovedá iným možným realizáciám x z tej istej populácie alebo z tej istej verzie reality, parametre naznačujú, že musíme uvažovať o iných verziách reality, v ktorých by rozdelenie X mohlo mať iné charakteristiky.

Doporučujeme:  Trieda (vzdelanie)

Intervaly pre náhodné výsledky

Intervaly spoľahlivosti možno definovať pre náhodné veličiny, ako aj pre fixné veličiny, ako je uvedené vyššie. Pozri interval predpovede. Na tento účel uvažujte ďalšiu jednohodnotovú náhodnú premennú Y, ktorá môže, ale nemusí byť štatisticky závislá od X. Potom pravidlo na konštrukciu intervalu(u(x), v(x)) poskytuje interval spoľahlivosti pre ešte nepozorovanú hodnotu y Y, ak

Tu sa používa na označenie pravdepodobnosti nad spoločným rozdelením náhodných premenných (X, Y), ak je toto rozdelenie charakterizované parametrami .

Približné intervaly spoľahlivosti

Pri neštandardných aplikáciách niekedy nie je možné nájsť pravidlá na konštrukciu intervalov spoľahlivosti, ktoré by mali presne požadované vlastnosti. Prakticky užitočné intervaly sa však stále dajú nájsť. Pravdepodobnosť pokrytia pre náhodný interval je definovaná vzťahom

a pravidlo pre konštrukciu intervalu možno považovať za interval spoľahlivosti, ak

na prijateľnú úroveň aproximácie.

Porovnanie s bayesovskými intervalovými odhadmi

Bayesovský intervalový odhad sa nazýva dôveryhodný interval. Ak použijeme rovnaký zápis ako vyššie, definícia dôveryhodného intervalu pre neznámu pravdivú hodnotu θ je pre danú hodnotu α[4],

Θ sa tu používa na zdôraznenie toho, že neznáma hodnota sa považuje za náhodnú premennú. Definície oboch typov intervalov možno porovnať takto.

Všimnite si, že vyššie uvedené zaobchádzanie s rušivými parametrami sa často vynecháva v diskusiách porovnávajúcich intervaly spoľahlivosti a dôveryhodnosti, ale v oboch prípadoch sa výrazne líši.

V niektorých jednoduchých štandardných prípadoch môžu byť intervaly vytvorené ako intervaly spoľahlivosti a intervaly vierohodnosti z toho istého súboru údajov identické. Vždy sú veľmi odlišné, ak sú do bayesovskej analýzy zahrnuté stredne silné alebo silné apriórne informácie.

Pri použití pomerne štandardných štatistických postupov sa často používajú pomerne štandardné spôsoby konštrukcie intervalov spoľahlivosti. Tie budú navrhnuté tak, aby spĺňali určité želateľné vlastnosti, ktoré budú platiť za predpokladu, že predpoklady, na ktorých sa postup zakladá, sú pravdivé. Pri neštandardných aplikáciách by sa hľadali tie isté žiaduce vlastnosti. Tieto žiaduce vlastnosti možno opísať ako: platnosť, optimálnosť a invariantnosť. Z nich je najdôležitejšia „platnosť“, tesne nasledovaná „optimálnosťou“. „Invariantnosť“ možno považovať skôr za vlastnosť metódy odvodenia intervalu spoľahlivosti než za vlastnosť pravidla na konštrukciu intervalu.

V prípade neštandardných aplikácií existuje niekoľko spôsobov, ako odvodiť pravidlo na konštrukciu intervalov spoľahlivosti. Zavedené pravidlá pre štandardné postupy by sa mohli zdôvodniť alebo vysvetliť prostredníctvom niekoľkých z týchto ciest. Zvyčajne je pravidlo na konštrukciu intervalov spoľahlivosti úzko spojené s konkrétnym spôsobom zistenia bodového odhadu uvažovanej veličiny.

Stroj plní poháre margarínom a má byť nastavený tak, aby sa priemerný obsah pohárov blížil 250 gramom margarínu. Samozrejme, nie je možné naplniť každý pohár presne 250 gramami margarínu. Preto možno hmotnosť náplne považovať za náhodnú premennú X. Predpokladá sa, že rozdelenie X je normálne rozdelenie s neznámym očakávaním μ a (pre zjednodušenie) známou štandardnou odchýlkou σ = 2,5 gramu. Na overenie, či je stroj primerane nastavený, sa náhodne vyberie vzorka n = 25 šálok margarínu a šálky sa odvážia. Hmotnosti margarínu sú , náhodná vzorka z X.

Na získanie predstavy o očakávanej hodnote μ stačí uviesť jej odhad. Vhodným odhadom je výberový priemer:

Vo vzorke sú uvedené skutočné hmotnosti , s priemerom:

Ak by sme zobrali ďalšiu vzorku 25 šálok, mohli by sme ľahko očakávať hodnoty ako 250,4 alebo 251,1 gramov. Priemerná hodnota vzorky 280 gramov by však bola veľmi zriedkavá, ak by sa priemerný obsah šálok v skutočnosti blížil k 250 g. Okolo pozorovanej hodnoty 250,2 priemernej hodnoty vzorky existuje celý interval, v rámci ktorého, ak by priemerná hodnota celej populácie skutočne nadobúdala hodnotu v tomto intervale, by sa pozorované údaje nepovažovali za obzvlášť nezvyčajné. Takýto interval sa nazýva interval spoľahlivosti pre parameter μ. Ako takýto interval vypočítame? Koncové body intervalu sa musia vypočítať zo vzorky, takže sú to štatistiky, funkcie vzorky, a teda samotné náhodné veličiny.

V našom prípade môžeme určiť koncové body, ak uvážime, že priemer vzorky z normálne rozdelenej vzorky je tiež normálne rozdelený, s rovnakým očakávaním μ, ale so štandardnou chybou (gramy). Štandardizáciou dostaneme náhodnú premennú

Vyššie uvedený výraz štandardizuje vašu premennú. To vám umožní vykonať túto analýzu a vypočítať 95 % interval spoľahlivosti. μ je nejaké budúce meranie, sigma je vaša štandardná odchýlka, N je veľkosť vašej vzorky (v tomto prípade 25) a X bar je váš priemer vzorky (v tomto prípade 250,2). Aby sme mohli vypočítať interval spoľahlivosti, musíme najprv vybrať premennú α. Keďže nás zaujíma 95 % interval spoľahlivosti, nastavíme α = 0,05. Preto je možné nájsť čísla -z a z, nezávislé od μ, kde Z leží medzi nimi s pravdepodobnosťou 1 – α. Berieme 1 – α = 0,95. Takže máme:

Doporučujeme:  Ideál (etika)

Číslo z vyplýva z kumulatívnej distribučnej funkcie, ktorá nám dáva hodnotu z a je platná, pretože sme štandardizovali naše veľké Z. (Pozri aj probit). Preto:

To by sa dalo interpretovať takto: s pravdepodobnosťou 0,95 k jednej zvolíme interval spoľahlivosti, v ktorom sa stretneme s parametrom μ medzi stochastickými koncovými bodmi, ale to neznamená, že možnosť stretnutia parametra μ v intervale spoľahlivosti je 95 % :

Zvislé úsečky predstavujú 50 realizácií intervalu spoľahlivosti pre μ.

Tento interval má pevné koncové body, pričom μ môže byť medzi nimi (alebo nie). Pravdepodobnosť takejto udalosti neexistuje. Nemôžeme povedať: „s pravdepodobnosťou (1 – α) leží parameter μ v intervale spoľahlivosti.“ Vieme len, že opakovaním v 100(1 – α) % prípadov bude μ vo vypočítanom intervale. V 100α % prípadov však nie je. A bohužiaľ nevieme, v ktorých z prípadov sa tak stane. Preto hovoríme: „s hladinou spoľahlivosti 100(1 – α) % μ leží v intervale spoľahlivosti.“

Na obrázku vpravo je zobrazených 50 realizácií intervalu spoľahlivosti pre daný populačný priemer μ. Ak náhodne vyberieme jednu realizáciu, je pravdepodobnosť 95 %, že sme nakoniec vybrali interval, ktorý obsahuje parameter; môžeme však mať smolu a vybrať nesprávny interval. To sa nikdy nedozvieme, zostaneme pri našom intervale.

Predpokladajme, že X1, …, Xn sú nezávislou vzorkou z normálne rozdelenej populácie so strednou hodnotou μ a rozptylom σ2. Nech

má Studentovo t-rozdelenie s n – 1 stupňami voľnosti. Všimnite si, že rozdelenie T nezávisí od hodnôt nepozorovateľných parametrov μ a σ2, t. j. je to rozhodujúca veličina. Ak c je 95. percentil tohto rozdelenia, potom

(Poznámka: „95.“ a „0,9“ sú v predchádzajúcich vyjadreniach správne. Existuje 5 % pravdepodobnosť, že T bude menšie ako -c a 5 % pravdepodobnosť, že bude väčšie ako +c. Pravdepodobnosť, že T bude medzi -c a +c, je teda 90 %.)

a pre μ máme teoretický (stochastický) interval spoľahlivosti 90 %.

Po pozorovaní vzorky zistíme hodnoty pre a s pre S, z ktorých vypočítame interval spoľahlivosti

interval s pevnými číslami ako koncovými bodmi, o ktorom už nemôžeme povedať, že s určitou pravdepodobnosťou obsahuje parameter μ. Buď μ v tomto intervale je, alebo nie je.

Vzťah k testovaniu hypotéz

Hoci sa formulácie pojmov intervalov spoľahlivosti a testovania štatistických hypotéz líšia, v niektorých zmysloch spolu súvisia a do istej miery sa dopĺňajú. Hoci nie všetky intervaly spoľahlivosti sa konštruujú týmto spôsobom, jeden z prístupov na všeobecné účely pri konštruovaní intervalov spoľahlivosti je definovať 100(1-α)% interval spoľahlivosti, ktorý pozostáva zo všetkých hodnôt θ0, pre ktoré sa test hypotézy θ=θ0 nezamietne na hladine významnosti 100α %. Takýto prístup nemusí byť vždy k dispozícii, pretože predpokladá praktickú dostupnosť vhodného testu významnosti. Prirodzene, všetky predpoklady požadované pre test významnosti by sa preniesli aj na intervaly spoľahlivosti.

Mohlo by byť vhodné urobiť všeobecnú korešpondenciu, že hodnoty parametrov v rámci intervalu spoľahlivosti sú ekvivalentné s hodnotami, ktoré by neboli zamietnuté testom hypotézy, ale bolo by to nebezpečné. V mnohých prípadoch sú intervaly spoľahlivosti, ktoré sa uvádzajú, platné len približne, možno odvodené z „plus alebo mínus dvojnásobku štandardnej chyby“, a dôsledky toho pre údajne zodpovedajúce testy hypotéz sú zvyčajne neznáme.

Význam a výklad

Používatelia frekvenčných metód môžu interval spoľahlivosti interpretovať rôzne.

V každom z uvedených prípadov platí nasledovné. Ak skutočná hodnota parametra leží mimo 90 % intervalu spoľahlivosti po jeho výpočte, potom nastala udalosť, ktorej pravdepodobnosť náhodného výskytu bola 10 % (alebo menej).

Používatelia bayesovských metód, ak by vytvorili intervalový odhad, by naopak chceli povedať: „Môj stupeň presvedčenia, že parameter je v skutočnosti v tomto intervale, je 90 %“ [8]. Pozri Dôveryhodný interval.
Spory o tieto otázky nie sú spormi o riešenie matematických problémov. Sú to skôr nezhody o spôsoboch, akými sa má matematika aplikovať.

Význam pojmu dôvera

Existuje rozdiel vo význame medzi bežným používaním slova „dôvera“ a jeho štatistickým použitím, čo je pre laikov často mätúce. V bežnom používaní sa tvrdenie o 95 % dôvere v niečo zvyčajne chápe ako označenie skutočnej istoty. V štatistike tvrdenie o 95 % istote jednoducho znamená, že výskumník videl niečo, čo sa stane len raz z dvadsiatich prípadov alebo menej. Ak by niekto hodil dvoma kockami a dostal by dvojnásobnú šestku, málokto by to považoval za dôkaz, že kocky sú pevné, hoci štatisticky by mohol mať 97 % istotu, že sú. Podobne ani zistenie štatistickej súvislosti s 95 % spoľahlivosťou nie je dôkazom, dokonca ani veľmi dobrým dôkazom, že medzi spojenými vecami existuje nejaká skutočná súvislosť.

Ak štúdia zahŕňa viacero štatistických testov, niektorí laici predpokladajú, že dôvera spojená s jednotlivými testami je dôverou, ktorú by sme mali mať vo výsledky samotnej štúdie. V skutočnosti sa výsledky všetkých štatistických testov vykonaných počas štúdie musia posudzovať ako celok, aby sa určilo, akú dôveru možno pripisovať pozitívnym súvislostiam, ktoré prinášajú. Ak sa vykonala štúdia zahŕňajúca 40 štatistických testov s 95 % spoľahlivosťou, možno očakávať, že približne dva z testov prinesú falošne pozitívne výsledky. Ak sa nájdu 3 prepojenia, dôvera spojená s týmito prepojeniami „ako výsledok prieskumu“ je v skutočnosti približne 32 %; to je to, čo by sa malo očakávať v dvoch tretinách prípadov.

Doporučujeme:  Predohra

Intervaly spoľahlivosti pri meraní

Tento článok je označený od apríla 2008.

Výsledky meraní sú často sprevádzané intervalmi spoľahlivosti. Predpokladajme napríklad, že váha poskytuje skutočnú hmotnosť objektu plus normálne rozdelenú náhodnú chybu so strednou hodnotou 0 a známou štandardnou odchýlkou σ. Ak na tejto váhe odvážime 100 objektov so známou hmotnosťou a uvedieme hodnoty ±σ, potom môžeme očakávať, že približne 68 % uvedených intervalov zahŕňa skutočnú hmotnosť.

Ak chceme uviesť hodnoty s menšou hodnotou štandardnej chyby, potom meranie zopakujeme n-krát a výsledky spriemerujeme. Potom je interval spoľahlivosti 68,2 % . Napríklad 100-násobné opakovanie merania zmenší interval spoľahlivosti na 1/10 pôvodnej šírky.

Všimnite si, že keď uvádzame 68,2 % interval spoľahlivosti (zvyčajne označovaný ako štandardná chyba) ako v ± σ, neznamená to, že skutočná hmotnosť má 68,2 % šancu byť v uvedenom rozsahu. V skutočnosti je skutočná hmotnosť buď v rozsahu, alebo nie. Ako možno povedať, že hodnota mimo rozsahu má nejakú šancu byť v rozsahu? Naše tvrdenie skôr znamená, že 68,2 % rozsahov, ktoré uvádzame pomocou ± σ, pravdepodobne obsahuje skutočnú hmotnosť.

To nie je len spor. Pri nesprávnej interpretácii by každé zo 100 vyššie opísaných meraní určovalo iný rozsah a skutočná hmotnosť by údajne mala 68 % šancu byť v každom rozsahu. Takisto má údajne 32 % šancu, že bude mimo každého rozsahu. Ak sa dva z týchto rozsahov náhodou rozchádzajú, výroky sú zjavne nekonzistentné. Povedzme, že jeden rozsah je 1 až 2 a druhý je 2 až 3. Pravdepodobnosť, že skutočná hmotnosť bude medzi 1 a 2, je 68 %, ale iba 32 %, že bude menšia ako 2 alebo väčšia ako 3. Nesprávna interpretácia vkladá do výroku viac, ako je myslené.

Na druhej strane, pri správnej interpretácii je každý náš výrok skutočne pravdivý, pretože sa netýka žiadneho konkrétneho rozsahu. Mohli by sme uviesť, že jedna hmotnosť je 10,2 ± 0,1 gramu, pričom v skutočnosti je to 10,6 gramu, a neklamali by sme. Ak však uvedieme menej ako 1000 hodnôt a viac ako dve z nich sa budú takto rozchádzať, budeme mať čo vysvetľovať.

Interval spoľahlivosti je možné odhadnúť aj bez znalosti štandardnej odchýlky náhodnej chyby. To sa robí pomocou t rozdelenia alebo pomocou neparametrických metód prevzorkovania, ako je bootstrap, ktoré nevyžadujú, aby chyba mala normálne rozdelenie.

Intervaly spoľahlivosti pre podiely a súvisiace veličiny

Približný interval spoľahlivosti pre populačný priemer možno zostrojiť pre náhodné premenné, ktoré nie sú v populácii normálne rozdelené, pričom sa možno spoľahnúť na centrálnu limitnú vetu, ak sú veľkosti vzoriek a počty dostatočne veľké. Vzorce sú identické s vyššie uvedeným prípadom (kde je priemer vzorky skutočne normálne rozdelený okolo populačného priemeru). Aproximácia bude celkom dobrá už pri niekoľkých desiatkach pozorovaní vo vzorke, ak sa rozdelenie pravdepodobnosti náhodnej premennej príliš nelíši od normálneho rozdelenia (napr. jej kumulatívna distribučná funkcia nemá žiadne diskontinuity a jej šikmosť je mierna).

Jedným z typov výberového priemeru je priemer indikátorovej premennej, ktorá nadobúda hodnotu 1 pre pravdivé údaje a hodnotu 0 pre nepravdivé údaje. Priemer takejto premennej sa rovná podielu tých, ktorí majú premennú rovnú jednej (v populácii aj vo vzorke). Toto je užitočná vlastnosť indikátorových premenných, najmä pri testovaní hypotéz. Na uplatnenie centrálnej limitnej vety je potrebné použiť dostatočne veľkú vzorku. Hrubé pravidlo je, že by sme mali vidieť aspoň 5 prípadov, v ktorých je ukazovateľ rovný 1, a aspoň 5 prípadov, v ktorých je rovný 0. Intervaly spoľahlivosti vytvorené pomocou uvedených vzorcov môžu obsahovať záporné čísla alebo čísla väčšie ako 1, ale proporcie samozrejme nemôžu byť záporné alebo väčšie ako 1. Okrem toho proporcie vo vzorke môžu nadobúdať len konečný počet hodnôt, takže centrálna limitná veta a normálne rozdelenie nie sú najlepšími nástrojmi na vytvorenie intervalu spoľahlivosti. Lepšie metódy, ktoré sú špecifické pre tento prípad, nájdete v časti „Interval spoľahlivosti binomickej proporcie“.

Priemer (aritmetický, geometrický) – Medián – Modus – Výkon – Rozptyl – Smerodajná odchýlka

Testovanie hypotéz – Významnosť – Nulová hypotéza/alternatívna hypotéza – Chyba – Z-test – Studentov t-test – Maximálna pravdepodobnosť – Štandardné skóre/Z skóre – P-hodnota – Analýza rozptylu

Funkcia prežitia – Kaplan-Meier – Logrank test – Miera zlyhania – Modely proporcionálnych rizík

Normálna (zvonová krivka) – Poissonova – Bernoulliho

Zmiešavajúca premenná – Pearsonov koeficient korelácie súčinu a momentu – Korelácia poradia (Spearmanov koeficient korelácie poradia, Kendallov koeficient korelácie poradia tau)

Lineárna regresia – Nelineárna regresia – Logistická regresia