Formula

Standardna devijacija mjeri prosječnu udaljenost podatkovnih točaka od sredine skupa podataka. Za izračun varijance populacije, formula je σ² = Σ(x - μ)² / N, gdje je Σ zbroj svih vrijednosti, x je svaka pojedinačna podatkovna točka, μ je sredina populacije, a N je ukupan broj točaka. Standardna devijacija populacije (σ) je kvadratni korijen ove varijance. Ovaj se pristup koristi kada imate pristup svakoj podatkovnoj točki u cijeloj skupini koja se proučava. Za većinu primjena u stvarnom svijetu gdje imate samo podskup veće skupine, standardna devijacija uzorka (s) izračunava se pomoću formule s = √[Σ(x - x̄)² / (n - 1)]. Ova verzija koristi x̄ za sredinu uzorka i primjenjuje Besselovu korekciju dijeljenjem s n - 1 umjesto s n. Ova prilagodba kompenzira činjenicu da uzorak teži pokazivati nešto manju varijabilnost od pune populacije, pružajući točniju i nepristranu procjenu za znanstvenu ili statističku analizu.

Primjer

Razmotrite mali skup podataka od tri težine predmeta: 5 kg, 7 kg i 9 kg. Prvo pronađite sredinu zbrajanjem vrijednosti i dijeljenjem s tri, što iznosi 7 kg. Zatim oduzmite sredinu od svake vrijednosti i kvadrirajte rezultat: (5 - 7)² = 4, (7 - 7)² = 0 i (9 - 7)² = 4. Zbrajanje ovih kvadrata daje zbroj 8. Da biste pronašli varijancu uzorka, podijelite ovaj zbroj s n - 1, što je 3 - 1 = 2, što rezultira varijancom od 4. Na kraju, uzmite kvadratni korijen od 4 kako biste utvrdili da je standardna devijacija uzorka 2 kg.

Što rezultat znači

  • ±1 σ Normalna distribucija
    Značenje U normalnoj distribuciji, približno 68,3 posto svih podatkovnih točaka pada unutar ovog raspona.
    Radnja Ovo predstavlja najčešće ishode i jezgru koncentracije skupa podataka.
  • ±2 σ Visoka varijabilnost
    Značenje Približno 95,4 posto podatkovnih točaka pada unutar dvije standardne devijacije od sredine.
    Radnja Točke koje padaju izvan ovog raspona često se smatraju statistički značajnima ili neobičnima.
  • ±3 σ Ekstremne vrijednosti
    Značenje Oko 99,7 posto podataka pada unutar ovog širokog raspona, ostavljajući vrlo malo izvan njega.
    Radnja Podatkovne točke izvan ovog praga iznimno su rijetke i treba ih istražiti kao anomalije.
  • 0 Nulta varijanca
    Značenje Standardna devijacija od nule ukazuje na to da je svaka pojedinačna podatkovna točka u skupu identična.
    Radnja Potvrdite je li ovaj nedostatak varijacije očekivan ili ukazuje na pogrešku u mjerenju.
Raspon Status Značenje Radnja
±1 σ Normalna distribucija U normalnoj distribuciji, približno 68,3 posto svih podatkovnih točaka pada unutar ovog raspona. Ovo predstavlja najčešće ishode i jezgru koncentracije skupa podataka.
±2 σ Visoka varijabilnost Približno 95,4 posto podatkovnih točaka pada unutar dvije standardne devijacije od sredine. Točke koje padaju izvan ovog raspona često se smatraju statistički značajnima ili neobičnima.
±3 σ Ekstremne vrijednosti Oko 99,7 posto podataka pada unutar ovog širokog raspona, ostavljajući vrlo malo izvan njega. Podatkovne točke izvan ovog praga iznimno su rijetke i treba ih istražiti kao anomalije.
0 Nulta varijanca Standardna devijacija od nule ukazuje na to da je svaka pojedinačna podatkovna točka u skupu identična. Potvrdite je li ovaj nedostatak varijacije očekivan ili ukazuje na pogrešku u mjerenju.

Kada koristiti ovaj kalkulator

Valjani raspon: Standardna devijacija uzorka vrijedi za bilo koji skup podataka s najmanje dvije numeričke vrijednosti.

Formula prestaje vrijediti kada je n manji od dva za uzorke jer to dovodi do dijeljenja s nulom. Standardna devijacija je vrlo osjetljiva na ekstremne vrijednosti, što znači da jedna ekstremna vrijednost može značajno napuhati rezultat i pogrešno prikazati ukupnu raširenost podataka.

Standardna devijacija je najčešće korištena mjera statističke disperzije, koja kvantificira koliko se članovi skupine razlikuju od srednje vrijednosti za tu skupinu. To je temeljni alat u raznim područjima, uključujući financije, gdje se koristi za mjerenje volatilnosti tržišta i investicijskog rizika. Niska standardna devijacija ukazuje na to da su podatkovne točke obično vrlo blizu sredine, dok visoka standardna devijacija ukazuje na to da su podatkovne točke raširene u velikom rasponu vrijednosti. Ovaj je izračun bitan jer omogućuje istraživačima i analitičarima da razumiju pouzdanost i dosljednost svojih podataka. U proizvodnji i kontroli kvalitete, standardna devijacija pomaže odrediti je li proces stabilan ili su varijacije u proizvodima, poput duljine vijka u cm (in), unutar prihvatljivih granica. Identificiranjem koliko proces odstupa od svog cilja, inženjeri mogu implementirati poboljšanja kako bi osigurali da proizvodi zadovoljavaju stroge specifikacije. Nadalje, koncept je središnji za metodologiju Six Sigma, koja ima za cilj smanjiti varijaciju procesa tako da praktički svi rezultati padaju unutar vrlo uskog raspona sredine. Razumijevanje standardne devijacije također omogućuje korištenje Z-vrijednosti, koje određuju koliko je standardnih devijacija određena točka udaljena od prosjeka, omogućujući usporedbu podatkovnih točaka iz različitih skupova podataka.

Povezani kalkulatori

Često postavljana pitanja

Visoka standardna devijacija ukazuje na to da su podatkovne točke raširene u širem rasponu vrijednosti, što sugerira visoku varijabilnost ili nedosljednost. U financijama to često predstavlja veći rizik, dok u proizvodnji može signalizirati nedostatak preciznosti u proizvodnim procesima. To pokazuje da su podaci manje grupirani oko sredine.

Standardna devijacija populacije koristi se kada se mjeri svaki član skupine, dok standardna devijacija uzorka procjenjuje varijabilnost veće skupine na temelju podskupa. Formula uzorka koristi n - 1 u nazivniku, poznatu kao Besselova korekcija, kako bi pružila točniju i nepristranu procjenu.

Pravilo 68-95-99,7, ili empirijsko pravilo, navodi da za normalnu distribuciju gotovo svi podaci padaju unutar tri standardne devijacije od sredine. Točnije, 68 posto pada unutar jedne, 95 posto unutar dvije, a 99,7 posto unutar tri. To pomaže u prepoznavanju ekstremnih vrijednosti i razumijevanju vjerojatnosti specifičnih podatkovnih točaka.

Standardna devijacija ne može biti negativna jer se izračunava kao kvadratni korijen varijance, koja je zbroj kvadriranih vrijednosti. Najmanja moguća vrijednost je nula, što ukazuje na to da su sve podatkovne točke identične. Ako izračunate negativnu vrijednost, vjerojatno postoji pogreška u aritmetici ili primjeni formule.

Standardna devijacija je jednostavno kvadratni korijen varijance. Dok varijanca pruža matematički opis širenja u kvadriranim jedinicama, standardna devijacija izražava to širenje u istim jedinicama kao i izvorni podaci. To čini standardnu devijaciju mnogo lakšom za interpretaciju i primjenu na mjerenja ili usporedbe u stvarnom svijetu.

Trebali biste se posavjetovati s profesionalnim statističarom kada radite sa složenim distribucijama podataka koje ne slijede normalnu krivulju ili kada donosite odluke s visokim ulozima na temelju malih uzoraka. Stručnjaci mogu pomoći u primjeni naprednih metoda izvan osnovne standardne devijacije kako bi osigurali da su vaši zaključci matematički utemeljeni i da uzimaju u obzir potencijalne pristranosti.