Formula

Standardna devijacija mjeri prosječnu udaljenost tačaka podataka od sredine skupa podataka. Za izračunavanje varijanse populacije, formula je σ² = Σ(x - μ)² / N, gdje je Σ zbir svih vrijednosti, x je svaka pojedinačna tačka podataka, μ je sredina populacije, a N je ukupan broj tačaka. Standardna devijacija populacije (σ) je kvadratni korijen ove varijanse. Ovaj pristup se koristi kada imate pristup svakoj tački podataka u cijeloj grupi koja se proučava. Za većinu primjena u stvarnom svijetu gdje imate samo podskup veće grupe, standardna devijacija uzorka (s) se izračunava pomoću formule s = √[Σ(x - x̄)² / (n - 1)]. Ova verzija koristi x̄ za sredinu uzorka i primjenjuje Besselovu korekciju dijeljenjem sa n - 1 umjesto sa n. Ovo prilagođavanje kompenzuje činjenicu da uzorak teži da pokaže nešto manju varijabilnost od pune populacije, pružajući precizniju i nepristrasnu procjenu za naučnu ili statističku analizu.

Primjer

Razmotrite mali skup podataka od tri težine objekata: 5 kg, 7 kg i 9 kg. Prvo pronađite sredinu sabiranjem vrijednosti i dijeljenjem sa tri, što iznosi 7 kg. Zatim oduzmite sredinu od svake vrijednosti i kvadrirajte rezultat: (5 - 7)² = 4, (7 - 7)² = 0 i (9 - 7)² = 4. Sabiranjem ovih kvadrata dobija se zbir 8. Da biste pronašli varijansu uzorka, podijelite ovaj zbir sa n - 1, što je 3 - 1 = 2, što rezultira varijansom od 4. Na kraju, uzmite kvadratni korijen od 4 da odredite da je standardna devijacija uzorka 2 kg.

Šta rezultat znači

  • ±1 σ Normalna distribucija
    Značenje U normalnoj distribuciji, približno 68,3 posto svih tačaka podataka pada unutar ovog raspona.
    Akcija Ovo predstavlja najčešće ishode i jezgro koncentracije skupa podataka.
  • ±2 σ Visoka varijabilnost
    Značenje Približno 95,4 posto tačaka podataka pada unutar dvije standardne devijacije od sredine.
    Akcija Tačke koje padaju izvan ovog raspona često se smatraju statistički značajnim ili neobičnim.
  • ±3 σ Ekstremni outlieri
    Značenje Oko 99,7 posto podataka pada unutar ovog širokog raspona, ostavljajući vrlo malo izvan njega.
    Akcija Tačke podataka izvan ovog praga su izuzetno rijetke i treba ih istražiti kao anomalije.
  • 0 Nulta varijansa
    Značenje Standardna devijacija od nule ukazuje na to da je svaka pojedinačna tačka podataka u skupu identična.
    Akcija Potvrdite da li je ovaj nedostatak varijacije očekivan ili ukazuje na grešku u mjerenju.
Raspon Status Značenje Akcija
±1 σ Normalna distribucija U normalnoj distribuciji, približno 68,3 posto svih tačaka podataka pada unutar ovog raspona. Ovo predstavlja najčešće ishode i jezgro koncentracije skupa podataka.
±2 σ Visoka varijabilnost Približno 95,4 posto tačaka podataka pada unutar dvije standardne devijacije od sredine. Tačke koje padaju izvan ovog raspona često se smatraju statistički značajnim ili neobičnim.
±3 σ Ekstremni outlieri Oko 99,7 posto podataka pada unutar ovog širokog raspona, ostavljajući vrlo malo izvan njega. Tačke podataka izvan ovog praga su izuzetno rijetke i treba ih istražiti kao anomalije.
0 Nulta varijansa Standardna devijacija od nule ukazuje na to da je svaka pojedinačna tačka podataka u skupu identična. Potvrdite da li je ovaj nedostatak varijacije očekivan ili ukazuje na grešku u mjerenju.

Kada koristiti ovaj kalkulator

Važeći raspon: Standardna devijacija uzorka važi za bilo koji skup podataka sa najmanje dvije numeričke vrijednosti.

Formula prestaje raditi kada je n manje od dva za uzorke jer to dovodi do dijeljenja nulom. Standardna devijacija je veoma osjetljiva na outliere, što znači da jedna ekstremna vrijednost može značajno povećati rezultat i pogrešno predstaviti ukupni raspon podataka.

Standardna devijacija je najčešće korištena mjera statističke disperzije, koja kvantifikuje koliko se članovi grupe razlikuju od srednje vrijednosti za tu grupu. To je osnovni alat u različitim oblastima, uključujući finansije, gdje se koristi za mjerenje volatilnosti tržišta i investicionog rizika. Niska standardna devijacija ukazuje na to da tačke podataka teže da budu veoma blizu sredine, dok visoka standardna devijacija ukazuje na to da su tačke podataka raspoređene u velikom rasponu vrijednosti. Ovaj proračun je neophodan jer omogućava istraživačima i analitičarima da razumiju pouzdanost i dosljednost svojih podataka. U proizvodnji i kontroli kvaliteta, standardna devijacija pomaže da se utvrdi da li je proces stabilan ili su varijacije u proizvodima, poput dužine vijka u cm (in), unutar prihvatljivih granica. Identifikovanjem koliko proces odstupa od svog cilja, inženjeri mogu implementirati poboljšanja kako bi osigurali da proizvodi zadovoljavaju stroge specifikacije. Nadalje, koncept je centralni za metodologiju Six Sigma, koja ima za cilj smanjenje varijacije procesa tako da praktično svi rezultati padaju unutar vrlo uskog raspona sredine. Razumijevanje standardne devijacije također omogućava korištenje Z-vrijednosti, koje određuju koliko je standardnih devijacija određena tačka udaljena od prosjeka, omogućavajući poređenje tačaka podataka iz različitih skupova podataka.

Povezani kalkulatori

Često postavljana pitanja

Visoka standardna devijacija ukazuje na to da su tačke podataka raspoređene u širem rasponu vrijednosti, što sugeriše visoku varijabilnost ili nedosljednost. U finansijama to često predstavlja veći rizik, dok u proizvodnji može signalizirati nedostatak preciznosti u proizvodnim procesima. To pokazuje da su podaci manje grupisani oko sredine.

Standardna devijacija populacije se koristi kada se mjeri svaki član grupe, dok standardna devijacija uzorka procjenjuje varijabilnost veće grupe na osnovu podskupa. Formula uzorka koristi n - 1 u nazivniku, poznatu kao Besselova korekcija, kako bi pružila precizniju i nepristrasnu procjenu.

Pravilo 68-95-99.7, ili empirijsko pravilo, navodi da za normalnu distribuciju skoro svi podaci padaju unutar tri standardne devijacije od sredine. Konkretno, 68 posto pada unutar jedne, 95 posto unutar dvije, i 99,7 posto unutar tri. Ovo pomaže u identifikaciji outliera i razumijevanju vjerovatnoće specifičnih tačaka podataka.

Standardna devijacija ne može biti negativna jer se izračunava kao kvadratni korijen varijanse, koja je zbir kvadriranih vrijednosti. Najmanja moguća vrijednost je nula, što ukazuje na to da su sve tačke podataka identične. Ako izračunate negativnu vrijednost, vjerovatno postoji greška u aritmetici ili primjeni formule.

Standardna devijacija je jednostavno kvadratni korijen varijanse. Dok varijansa pruža matematički opis širenja u kvadratnim jedinicama, standardna devijacija izražava to širenje u istim jedinicama kao i originalni podaci. To čini standardnu devijaciju mnogo lakšom za interpretaciju i primjenu na mjerenja ili poređenja u stvarnom svijetu.

Trebali biste se konsultovati sa profesionalnim statističarom kada radite sa složenim distribucijama podataka koje ne prate normalnu krivu ili kada donosite odluke visokog rizika na osnovu malih uzoraka. Stručnjaci mogu pomoći u primjeni naprednih metoda izvan osnovne standardne devijacije kako bi osigurali da su vaši zaključci matematički utemeljeni i da uzimaju u obzir potencijalne pristrasnosti.