Формула

Стандардната девијација го мери просечното растојание на точките со податоци од средината на збирката податоци. За да се пресмета варијансата на популацијата, формулата е σ² = Σ(x - μ)² / N, каде што Σ е збирот на сите вредности, x е секоја поединечна точка на податоци, μ е средината на популацијата, а N е вкупниот број на точки. Стандардната девијација на популацијата (σ) е квадратен корен од оваа варијанса. Овој пристап се користи кога имате пристап до секоја точка на податоци во целата група што се проучува. За повеќето апликации во реалниот свет каде што имате само подмножество од поголема група, стандардната девијација на примерокот (s) се пресметува со помош на формулата s = √[Σ(x - x̄)² / (n - 1)]. Оваа верзија користи x̄ за средината на примерокот и ја применува Беселовата корекција со делење со n - 1 наместо со n. Ова прилагодување компензира за фактот дека примерокот има тенденција да покажува малку помала варијабилност од целата популација, обезбедувајќи попрецизна и понепристрасна проценка за научна или статистичка анализа.

Пример

Размислете за мала збирка податоци од три тежини на предмети: 5 kg, 7 kg и 9 kg. Прво, најдете ја средината со собирање на вредностите и делење со три, што е еднакво на 7 kg. Потоа, одземете ја средината од секоја вредност и квадрирајте го резултатот: (5 - 7)² = 4, (7 - 7)² = 0 и (9 - 7)² = 4. Собирањето на овие квадрати заедно дава збир од 8. За да ја најдете варијансата на примерокот, поделете го овој збир со n - 1, што е 3 - 1 = 2, што резултира со варијанса од 4. Конечно, земете го квадратниот корен од 4 за да одредите дека стандардната девијација на примерокот е 2 kg.

Што значи резултатот

  • ±1 σ Нормална дистрибуција
    Значење Во нормална дистрибуција, приближно 68.3 проценти од сите точки со податоци спаѓаат во овој опсег.
    Акција Ова ги претставува најчестите исходи и јадрото на концентрацијата на збирката податоци.
  • ±2 σ Висока варијабилност
    Значење Приближно 95.4 проценти од точките со податоци спаѓаат во рамките на две стандардни девијации од средината.
    Акција Точките што паѓаат надвор од овој опсег често се сметаат за статистички значајни или необични.
  • ±3 σ Екстремни отстапувања
    Значење Околу 99.7 проценти од податоците спаѓаат во овој широк опсег, оставајќи многу малку надвор.
    Акција Точките со податоци над овој праг се исклучително ретки и треба да се истражат како аномалии.
  • 0 Нулта варијанса
    Значење Стандардна девијација од нула укажува на тоа дека секоја поединечна точка на податоци во збирката е идентична.
    Акција Потврдете дали овој недостаток на варијација е очекуван или укажува на грешка во мерењето.
Опсег Статус Значење Акција
±1 σ Нормална дистрибуција Во нормална дистрибуција, приближно 68.3 проценти од сите точки со податоци спаѓаат во овој опсег. Ова ги претставува најчестите исходи и јадрото на концентрацијата на збирката податоци.
±2 σ Висока варијабилност Приближно 95.4 проценти од точките со податоци спаѓаат во рамките на две стандардни девијации од средината. Точките што паѓаат надвор од овој опсег често се сметаат за статистички значајни или необични.
±3 σ Екстремни отстапувања Околу 99.7 проценти од податоците спаѓаат во овој широк опсег, оставајќи многу малку надвор. Точките со податоци над овој праг се исклучително ретки и треба да се истражат како аномалии.
0 Нулта варијанса Стандардна девијација од нула укажува на тоа дека секоја поединечна точка на податоци во збирката е идентична. Потврдете дали овој недостаток на варијација е очекуван или укажува на грешка во мерењето.

Кога да се користи овој калкулатор

Важечки опсег: Стандардната девијација на примерокот е валидна за секоја збирка податоци со најмалку две нумерички вредности.

Формулата не функционира кога n е помало од два за примероци бидејќи тоа води до делење со нула. Стандардната девијација е многу чувствителна на отстапувања, што значи дека една екстремна вредност може значително да го зголеми резултатот и погрешно да го претстави целокупното ширење на податоците.

Стандардната девијација е најшироко користената мерка за статистичка дисперзија, која квантификува колку членовите на една група се разликуваат од средната вредност за таа група. Таа е фундаментална алатка во различни области, вклучувајќи ги и финансиите, каде што се користи за мерење на пазарната нестабилност и инвестицискиот ризик. Ниската стандардна девијација укажува на тоа дека точките со податоци имаат тенденција да бидат многу блиску до средината, додека високата стандардна девијација укажува на тоа дека точките со податоци се распоредени во голем опсег на вредности. Оваа пресметка е од суштинско значење бидејќи им овозможува на истражувачите и аналитичарите да ја разберат веродостојноста и конзистентноста на нивните податоци. Во производството и контролата на квалитетот, стандардната девијација помага да се утврди дали процесот е стабилен или дали варијациите во производите, како што е должината на завртката во cm (in), се во прифатливи граници. Со идентификување на тоа колку еден процес отстапува од својата цел, инженерите можат да спроведат подобрувања за да осигураат дека производите ги исполнуваат строгите спецификации. Понатаму, концептот е централен за методологијата Six Sigma, која има за цел да ја намали варијацијата на процесот така што практично сите резултати паѓаат во многу тесен опсег на средината. Разбирањето на стандардната девијација овозможува и користење на Z-резултати, кои одредуваат колку стандардни девијации е одредена точка од просекот, овозможувајќи споредба на точки со податоци од различни збирки податоци.

Поврзани калкулатори

Често поставувани прашања

Високата стандардна девијација укажува на тоа дека точките со податоци се распоредени во поширок опсег на вредности, што сугерира висока варијабилност или недоследност. Во финансиите, ова често претставува поголем ризик, додека во производството, може да сигнализира недостаток на прецизност во производните процеси. Тоа покажува дека податоците се помалку групирани околу средината.

Стандардната девијација на популацијата се користи кога се мери секој член на една група, додека стандардната девијација на примерокот ја проценува варијабилноста на поголема група врз основа на подмножество. Формулата за примерок користи n - 1 во именителот, позната како Беселова корекција, за да обезбеди попрецизна и понепристрасна проценка.

Правилото 68-95-99.7, или емпириското правило, вели дека за нормална дистрибуција, речиси сите податоци паѓаат во рамките на три стандардни девијации од средината. Поточно, 68 проценти паѓаат во рамките на една, 95 проценти во рамките на две и 99.7 проценти во рамките на три. Ова помага да се идентификуваат отстапувањата и да се разбере веродостојноста на специфичните точки со податоци.

Стандардната девијација не може да биде негативна бидејќи се пресметува како квадратен корен од варијансата, која е збир на квадрирани вредности. Најмалата можна вредност е нула, што укажува на тоа дека сите точки со податоци се идентични. Ако пресметате негативна вредност, веројатно има грешка во аритметиката или во примената на формулата.

Стандардната девијација е едноставно квадратен корен од варијансата. Додека варијансата дава математички опис на ширењето во квадрирани единици, стандардната девијација го изразува тоа ширење во истите единици како и оригиналните податоци. Ова ја прави стандардната девијација многу полесна за толкување и примена на мерења или споредби во реалниот свет.

Треба да се консултирате со професионален статистичар кога се занимавате со сложени дистрибуции на податоци кои не следат нормална крива во форма на ѕвоно или кога донесувате одлуки со висок влог врз основа на мали примероци. Експертите можат да помогнат во примената на напредни методи надвор од основната стандардна девијација за да се осигураат дека вашите заклучоци се математички издржани и ги земаат предвид потенцијалните пристрасности.