Formule

Standaarddeviatie meet de gemiddelde afstand van datapunten tot het gemiddelde van een dataset. Om de populatievariantie te berekenen, is de formule σ² = Σ(x - μ)² / N, waarbij Σ de som van alle waarden is, x elk individueel datapunt is, μ het populatiegemiddelde is en N het totale aantal punten is. De populatiestandaarddeviatie (σ) is de vierkantswortel van deze variantie. Deze benadering wordt gebruikt wanneer u toegang hebt tot elk datapunt in de gehele groep die wordt bestudeerd. Voor de meeste praktijktoepassingen waarbij u slechts een subset van een grotere groep hebt, wordt de steekproefstandaarddeviatie (s) berekend met de formule s = √[Σ(x - x̄)² / (n - 1)]. Deze versie gebruikt x̄ voor het steekproefgemiddelde en past de Bessel-correctie toe door te delen door n - 1 in plaats van n. Deze aanpassing compenseert het feit dat een steekproef de neiging heeft iets minder variabiliteit te vertonen dan de volledige populatie, wat een nauwkeurigere en onbevooroordeelde schatting oplevert voor wetenschappelijke of statistische analyse.

Voorbeeld

Stel u een kleine dataset voor van drie gewichten van objecten: 5 kg, 7 kg en 9 kg. Zoek eerst het gemiddelde door de waarden op te tellen en te delen door drie, wat gelijk is aan 7 kg. Trek vervolgens het gemiddelde af van elke waarde en kwadrateer het resultaat: (5 - 7)² = 4, (7 - 7)² = 0 en (9 - 7)² = 4. Het optellen van deze kwadraten geeft een som van 8. Om de steekproefvariantie te vinden, deelt u deze som door n - 1, wat 3 - 1 = 2 is, resulterend in een variantie van 4. Trek ten slotte de vierkantswortel uit 4 om te bepalen dat de steekproefstandaarddeviatie 2 kg is.

Wat het resultaat betekent

  • ±1 σ Normale verdeling
    Betekenis In een normale verdeling valt ongeveer 68,3 procent van alle datapunten binnen dit bereik.
    Actie Dit vertegenwoordigt de meest voorkomende uitkomsten en de kernconcentratie van de dataset.
  • ±2 σ Hoge variabiliteit
    Betekenis Ongeveer 95,4 procent van de datapunten valt binnen twee standaarddeviaties van het gemiddelde.
    Actie Punten die buiten dit bereik vallen, worden vaak als statistisch significant of ongebruikelijk beschouwd.
  • ±3 σ Extreme uitschieters
    Betekenis Ongeveer 99,7 procent van de gegevens valt binnen dit brede bereik, waardoor er zeer weinig buiten valt.
    Actie Datapunten buiten deze drempel zijn extreem zeldzaam en moeten als anomalieën worden onderzocht.
  • 0 Nul variantie
    Betekenis Een standaarddeviatie van nul geeft aan dat elk afzonderlijk datapunt in de set identiek is.
    Actie Bevestig of dit gebrek aan variatie verwacht wordt of duidt op een meetfout.
Bereik Status Betekenis Actie
±1 σ Normale verdeling In een normale verdeling valt ongeveer 68,3 procent van alle datapunten binnen dit bereik. Dit vertegenwoordigt de meest voorkomende uitkomsten en de kernconcentratie van de dataset.
±2 σ Hoge variabiliteit Ongeveer 95,4 procent van de datapunten valt binnen twee standaarddeviaties van het gemiddelde. Punten die buiten dit bereik vallen, worden vaak als statistisch significant of ongebruikelijk beschouwd.
±3 σ Extreme uitschieters Ongeveer 99,7 procent van de gegevens valt binnen dit brede bereik, waardoor er zeer weinig buiten valt. Datapunten buiten deze drempel zijn extreem zeldzaam en moeten als anomalieën worden onderzocht.
0 Nul variantie Een standaarddeviatie van nul geeft aan dat elk afzonderlijk datapunt in de set identiek is. Bevestig of dit gebrek aan variatie verwacht wordt of duidt op een meetfout.

Wanneer deze calculator te gebruiken

Geldig bereik: De steekproefstandaarddeviatie is geldig voor elke dataset met ten minste twee numerieke waarden.

De formule werkt niet meer wanneer n kleiner is dan twee voor steekproeven, omdat dit leidt tot deling door nul. Standaarddeviatie is zeer gevoelig voor uitschieters, wat betekent dat een enkele extreme waarde het resultaat aanzienlijk kan opdrijven en de algehele spreiding van de gegevens verkeerd kan weergeven.

Standaarddeviatie is de meest gebruikte maatstaf voor statistische spreiding en kwantificeert hoeveel de leden van een groep verschillen van de gemiddelde waarde voor die groep. Het is een fundamenteel hulpmiddel in verschillende vakgebieden, waaronder de financiële wereld, waar het wordt gebruikt om marktvolatiliteit en investeringsrisico's te meten. Een lage standaarddeviatie geeft aan dat de datapunten de neiging hebben heel dicht bij het gemiddelde te liggen, terwijl een hoge standaarddeviatie aangeeft dat de datapunten over een groot bereik aan waarden verspreid zijn. Deze berekening is essentieel omdat het onderzoekers en analisten in staat stelt de betrouwbaarheid en consistentie van hun gegevens te begrijpen. In de productie en kwaliteitscontrole helpt standaarddeviatie te bepalen of een proces stabiel is of dat de variaties in producten, zoals de lengte van een bout in cm (in), binnen acceptabele limieten vallen. Door te identificeren hoeveel een proces afwijkt van zijn doel, kunnen ingenieurs verbeteringen doorvoeren om ervoor te zorgen dat producten aan strikte specificaties voldoen. Bovendien staat het concept centraal in de Six Sigma-methodologie, die tot doel heeft procesvariatie te verminderen, zodat vrijwel alle resultaten binnen een zeer nauw bereik van het gemiddelde vallen. Het begrijpen van standaarddeviatie maakt ook het gebruik van Z-scores mogelijk, die bepalen hoeveel standaarddeviaties een specifiek punt van het gemiddelde verwijderd is, waardoor datapunten uit verschillende datasets kunnen worden vergeleken.

Gerelateerde rekenmachines

Veelgestelde vragen

Een hoge standaarddeviatie geeft aan dat de datapunten verspreid zijn over een breder bereik van waarden, wat duidt op een hoge variabiliteit of inconsistentie. In de financiële wereld vertegenwoordigt dit vaak een hoger risico, terwijl het in de productie kan duiden op een gebrek aan precisie in productieprocessen. Het laat zien dat de gegevens minder geclusterd zijn rond het gemiddelde.

Populatiestandaarddeviatie wordt gebruikt wanneer elk lid van een groep wordt gemeten, terwijl steekproefstandaarddeviatie de variabiliteit van een grotere groep schat op basis van een subset. De steekproefformule gebruikt n - 1 in de noemer, bekend als de Bessel-correctie, om een nauwkeurigere en onbevooroordeelde schatting te geven.

De 68-95-99,7 regel, of de empirische regel, stelt dat voor een normale verdeling bijna alle gegevens binnen drie standaarddeviaties van het gemiddelde vallen. Specifiek valt 68 procent binnen één, 95 procent binnen twee en 99,7 procent binnen drie standaarddeviaties. Dit helpt bij het identificeren van uitschieters en het begrijpen van de waarschijnlijkheid van specifieke datapunten.

Standaarddeviatie kan niet negatief zijn omdat deze wordt berekend als de vierkantswortel van de variantie, wat een som van gekwadrateerde waarden is. De kleinst mogelijke waarde is nul, wat aangeeft dat alle datapunten identiek zijn. Als u een negatieve waarde berekent, is er waarschijnlijk een fout gemaakt in de berekening of de toepassing van de formule.

Standaarddeviatie is simpelweg de vierkantswortel van de variantie. Terwijl variantie een wiskundige beschrijving geeft van spreiding in gekwadrateerde eenheden, drukt standaarddeviatie die spreiding uit in dezelfde eenheden als de oorspronkelijke gegevens. Dit maakt standaarddeviatie veel gemakkelijker te interpreteren en toe te passen op praktijkmetingen of vergelijkingen.

U moet een professionele statisticus raadplegen wanneer u te maken hebt met complexe gegevensverdelingen die geen normale klokcurve volgen of wanneer u beslissingen met grote belangen neemt op basis van kleine steekproeven. Experts kunnen helpen bij het toepassen van geavanceerde methoden die verder gaan dan de basisstandaarddeviatie om ervoor te zorgen dat uw conclusies wiskundig onderbouwd zijn en rekening houden met mogelijke vooroordelen.