Formel

Standardavvikelse mäter det genomsnittliga avståndet för datapunkter från medelvärdet i en datamängd. För att beräkna populationsvariansen är formeln σ² = Σ(x - μ)² / N, där Σ är summan av alla värden, x är varje enskild datapunkt, μ är populationsmedelvärdet och N är det totala antalet punkter. Populationens standardavvikelse (σ) är kvadratroten ur denna varians. Detta tillvägagångssätt används när du har tillgång till varje datapunkt i hela den grupp som studeras. För de flesta verkliga tillämpningar där du bara har en delmängd av en större grupp, beräknas urvalets standardavvikelse (s) med formeln s = √[Σ(x - x̄)² / (n - 1)]. Denna version använder x̄ för urvalsmedelvärdet och tillämpar Bessels korrigering genom att dividera med n - 1 istället för n. Denna justering kompenserar för det faktum att ett urval tenderar att visa något mindre variabilitet än hela populationen, vilket ger en mer exakt och opartisk uppskattning för vetenskaplig eller statistisk analys.

Exempel

Betrakta en liten datamängd med tre objektvikter: 5 kg, 7 kg och 9 kg. Hitta först medelvärdet genom att addera värdena och dividera med tre, vilket blir 7 kg. Subtrahera sedan medelvärdet från varje värde och kvadrera resultatet: (5 - 7)² = 4, (7 - 7)² = 0 och (9 - 7)² = 4. Att addera dessa kvadrater ger summan 8. För att hitta urvalsvariansen, dividera denna summa med n - 1, vilket är 3 - 1 = 2, vilket resulterar i en varians på 4. Slutligen, ta kvadratroten ur 4 för att fastställa att urvalets standardavvikelse är 2 kg.

Vad resultatet betyder

  • ±1 σ Normalfördelning
    Betydelse I en normalfördelning faller cirka 68,3 procent av alla datapunkter inom detta intervall.
    Åtgärd Detta representerar de vanligaste utfallen och kärnkoncentrationen i datamängden.
  • ±2 σ Hög variabilitet
    Betydelse Cirka 95,4 procent av datapunkterna faller inom två standardavvikelser från medelvärdet.
    Åtgärd Punkter som faller utanför detta intervall anses ofta vara statistiskt signifikanta eller ovanliga.
  • ±3 σ Extrema extremvärden
    Betydelse Cirka 99,7 procent av data faller inom detta breda intervall, vilket lämnar mycket lite utanför.
    Åtgärd Datapunkter bortom denna tröskel är extremt sällsynta och bör undersökas som anomalier.
  • 0 Noll varians
    Betydelse En standardavvikelse på noll indikerar att varje enskild datapunkt i uppsättningen är identisk.
    Åtgärd Bekräfta om denna brist på variation är förväntad eller indikerar ett mätfel.
Intervall Status Betydelse Åtgärd
±1 σ Normalfördelning I en normalfördelning faller cirka 68,3 procent av alla datapunkter inom detta intervall. Detta representerar de vanligaste utfallen och kärnkoncentrationen i datamängden.
±2 σ Hög variabilitet Cirka 95,4 procent av datapunkterna faller inom två standardavvikelser från medelvärdet. Punkter som faller utanför detta intervall anses ofta vara statistiskt signifikanta eller ovanliga.
±3 σ Extrema extremvärden Cirka 99,7 procent av data faller inom detta breda intervall, vilket lämnar mycket lite utanför. Datapunkter bortom denna tröskel är extremt sällsynta och bör undersökas som anomalier.
0 Noll varians En standardavvikelse på noll indikerar att varje enskild datapunkt i uppsättningen är identisk. Bekräfta om denna brist på variation är förväntad eller indikerar ett mätfel.

När du ska använda denna kalkylator

Giltigt intervall: Urvalets standardavvikelse är giltig för alla datamängder med minst två numeriska värden.

Formeln bryts ner när n är mindre än två för urval eftersom det leder till division med noll. Standardavvikelse är mycket känslig för extremvärden, vilket innebär att ett enskilt extremt värde kan blåsa upp resultatet avsevärt och felaktigt representera den övergripande spridningen av data.

Standardavvikelse är det mest använda måttet på statistisk spridning och kvantifierar hur mycket medlemmarna i en grupp skiljer sig från medelvärdet för den gruppen. Det är ett grundläggande verktyg inom olika områden, inklusive ekonomi, där det används för att mäta marknadsvolatilitet och investeringsrisk. En låg standardavvikelse indikerar att datapunkterna tenderar att ligga mycket nära medelvärdet, medan en hög standardavvikelse indikerar att datapunkterna är spridda över ett stort intervall av värden. Denna beräkning är nödvändig eftersom den gör det möjligt för forskare och analytiker att förstå tillförlitligheten och konsistensen i deras data. Inom tillverkning och kvalitetskontroll hjälper standardavvikelse till att avgöra om en process är stabil eller om variationerna i produkter, som längden på en bult i cm (in), ligger inom acceptabla gränser. Genom att identifiera hur mycket en process avviker från sitt mål kan ingenjörer genomföra förbättringar för att säkerställa att produkter uppfyller strikta specifikationer. Dessutom är konceptet centralt i Six Sigma-metodiken, som syftar till att minska processvariationer så att praktiskt taget alla resultat faller inom ett mycket snävt intervall från medelvärdet. Att förstå standardavvikelse möjliggör också användning av Z-poäng, som avgör hur många standardavvikelser en specifik punkt ligger från genomsnittet, vilket möjliggör jämförelse av datapunkter från olika datamängder.

Relaterade kalkylatorer

Vanliga frågor

En hög standardavvikelse indikerar att datapunkterna är spridda över ett bredare intervall av värden, vilket tyder på hög variabilitet eller inkonsekvens. Inom ekonomi representerar detta ofta högre risk, medan det inom tillverkning kan signalera brist på precision i produktionsprocesserna. Det visar att data är mindre klustrad runt medelvärdet.

Populationens standardavvikelse används när varje medlem i en grupp mäts, medan urvalets standardavvikelse uppskattar variabiliteten i en större grupp baserat på en delmängd. Urvalsformeln använder n - 1 i nämnaren, känd som Bessels korrigering, för att ge en mer exakt och opartisk uppskattning.

68-95-99,7-regeln, eller den empiriska regeln, säger att för en normalfördelning faller nästan all data inom tre standardavvikelser från medelvärdet. Specifikt faller 68 procent inom en, 95 procent inom två och 99,7 procent inom tre. Detta hjälper till att identifiera extremvärden och förstå sannolikheten för specifika datapunkter.

Standardavvikelse kan inte vara negativ eftersom den beräknas som kvadratroten ur variansen, som är en summa av kvadrerade värden. Det minsta möjliga värdet är noll, vilket indikerar att alla datapunkter är identiska. Om du beräknar ett negativt värde är det troligtvis ett fel i aritmetiken eller formeltillämpningen.

Standardavvikelse är helt enkelt kvadratroten ur variansen. Medan varians ger en matematisk beskrivning av spridning i kvadrerade enheter, uttrycker standardavvikelse den spridningen i samma enheter som ursprungliga data. Detta gör standardavvikelse mycket lättare att tolka och tillämpa på verkliga mätningar eller jämförelser.

Du bör rådfråga en professionell statistiker när du hanterar komplexa datafördelningar som inte följer en normal klockkurva eller när du fattar beslut med höga insatser baserat på små urval. Experter kan hjälpa till att tillämpa avancerade metoder utöver grundläggande standardavvikelse för att säkerställa att dina slutsatser är matematiskt sunda och tar hänsyn till potentiella snedvridningar.