Формула

Стандартното отклонение измерва средното разстояние на точките от данни от средната стойност на набора от данни. За изчисляване на дисперсията на генералната съвкупност формулата е σ² = Σ(x - μ)² / N, където Σ е сумата от всички стойности, x е всяка отделна точка от данни, μ е средната стойност на съвкупността, а N е общият брой точки. Стандартното отклонение на съвкупността (σ) е корен квадратен от тази дисперсия. Този подход се използва, когато имате достъп до всяка точка от данни в цялата изследвана група. За повечето приложения в реалния свят, където разполагате само с подмножество от по-голяма група, стандартното отклонение на извадката (s) се изчислява по формулата s = √[Σ(x - x̄)² / (n - 1)]. Тази версия използва x̄ за средната стойност на извадката и прилага корекцията на Бесел чрез разделяне на n - 1 вместо на n. Тази корекция компенсира факта, че извадката е склонна да показва малко по-малка вариабилност от пълната съвкупност, осигурявайки по-точна и обективна оценка за научен или статистически анализ.

Пример

Разгледайте малък набор от данни за теглата на три обекта: 5 kg, 7 kg и 9 kg. Първо, намерете средната стойност, като съберете стойностите и ги разделите на три, което е равно на 7 kg. След това извадете средната стойност от всяка стойност и повдигнете резултата на квадрат: (5 - 7)² = 4, (7 - 7)² = 0 и (9 - 7)² = 4. Събирането на тези квадрати дава сума от 8. За да намерите дисперсията на извадката, разделете тази сума на n - 1, което е 3 - 1 = 2, което води до дисперсия от 4. Накрая вземете корен квадратен от 4, за да определите, че стандартното отклонение на извадката е 2 kg.

Какво означава резултатът

  • ±1 σ Нормално разпределение
    Значение В нормално разпределение приблизително 68.3 процента от всички точки от данни попадат в този диапазон.
    Действие Това представлява най-честите резултати и основната концентрация на набора от данни.
  • ±2 σ Висока вариабилност
    Значение Приблизително 95.4 процента от точките от данни попадат в рамките на две стандартни отклонения от средната стойност.
    Действие Точките, попадащи извън този диапазон, често се считат за статистически значими или необичайни.
  • ±3 σ Екстремни аутлайери
    Значение Около 99.7 процента от данните попадат в този широк диапазон, оставяйки много малко извън него.
    Действие Точките от данни извън този праг са изключително редки и трябва да бъдат изследвани като аномалии.
  • 0 Нулева дисперсия
    Значение Стандартно отклонение от нула показва, че всяка отделна точка от данни в набора е идентична.
    Действие Потвърдете дали тази липса на вариация е очаквана или показва грешка в измерването.
Диапазон Статус Значение Действие
±1 σ Нормално разпределение В нормално разпределение приблизително 68.3 процента от всички точки от данни попадат в този диапазон. Това представлява най-честите резултати и основната концентрация на набора от данни.
±2 σ Висока вариабилност Приблизително 95.4 процента от точките от данни попадат в рамките на две стандартни отклонения от средната стойност. Точките, попадащи извън този диапазон, често се считат за статистически значими или необичайни.
±3 σ Екстремни аутлайери Около 99.7 процента от данните попадат в този широк диапазон, оставяйки много малко извън него. Точките от данни извън този праг са изключително редки и трябва да бъдат изследвани като аномалии.
0 Нулева дисперсия Стандартно отклонение от нула показва, че всяка отделна точка от данни в набора е идентична. Потвърдете дали тази липса на вариация е очаквана или показва грешка в измерването.

Кога да използвате този калкулатор

Валиден диапазон: Стандартното отклонение на извадката е валидно за всеки набор от данни с поне две числови стойности.

Формулата се разпада, когато n е по-малко от две за извадки, защото води до деление на нула. Стандартното отклонение е силно чувствително към аутлайери, което означава, че една екстремна стойност може значително да завиши резултата и да представи погрешно общото разсейване на данните.

Стандартното отклонение е най-широко използваната мярка за статистическа дисперсия, количествено определяща колко членовете на една група се различават от средната стойност за тази група. То е основен инструмент в различни области, включително финансите, където се използва за измерване на пазарната волатилност и инвестиционния риск. Ниското стандартно отклонение показва, че точките от данни са склонни да бъдат много близо до средната стойност, докато високото стандартно отклонение показва, че точките от данни са разпръснати в голям диапазон от стойности. Това изчисление е от съществено значение, защото позволява на изследователите и анализаторите да разберат надеждността и последователността на своите данни. В производството и контрола на качеството стандартното отклонение помага да се определи дали даден процес е стабилен или дали вариациите в продуктите, като дължината на болт в cm (in), са в приемливи граници. Чрез идентифициране на това колко един процес се отклонява от целта си, инженерите могат да внедрят подобрения, за да гарантират, че продуктите отговарят на строги спецификации. Освен това концепцията е централна за методологията Six Sigma, която има за цел да намали вариациите в процеса, така че практически всички резултати да попадат в много тесен диапазон от средната стойност. Разбирането на стандартното отклонение също така позволява използването на Z-резултати, които определят на колко стандартни отклонения се намира конкретна точка от средното, позволявайки сравнение на точки от данни от различни набори от данни.

Свързани калкулатори

Често задавани въпроси

Високото стандартно отклонение показва, че точките от данни са разпръснати в по-широк диапазон от стойности, което предполага висока вариабилност или непоследователност. Във финансите това често представлява по-висок риск, докато в производството може да сигнализира за липса на прецизност в производствените процеси. То показва, че данните са по-малко групирани около средната стойност.

Стандартното отклонение на съвкупността се използва, когато се измерва всеки член на групата, докато стандартното отклонение на извадката оценява вариабилността на по-голяма група въз основа на подмножество. Формулата за извадка използва n - 1 в знаменателя, известно като корекция на Бесел, за да осигури по-точна и обективна оценка.

Правилото 68-95-99.7, или емпиричното правило, гласи, че за нормално разпределение почти всички данни попадат в рамките на три стандартни отклонения от средната стойност. По-конкретно, 68 процента попадат в рамките на едно, 95 процента в рамките на две и 99.7 процента в рамките на три. Това помага за идентифициране на аутлайери и разбиране на вероятността за конкретни точки от данни.

Стандартното отклонение не може да бъде отрицателно, защото се изчислява като корен квадратен от дисперсията, която е сума от стойности на квадрат. Най-малката възможна стойност е нула, което показва, че всички точки от данни са идентични. Ако изчислите отрицателна стойност, вероятно има грешка в аритметиката или прилагането на формулата.

Стандартното отклонение е просто корен квадратен от дисперсията. Докато дисперсията предоставя математическо описание на разсейването в единици на квадрат, стандартното отклонение изразява това разсейване в същите единици като оригиналните данни. Това прави стандартното отклонение много по-лесно за интерпретиране и прилагане към измервания или сравнения в реалния свят.

Трябва да се консултирате с професионален статистик, когато работите със сложни разпределения на данни, които не следват нормална камбановидна крива, или когато вземате решения с висок залог въз основа на малки извадки. Експертите могат да помогнат за прилагането на усъвършенствани методи отвъд основното стандартно отклонение, за да гарантират, че вашите заключения са математически обосновани и отчитат потенциални пристрастия.