Формула

Стандартне відхилення вимірює середню відстань точок даних від середнього значення набору даних. Для розрахунку дисперсії генеральної сукупності формула така: σ² = Σ(x - μ)² / N, де Σ — сума всіх значень, x — кожна окрема точка даних, μ — середнє значення сукупності, а N — загальна кількість точок. Стандартне відхилення сукупності (σ) — це квадратний корінь із цієї дисперсії. Цей підхід використовується, коли ви маєте доступ до кожної точки даних у всій групі, що вивчається. Для більшості реальних застосувань, де ви маєте лише підмножину більшої групи, вибіркове стандартне відхилення (s) розраховується за формулою s = √[Σ(x - x̄)² / (n - 1)]. Ця версія використовує x̄ для середнього значення вибірки та застосовує поправку Бесселя шляхом ділення на n - 1 замість n. Це коригування компенсує той факт, що вибірка, як правило, демонструє трохи меншу мінливість, ніж уся сукупність, забезпечуючи більш точну та неупереджену оцінку для наукового або статистичного аналізу.

Приклад

Розглянемо невеликий набір даних про вагу трьох об'єктів: 5 kg, 7 kg та 9 kg. Спочатку знайдіть середнє значення, додавши значення та поділивши на три, що дорівнює 7 kg. Далі відніміть середнє значення від кожного значення та піднесіть результат до квадрата: (5 - 7)² = 4, (7 - 7)² = 0 та (9 - 7)² = 4. Додавання цих квадратів разом дає суму 8. Щоб знайти вибіркову дисперсію, поділіть цю суму на n - 1, що становить 3 - 1 = 2, у результаті чого дисперсія дорівнює 4. Нарешті, візьміть квадратний корінь із 4, щоб визначити, що вибіркове стандартне відхилення становить 2 kg.

Що означає результат

  • ±1 σ Нормальний розподіл
    Значення У нормальному розподілі приблизно 68.3 відсотка всіх точок даних потрапляють у цей діапазон.
    Дія Це представляє найбільш поширені результати та основну концентрацію набору даних.
  • ±2 σ Висока мінливість
    Значення Приблизно 95.4 відсотка точок даних потрапляють у межах двох стандартних відхилень від середнього.
    Дія Точки, що виходять за межі цього діапазону, часто вважаються статистично значущими або незвичайними.
  • ±3 σ Екстремальні викиди
    Значення Близько 99.7 відсотка даних потрапляють у цей широкий діапазон, залишаючи дуже мало зовні.
    Дія Точки даних за цим порогом надзвичайно рідкісні і повинні бути досліджені як аномалії.
  • 0 Нульова дисперсія
    Значення Стандартне відхилення, що дорівнює нулю, вказує на те, що кожна окрема точка даних у наборі ідентична.
    Дія Підтвердьте, чи очікується така відсутність варіацій, чи це вказує на помилку вимірювання.
Діапазон Статус Значення Дія
±1 σ Нормальний розподіл У нормальному розподілі приблизно 68.3 відсотка всіх точок даних потрапляють у цей діапазон. Це представляє найбільш поширені результати та основну концентрацію набору даних.
±2 σ Висока мінливість Приблизно 95.4 відсотка точок даних потрапляють у межах двох стандартних відхилень від середнього. Точки, що виходять за межі цього діапазону, часто вважаються статистично значущими або незвичайними.
±3 σ Екстремальні викиди Близько 99.7 відсотка даних потрапляють у цей широкий діапазон, залишаючи дуже мало зовні. Точки даних за цим порогом надзвичайно рідкісні і повинні бути досліджені як аномалії.
0 Нульова дисперсія Стандартне відхилення, що дорівнює нулю, вказує на те, що кожна окрема точка даних у наборі ідентична. Підтвердьте, чи очікується така відсутність варіацій, чи це вказує на помилку вимірювання.

Коли використовувати цей калькулятор

Допустимий діапазон: Вибіркове стандартне відхилення дійсне для будь-якого набору даних, що містить принаймні два числових значення.

Формула перестає працювати, коли n менше двох для вибірок, оскільки це призводить до ділення на нуль. Стандартне відхилення дуже чутливе до викидів, що означає, що одне екстремальне значення може значно завищити результат і спотворити загальний розкид даних.

Стандартне відхилення є найбільш широко використовуваним показником статистичної дисперсії, що кількісно визначає, наскільки члени групи відрізняються від середнього значення для цієї групи. Це фундаментальний інструмент у різних галузях, включаючи фінанси, де він використовується для вимірювання волатильності ринку та інвестиційного ризику. Низьке стандартне відхилення вказує на те, що точки даних, як правило, знаходяться дуже близько до середнього значення, тоді як високе стандартне відхилення вказує на те, що точки даних розкидані в широкому діапазоні значень. Цей розрахунок є важливим, оскільки він дозволяє дослідникам та аналітикам зрозуміти надійність та послідовність своїх даних. У виробництві та контролі якості стандартне відхилення допомагає визначити, чи є процес стабільним, чи варіації в продуктах, таких як довжина болта в cm (in), знаходяться в допустимих межах. Визначивши, наскільки процес відхиляється від своєї мети, інженери можуть впроваджувати вдосконалення, щоб гарантувати відповідність продукції суворим специфікаціям. Крім того, ця концепція є центральною для методології Шість Сигм, яка спрямована на зменшення варіативності процесу, щоб практично всі результати потрапляли в дуже вузький діапазон середнього значення. Розуміння стандартного відхилення також дозволяє використовувати Z-оцінки, які визначають, на скільки стандартних відхилень конкретна точка знаходиться від середнього значення, що дозволяє порівнювати точки даних з різних наборів даних.

Пов'язані калькулятори

Часті запитання

Високе стандартне відхилення вказує на те, що точки даних розкидані в ширшому діапазоні значень, що свідчить про високу мінливість або непослідовність. У фінансах це часто представляє вищий ризик, тоді як у виробництві це може сигналізувати про брак точності у виробничих процесах. Це показує, що дані менш згруповані навколо середнього значення.

Стандартне відхилення сукупності використовується, коли вимірюється кожен член групи, тоді як вибіркове стандартне відхилення оцінює мінливість більшої групи на основі підмножини. У формулі вибірки використовується n - 1 у знаменнику, відомий як поправка Бесселя, щоб забезпечити більш точну та неупереджену оцінку.

Правило 68-95-99.7, або емпіричне правило, стверджує, що для нормального розподілу майже всі дані потрапляють у межі трьох стандартних відхилень від середнього. Зокрема, 68 відсотків потрапляють в межі одного, 95 відсотків — у межі двох, а 99.7 відсотка — у межі трьох. Це допомагає виявити викиди та зрозуміти ймовірність конкретних точок даних.

Стандартне відхилення не може бути від’ємним, оскільки воно розраховується як квадратний корінь із дисперсії, яка є сумою квадратів значень. Найменше можливе значення — нуль, що вказує на те, що всі точки даних ідентичні. Якщо ви отримали від’ємне значення, ймовірно, є помилка в арифметиці або застосуванні формули.

Стандартне відхилення — це просто квадратний корінь із дисперсії. У той час як дисперсія дає математичний опис розкиду в квадратних одиницях, стандартне відхилення виражає цей розкид у тих самих одиницях, що й вихідні дані. Це робить стандартне відхилення набагато легшим для інтерпретації та застосування до реальних вимірювань або порівнянь.

Вам слід звернутися до професійного статистика, коли ви маєте справу зі складними розподілами даних, які не відповідають нормальній кривій, або коли приймаєте важливі рішення на основі невеликих вибірок. Експерти можуть допомогти застосувати передові методи, що виходять за рамки базового стандартного відхилення, щоб переконатися, що ваші висновки математично обґрунтовані та враховують потенційні упередження.