計算式

標準偏差は、データセットの平均からのデータポイントの平均的な距離を測定します。母分散を計算するための公式は σ² = Σ(x - μ)² / N です。ここで Σ はすべての値の合計、x は個々のデータポイント、μ は母平均、N はポイントの総数です。母標準偏差 (σ) は、この分散の平方根です。このアプローチは、研究対象となるグループ全体のすべてのデータポイントにアクセスできる場合に使用されます。より大きなグループのサブセットしか持たないほとんどの実世界のアプリケーションでは、標本標準偏差 (s) が公式 s = √[Σ(x - x̄)² / (n - 1)] を使用して計算されます。このバージョンでは、標本平均に x̄ を使用し、n の代わりに n - 1 で割るベッセル補正を適用します。この調整は、標本が全母集団よりもわずかに変動が少なくなる傾向があるという事実を補い、科学的または統計的分析のためのより正確で偏りのない推定値を提供します。

3つの物体の重さの小さなデータセットを考えます:5 kg、7 kg、9 kg。まず、値を足して3で割って平均を求めます。これは 7 kg になります。次に、各値から平均を引き、その結果を2乗します:(5 - 7)² = 4、(7 - 7)² = 0、(9 - 7)² = 4。これらの2乗した値を足すと合計は8になります。標本分散を求めるには、この合計を n - 1、つまり 3 - 1 = 2 で割り、分散は4となります。最後に、4の平方根をとって、標本標準偏差が 2 kg であることを決定します。

結果の意味

  • ±1 σ 正規分布
    意味 正規分布では、全データポイントの約68.3パーセントがこの範囲内に収まります。
    アクション これは最も一般的な結果と、データセットの核心的な集中を表しています。
  • ±2 σ 高い変動性
    意味 データポイントの約95.4パーセントが平均の2標準偏差以内に収まります。
    アクション この範囲外にあるポイントは、多くの場合、統計的に有意であるか、異常であると見なされます。
  • ±3 σ 極端な外れ値
    意味 データの約99.7パーセントがこの広い範囲内に収まり、外側にはほとんど残りません。
    アクション この閾値を超えるデータポイントは極めて稀であり、異常値として調査されるべきです。
  • 0 ゼロ分散
    意味 標準偏差がゼロであることは、セット内のすべてのデータポイントが同一であることを示します。
    アクション この変動の欠如が予想通りであるか、あるいは測定エラーを示しているかを確認してください。
範囲 ステータス 意味 アクション
±1 σ 正規分布 正規分布では、全データポイントの約68.3パーセントがこの範囲内に収まります。 これは最も一般的な結果と、データセットの核心的な集中を表しています。
±2 σ 高い変動性 データポイントの約95.4パーセントが平均の2標準偏差以内に収まります。 この範囲外にあるポイントは、多くの場合、統計的に有意であるか、異常であると見なされます。
±3 σ 極端な外れ値 データの約99.7パーセントがこの広い範囲内に収まり、外側にはほとんど残りません。 この閾値を超えるデータポイントは極めて稀であり、異常値として調査されるべきです。
0 ゼロ分散 標準偏差がゼロであることは、セット内のすべてのデータポイントが同一であることを示します。 この変動の欠如が予想通りであるか、あるいは測定エラーを示しているかを確認してください。

この計算機の使い時

有効範囲: 標本標準偏差は、少なくとも2つの数値を含むすべてのデータセットに対して有効です。

標本の場合、n が2未満になるとゼロ除算につながるため、公式が成立しなくなります。標準偏差は外れ値に対して非常に敏感であり、1つの極端な値が結果を大幅に膨らませ、データの全体的な広がりを誤って伝える可能性があります。

標準偏差は、統計的散らばりの指標として最も広く使用されており、グループのメンバーがそのグループの平均値からどれだけ異なっているかを定量化します。これは、市場のボラティリティや投資リスクを測定するために使用される金融など、さまざまな分野で不可欠なツールです。標準偏差が低い場合はデータポイントが平均に非常に近い傾向があることを示し、標準偏差が高い場合はデータポイントが広い範囲の値に分散していることを示します。この計算は、研究者やアナリストがデータの信頼性と一貫性を理解することを可能にするため、不可欠です。製造や品質管理において、標準偏差は、ボルトの長さ cm (in) などの製品のばらつきが許容範囲内にあるか、プロセスが安定しているかを判断するのに役立ちます。プロセスが目標からどれだけ逸脱しているかを特定することで、エンジニアは製品が厳格な仕様を満たすように改善を実施できます。さらに、この概念は、事実上すべての結果が平均の非常に狭い範囲内に収まるようにプロセスのばらつきを減らすことを目的としたシックスシグマ手法の中心となっています。標準偏差を理解することで、特定のポイントが平均から何標準偏差離れているかを決定するZスコアの使用も可能になり、異なるデータセットからのデータポイントの比較が可能になります。

関連する計算ツール

よくある質問

高い標準偏差は、データポイントがより広い範囲の値に分散していることを示し、高い変動性や不一致を示唆しています。金融では、これはしばしば高いリスクを表し、製造では、生産プロセスの精度の欠如を意味する場合があります。データが平均の周りにあまり密集していないことを示しています。

母標準偏差はグループの全メンバーが測定される場合に使用され、標本標準偏差はサブセットに基づいてより大きなグループの変動性を推定します。標本の公式では、より正確で偏りのない推定値を提供するために、ベッセル補正として知られる n - 1 を分母に使用します。

68-95-99.7則(経験則)は、正規分布において、ほぼすべてのデータが平均の3標準偏差以内に収まることを述べています。具体的には、68パーセントが1標準偏差以内、95パーセントが2標準偏差以内、99.7パーセントが3標準偏差以内に収まります。これは外れ値を特定し、特定のデータポイントの確率を理解するのに役立ちます。

標準偏差は、2乗された値の合計である分散の平方根として計算されるため、負になることはありません。最小の可能性のある値はゼロであり、これはすべてのデータポイントが同一であることを示します。負の値を計算した場合は、算術または公式の適用に誤りがある可能性があります。

標準偏差は単純に分散の平方根です。分散は2乗された単位で広がりの数学的な記述を提供しますが、標準偏差はその広がりを元のデータと同じ単位で表現します。これにより、標準偏差は実世界の測定値や比較において、はるかに解釈しやすく適用しやすくなります。

通常のベルカーブに従わない複雑なデータ分布を扱う場合や、小さなサンプルに基づいて重大な決定を下す場合には、専門の統計家に相談すべきです。専門家は、基本的な標準偏差を超えた高度な手法を適用し、結論が数学的に健全であり、潜在的なバイアスが考慮されていることを確認する手助けができます。