Standard Deviation
Spread in the data’s own units · 표준편차
1. What Is Standard Deviation?
The standard deviation σ measures how far, on average, the values of a data set sit from their mean — expressed in the same units as the data. It is simply the square root of the variance, which undoes the squaring that variance introduces.
Because it shares the data’s units (dollars, centimetres, seconds), the standard deviation is far easier to interpret than variance and is the spread measure you see reported in practice.
표준편차 σ는 데이터 값들이 평균에서 평균적으로 얼마나 떨어져 있는지를 데이터와 같은 단위로 나타냅니다. 분산의 제곱근으로, 분산이 만든 제곱을 되돌립니다. 데이터와 같은 단위(달러·cm·초)를 쓰기 때문에 분산보다 해석이 훨씬 쉬워 실무에서 산포 지표로 가장 많이 보고됩니다.
2. The σ = √variance Formula & a Worked Example
The formula is σ = √(Σ(xᵢ − μ)² / n) — compute the variance, then take its square root.
Worked example. Data set 2, 4, 4, 4, 5, 5, 7, 9 (n = 8):
- Mean: μ = 40 / 8 = 5.
- Sum of squared deviations: 9 + 1 + 1 + 1 + 0 + 0 + 4 + 16 = 32.
- Variance: 32 / 8 = 4.
- Standard deviation: √4 = 2.
So σ = 2 — on average the values sit about 2 units from the mean of 5.
공식은 σ = √(Σ(xᵢ − μ)²/n)으로, 분산을 구한 뒤 제곱근을 취합니다. 예: 2,4,4,4,5,5,7,9 (n=8) → 평균 5, 제곱편차 합 32, 분산 4, √4 = 2. 따라서 σ = 2로, 값들이 평균 5에서 평균적으로 약 2만큼 떨어져 있습니다.
3. The 68-95-99.7 Rule
For data shaped like the normal (bell) curve, the standard deviation reads off proportions directly: about 68 % of values fall within ±1σ of the mean, 95 % within ±2σ, and 99.7 % within ±3σ — the empirical rule.
So if exam scores are normal with mean 70 and σ = 8, roughly 95 % of students score between 70 − 16 = 54 and 70 + 16 = 86. A value beyond 3σ is rare enough (about 1 in 370) to flag as an outlier.
정규분포(종 모양) 데이터에서는 표준편차로 비율을 바로 읽을 수 있습니다: 값의 약 68%가 평균 ±1σ, 95%가 ±2σ, 99.7%가 ±3σ 안에 들어갑니다(경험 법칙). 시험 점수가 평균 70, σ=8인 정규분포라면 약 95%가 54~86점에 분포하며, 3σ를 벗어나는 값(약 1/370)은 이상치로 의심합니다.
4. Key Properties & Common Mistakes
- Same units as the data. Unlike variance (squared units), σ is directly comparable to the values and the mean.
- Square root of variance. Always compute variance first, then take the root — don’t forget the root.
- Population vs sample. The sample standard deviation divides by n − 1: s = √(32/7) ≈ 2.14 for the data above.
- Outlier-sensitive. Built on squared deviations, so extreme values inflate it; pair it with the median/IQR when outliers exist.
분산(제곱 단위)과 달리 σ는 데이터·평균과 같은 단위라 바로 비교됩니다. 분산을 먼저 구한 뒤 제곱근을 취하며 루트를 빠뜨리지 마세요. 표본 표준편차는 n−1로 나눠 위 데이터에서 s = √(32/7) ≈ 2.14입니다. 제곱편차 기반이라 이상치에 민감하니 이상치가 있으면 중앙값·IQR과 함께 봅니다.
5. Frequently Asked Questions
What is the formula for standard deviation? σ = √(variance) = √(Σ(xᵢ − μ)² / n) — the square root of the average squared deviation from the mean.
What’s the difference between variance and standard deviation? Variance is in squared units; the standard deviation is its square root, back in the data’s original units, so it is easier to interpret.
What does the 68-95-99.7 rule say? For normal data, about 68 %, 95 %, and 99.7 % of values lie within 1, 2, and 3 standard deviations of the mean.
표준편차는 σ = √(분산) = √(Σ(xᵢ − μ)²/n)입니다. 분산은 제곱 단위, 표준편차는 그 제곱근이라 원래 단위로 돌아와 해석이 쉽습니다. 68-95-99.7 규칙은 정규분포에서 값의 약 68%·95%·99.7%가 평균 ±1σ·±2σ·±3σ에 든다는 뜻입니다.
Want the answer for your own data? The Standard Deviation Calculator computes the mean, variance, and both population and sample SD instantly.
Ready to practice? Drill standard deviation and more on C:Stat, or review the full statistics reference and related pages: variance, mean, and correlation.
내 데이터로 바로 계산하려면 표준편차 계산기로 평균·분산·모집단/표본 표준편차를 즉시 구하세요. 실전 연습은 C:Stat에서, 전체 개념은 통계 레퍼런스와 분산, 평균, 상관계수 문서에서 이어집니다.