Median
The middle of sorted data · 중앙값
1. What Is the Median?
The median is the middle value of a data set once the values are placed in order. Exactly half the data lie at or below it and half at or above it, which makes it the 50th percentile. Unlike the mean, the median cares only about position, not size — so a single huge value barely moves it.
That robustness is why the median is the preferred summary for skewed data such as incomes, home prices, and response times.
중앙값은 데이터를 순서대로 늘어놓았을 때 한가운데 오는 값입니다. 데이터의 절반이 그 아래, 절반이 그 위에 있어 50번째 백분위수에 해당합니다. 평균과 달리 크기가 아니라 위치만 보므로 거대한 값 하나로는 거의 움직이지 않습니다. 이 강건함 때문에 소득·집값·응답 시간처럼 치우친 데이터의 요약값으로 선호됩니다.
2. Finding the Median — Odd and Even Cases
First sort the data. Then:
- Odd count: the median is the single middle value, at position (n + 1) / 2.
- Even count: the median is the average of the two middle values.
Worked example (odd). Sort 3, 5, 7, 8, 12, 13, 14, 18, 21 (n = 9). The middle position is (9 + 1)/2 = 5th, so the median is 12.
Worked example (even). Sort 2, 4, 4, 4, 5, 5, 7, 9 (n = 8). The two middle values are the 4th and 5th: 4 and 5. Their average is (4 + 5)/2 = 4.5.
먼저 정렬합니다. 홀수 개수면 가운데 한 값((n+1)/2 위치), 짝수면 가운데 두 값의 평균입니다. 예(홀수): 3,5,7,8,12,13,14,18,21 (n=9) → 5번째 값 12. 예(짝수): 2,4,4,4,5,5,7,9 (n=8) → 4·5번째 값 4와 5의 평균 4.5.
3. Why the Median Resists Outliers
Take incomes (in thousands) of 40, 42, 45, 50, 55, 60, 850. The mean is (40+42+45+50+55+60+850)/7 ≈ 163, which describes nobody. The median is the 4th sorted value, 50, which matches six of the seven households.
Replacing 850 with 8500 leaves the median at 50 but sends the mean soaring. Because the median depends only on the middle position, extreme values cannot drag it — exactly why “median household income” is the standard economic measure.
소득(천 달러)이 40,42,45,50,55,60,850일 때 평균은 약 163으로 아무도 대표하지 못하지만, 중앙값은 4번째 값 50으로 일곱 가구 중 여섯을 잘 나타냅니다. 850을 8500으로 바꿔도 중앙값은 50 그대로이고 평균만 치솟습니다. 중앙값은 가운데 위치에만 의존하므로 "중위소득"이 표준 경제 지표로 쓰입니다.
4. Key Properties & Common Mistakes
- Sort first. The most common error is reading the middle of an unsorted list.
- Even count means averaging. With an even n, the median is usually not one of the data values.
- Robust to outliers. Up to half the data can be extreme before the median shifts much (high breakdown point).
- Less algebra-friendly. The median has no clean summation formula, so inference still leans on the mean.
반드시 먼저 정렬하세요 — 정렬하지 않은 목록의 가운데를 읽는 것이 가장 흔한 실수입니다. 짝수 개수면 중앙값은 보통 데이터에 없는 값(두 값의 평균)입니다. 이상치에 강해 데이터의 절반까지 극단이어도 크게 흔들리지 않습니다. 다만 깔끔한 합 공식이 없어 추론은 여전히 평균에 의존합니다.
5. Frequently Asked Questions
How do I find the median? Sort the data, then take the middle value if the count is odd, or average the two middle values if the count is even.
What is the median of an even number of values? The average of the two central values. For 2,4,4,4,5,5,7,9, it is (4 + 5)/2 = 4.5.
When is the median better than the mean? For skewed data or data with outliers, because the median is not pulled by extreme values.
중앙값은 정렬 후 홀수면 가운데 값, 짝수면 가운데 두 값의 평균입니다. 짝수 개수의 예: 2,4,4,4,5,5,7,9 → (4+5)/2 = 4.5. 데이터가 치우치거나 이상치가 있으면 극단값에 끌리지 않는 중앙값이 평균보다 낫습니다.
Ready to practice? Drill the median and more on C:Stat, or review the full statistics reference and related pages: mean, variance, and standard deviation.