통계 함수 정리(평균, 중앙값, 표준편차, 왜도, 첨도, 분산)

2021. 6. 18. 09:21

통계 함수(평균, 중앙값, 표준편차, 왜도, 첨도, 분산) 공부하면서 필요한 내용을 정리해보자.

평균에도 여러가지가 있다. 산술평균, 가중평균, 기하평균 등

산술평균 算術平均

몇 가지 항목의 수치를 합계한 값을 그 항목수로 나눈 것이다. 통계적으로는 각 항목의 중요도를 곁들인 것(가중치를 곱한다고 함)을 가중산술평균이라고 하며 그것이 없는 단순산술평균과 구별한다. 계산이 간단하므로 물가지수 등의 작성에 사용되고 있으나 극단적인 수치의 항목에 영향을 받기 쉬운 결점이 있다. (출처:매경시사용어사전)

산술평균은 엑셀에서 AVERAGE 함수를 이용 할 수 있다.

AVERAGE 함수

인수의 평균(연산 평균)을 반환합니다. 예를 들어 범위 A1:A20에 숫자가 포함된 경우 수식 =AVERAGE(A1:A20)는 해당 숫자의 평균을 반환합니다.

AVERAGE(number1, [number2], ...)

AVERAGE 함수 구문에는 다음과 같은 인수가 사용됩니다.

number1 필수 요소입니다. 평균을 구하려는 첫째 숫자, 셀 참조 또는 범위입니다.
number2, ... 선택 요소입니다. 평균을 구하려는 추가 숫자, 셀 참조 또는 범위로서 255까지 지정할 수 있습니다.

가중산술평균 加重算術平均

몇 가지 항목의 수치를 합계한 값을 그 항목수로 나눈 것이다. 통계적으로는 각 항목의 중요도를 곁들인 것(가중치를 곱한다고 함)을 가중산술평균이라고 하며 그것이 없는 단순산술평균과 구별된다. 계산이 간단하므로 물가지수 등의 작성에 사용되고 있으나 극단적인 수치의 항목에 영향을 받기 쉬운 결점이 있다.(출처:매경시사용어사전)

가중평균은 엑셀에서 SUMPRODUCT함수와 SUM함수를 이용해서 구할 수 있다.

가중평균.xlsx

0.02MB

기하평균 機何平均

여러 개의 수를 연속으로 곱해 그 개수의 거듭제곱근으로 구한 수. 흔히 인구성장률이나 경제성장률을 구할 때 적용된다. 기하평균은 집단의 변량에 부(負)의 값이 나타나지 않을 경우에 한해서 이용되며, 다소 계산이 복잡하나 변량의 극단적인 값의 영향을 받지 않는다.(출처:매경시사용어사전)

산술평균은 엑셀에서 GEOMEAN 함수를 이용 할 수 있다.

GEOMEAN 함수

양수 데이터 배열 또는 참조 영역에 대한 기하 평균을 반환합니다. 예를 들어 GEOMEAN 함수를 사용하면 주어진 변동 복리의 평균 증가율을 계산할 수 있습니다.

GEOMEAN(number1, [number2], ...)

GEOMEAN 함수 구문에는 다음과 같은 인수가 사용됩니다.

number1, number2, ... number1은 필수 요소이고, 이후의 number는 선택 요소입니다. 평균을 계산할 인수로, 1개에서 255개까지 지정할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

평균과 비슷한 엑셀 함수로 MEDIAN, MODE 등이 있으니 참고바랍니다.

MEDIAN 함수 (중앙값)

주어진 수 집합의 중간값을 반환합니다. 중간값은 수 집합의 중간에 있는 값입니다.

MEDIAN(number1, [number2], ...)

MEDIAN 함수 구문에는 다음과 같은 인수가 사용됩니다.

number1, number2, ... number1은 필수 요소이고, 이후의 number는 선택 요소입니다. 중간값을 계산할 인수로, 1개에서 255개까지 사용할 수 있습니다.

집합에 있는 숫자의 개수가 짝수이면 MEDIAN 함수는 중간에 있는 두 숫자의 평균을 계산합니다.

MODE 함수 (최빈값)

MODE(number1,[number2],...)

MODE 함수 구문에는 다음과 같은 인수가 사용됩니다.

number1 필수 요소입니다. 최빈값을 계산할 첫 번째 숫자 인수입니다.
number2,... 선택 요소입니다. 최빈값을 계산할 숫자 인수로, 2개에서 255개까지 지정할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

표준편차 標準偏差

통계집단의 분배정도를 나타내는 수치. 단위수를 M, 그들의 산술평균을 N, 변량 X의 도수(빈도)를 F(x)라하면 표준편차 σ 는 √((1/M)ΣF(x)(X - N)²)로 표시된다. 정규분포의 경우 전 집단의 약 2/3에 달하는 68%의 변량이 (N - σ)와 (N + σ)사이에 분포되어 있다.(출처:매경시사용어사전)

다시 풀어 쓰면 표본들이 평균으로 부터 얼마나 떨어져 있는지 나타내는 지표

산술평균은 엑셀에서 STDEV.S 함수를 이용 할 수 있다.

STDEV.S 함수

논리값과 텍스트를 무시하고 표본의 표준 편차를 예측합니다.

표준 편차를 통해 값이 평균 값에서 벗어나 있는 정도를 알 수 있습니다.

STDEV.S(number1,[number2],...)

STDEV.S 함수 구문에는 다음과 같은 인수가 사용됩니다.

number1 필수 요소입니다. 모집단 표본에 해당하는 첫 번째 숫자 인수입니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.
number2, ... 선택 요소입니다. 모집단 표본에 해당하는 숫자 인수로, 2개에서 254개까지 지정할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

왜도

비대칭도(非對稱度, skewness) 또는 왜도(歪度)는 실수 값 확률 변수의 확률 분포 비대칭성을 나타내는 지표이다. 왜도의 값은 양수나 음수가 될 수 있으며 정의되지 않을 수도 있다. 왜도가 음수일 경우에는 확률밀도함수의 왼쪽 부분에 긴 꼬리를 가지며 중앙값을 포함한 자료가 오른쪽에 더 많이 분포해 있다. 왜도가 양수일 때는 확률밀도함수의 오른쪽 부분에 긴 꼬리를 가지며 자료가 왼쪽에 더 많이 분포해 있다는 것을 나타낸다.

평균과 중앙값이 같으면 왜도는 0이 된다.

SKEW 함수

분산의 오차를 반환합니다. 비대칭은 평균을 중심으로 분포의 비대칭 정도를 특성화합니다. 양수 비대칭은 비대칭 꼬리가 더 양수 값으로 확장되는 분포를 나타냅니다. 음수 비대칭 꼬리가 음수 값으로 확장되는 분포를 나타냅니다.

SKEW(number1, [number2], ...)

SKEW 함수 구문에는 다음과 같은 인수가 사용됩니다.

number1, number2, ... number1은 필수 요소이고, 이후의 number는 선택 요소입니다. 왜곡도를 계산할 인수이며 1개부터 255개까지 사용할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

첨도

첨도(尖度, 영어: kurtosis 커토시스)는 확률분포의 뾰족한 정도를 나타내는 척도이다. 관측치들이 어느 정도 집중적으로 중심에 몰려 있는가를 측정할 때 사용된다.

첨도값(K)이 3에 가까우면 산포도가 정규분포에 가깝다.

3보다 작을 경우에는(K<3) 산포는 정규분포보다 더 뾰족한 분포(꼬리가 얇은 분포)로 생각할 수 있다.

첨도값이 3보다 큰 양수이면(K>3) 정규분포보다 더 완만한 납작한 분포(꼬리가 두꺼운 분포)로 판단할 수 있다.

KURT 함수

데이터 집합의 kurtosis를 반환합니다. Kurtosis는 일반 분포와 비교하여 분포의 상대적 피크화도 또는 평탄성을 특징으로 합니다. 양수 kurtosis는 비교적 피크 분포를 나타냅니다. 음수 kurtosis는 비교적 평평한 분포를 나타냅니다.

KURT(number1, [number2], ...)

KURT 함수 구문에는 다음과 같은 인수가 사용됩니다.

number1, number2, ... number1은 필수 요소이고, 이후의 number는 선택 요소입니다. 첨도를 계산할 인수로, 1개에서 255개까지 지정할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

VAR 함수

표본의 분산을 예측합니다.

VAR(number1,[number2],...)

VAR 함수 구문에는 다음과 같은 인수가 사용됩니다.

number1 필수 요소입니다. 모집단 표본에 해당하는 첫 번째 숫자 인수입니다.
number2, ... 선택 요소입니다. 모집단 표본에 해당하는 숫자 인수로, 2개에서 255개까지 지정할 수 있습니다.

VAR.S 함수

논리값과 텍스트를 무시하고 표본의 분산을 예측합니다.

VAR.S(number1,[number2],...)

VAR.S 함수 구문에는 다음과 같은 인수가 사용됩니다.

number1 필수 요소입니다. 모집단 표본에 해당하는 첫 번째 숫자 인수입니다.
number2, ... 선택 요소입니다. 모집단 표본에 해당하는 숫자 인수로, 2개에서 254개까지 지정할 수 있습니다.

저작자표시 비영리 변경금지

'엑셀' 카테고리의 다른 글

정년 퇴직일을 60세 되는해 12월 31일로 입력하는 방법 (0)	2021.06.18
Free Excel Addin QR4OFFICE (0)	2021.06.18
일정 간격으로 떨어져 있는 열의 값만 더하기 (0)	2021.06.11
시트보호 패스워드를 잊어버렸어요. 시트보호 해제 방법 (0)	2021.06.11
Excel의 빠른 채우기 사용 (0)	2021.06.08

도토리엑셀