반응형

통계 함수(평균, 중앙값, 표준편차, 왜도, 첨도, 분산) 공부하면서 필요한 내용을 정리해보자.

 

평균에도 여러가지가 있다. 산술평균, 가중평균, 기하평균 등

 

산술평균 算術平均 

몇 가지 항목의 수치를 합계한 값을 그 항목수로 나눈 것이다. 통계적으로는 각 항목의 중요도를 곁들인 것(가중치를 곱한다고 함)을 가중산술평균이라고 하며 그것이 없는 단순산술평균과 구별한다. 계산이 간단하므로 물가지수 등의 작성에 사용되고 있으나 극단적인 수치의 항목에 영향을 받기 쉬운 결점이 있다. (출처:매경시사용어사전)

산술평균은 엑셀에서  AVERAGE 함수를 이용 할 수 있다.

 

AVERAGE 함수

인수의 평균(연산 평균)을 반환합니다. 예를 들어 범위 A1:A20에 숫자가 포함된 경우 수식 =AVERAGE(A1:A20)는 해당 숫자의 평균을 반환합니다.

 

AVERAGE(number1, [number2], ...)

AVERAGE 함수 구문에는 다음과 같은 인수가 사용됩니다.

  • number1    필수 요소입니다. 평균을 구하려는 첫째 숫자, 셀 참조 또는 범위입니다.
  • number2, ...    선택 요소입니다. 평균을 구하려는 추가 숫자, 셀 참조 또는 범위로서 255까지 지정할 수 있습니다.

 

 

가중산술평균 加重算術平均 

몇 가지 항목의 수치를 합계한 값을 그 항목수로 나눈 것이다. 통계적으로는 각 항목의 중요도를 곁들인 것(가중치를 곱한다고 함)을 가중산술평균이라고 하며 그것이 없는 단순산술평균과 구별된다. 계산이 간단하므로 물가지수 등의 작성에 사용되고 있으나 극단적인 수치의 항목에 영향을 받기 쉬운 결점이 있다.(출처:매경시사용어사전)

가중평균은 엑셀에서 SUMPRODUCT함수와 SUM함수를 이용해서 구할 수 있다.

 

가중평균.xlsx
0.02MB

 

기하평균  機何平均

여러 개의 수를 연속으로 곱해 그 개수의 거듭제곱근으로 구한 수. 흔히 인구성장률이나 경제성장률을 구할 때 적용된다. 기하평균은 집단의 변량에 부(負)의 값이 나타나지 않을 경우에 한해서 이용되며, 다소 계산이 복잡하나 변량의 극단적인 값의 영향을 받지 않는다.(출처:매경시사용어사전)

산술평균은 엑셀에서  GEOMEAN 함수를 이용 할 수 있다.

 

GEOMEAN 함수

양수 데이터 배열 또는 참조 영역에 대한 기하 평균을 반환합니다. 예를 들어 GEOMEAN 함수를 사용하면 주어진 변동 복리의 평균 증가율을 계산할 수 있습니다.

 

GEOMEAN(number1, [number2], ...)

GEOMEAN 함수 구문에는 다음과 같은 인수가 사용됩니다.

  • number1, number2, ...    number1은 필수 요소이고, 이후의 number는 선택 요소입니다. 평균을 계산할 인수로, 1개에서 255개까지 지정할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

 

평균과 비슷한 엑셀 함수로 MEDIAN, MODE 등이 있으니 참고바랍니다.

 

MEDIAN 함수 (중앙값)

주어진 수 집합의 중간값을 반환합니다. 중간값은 수 집합의 중간에 있는 값입니다.

MEDIAN(number1, [number2], ...)

MEDIAN 함수 구문에는 다음과 같은 인수가 사용됩니다.

  • number1, number2, ...    number1은 필수 요소이고, 이후의 number는 선택 요소입니다. 중간값을 계산할 인수로, 1개에서 255개까지 사용할 수 있습니다.

집합에 있는 숫자의 개수가 짝수이면 MEDIAN 함수는 중간에 있는 두 숫자의 평균을 계산합니다.

 

 

MODE 함수 (최빈값)

MODE(number1,[number2],...)

MODE 함수 구문에는 다음과 같은 인수가 사용됩니다.

  • number1     필수 요소입니다. 최빈값을 계산할 첫 번째 숫자 인수입니다.
  • number2,...     선택 요소입니다. 최빈값을 계산할 숫자 인수로, 2개에서 255개까지 지정할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

 

 

표준편차 標準偏差 

통계집단의 분배정도를 나타내는 수치. 단위수를 M, 그들의 산술평균을 N, 변량 X의 도수(빈도)를 F(x)라하면 표준편차 σ 는 √((1/M)ΣF(x)(X - N)²)로 표시된다. 정규분포의 경우 전 집단의 약 2/3에 달하는 68%의 변량이 (N - σ)와 (N + σ)사이에 분포되어 있다.(출처:매경시사용어사전)

다시 풀어 쓰면 표본들이 평균으로 부터 얼마나 떨어져 있는지 나타내는 지표

산술평균은 엑셀에서  STDEV.S 함수를 이용 할 수 있다.

 

STDEV.S 함수

논리값과 텍스트를 무시하고 표본의 표준 편차를 예측합니다.

표준 편차를 통해 값이 평균 값에서 벗어나 있는 정도를 알 수 있습니다.

 

STDEV.S(number1,[number2],...)

STDEV.S 함수 구문에는 다음과 같은 인수가 사용됩니다.

  • number1     필수 요소입니다. 모집단 표본에 해당하는 첫 번째 숫자 인수입니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.
  • number2, ...     선택 요소입니다. 모집단 표본에 해당하는 숫자 인수로, 2개에서 254개까지 지정할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

 

 

왜도

비대칭도(非對稱度, skewness) 또는 왜도(歪度)는 실수 값 확률 변수의 확률 분포 비대칭성을 나타내는 지표이다. 왜도의 값은 양수나 음수가 될 수 있으며 정의되지 않을 수도 있다. 왜도가 음수일 경우에는 확률밀도함수의 왼쪽 부분에 긴 꼬리를 가지며 중앙값을 포함한 자료가 오른쪽에 더 많이 분포해 있다. 왜도가 양수일 때는 확률밀도함수의 오른쪽 부분에 긴 꼬리를 가지며 자료가 왼쪽에 더 많이 분포해 있다는 것을 나타낸다.

평균과 중앙값이 같으면 왜도는 0이 된다.

 

SKEW 함수

분산의 오차를 반환합니다. 비대칭은 평균을 중심으로 분포의 비대칭 정도를 특성화합니다. 양수 비대칭은 비대칭 꼬리가 더 양수 값으로 확장되는 분포를 나타냅니다. 음수 비대칭 꼬리가 음수 값으로 확장되는 분포를 나타냅니다.

SKEW(number1, [number2], ...)

SKEW 함수 구문에는 다음과 같은 인수가 사용됩니다.

  • number1, number2, ...    number1은 필수 요소이고, 이후의 number는 선택 요소입니다. 왜곡도를 계산할 인수이며 1개부터 255개까지 사용할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

 

첨도

첨도(尖度, 영어: kurtosis 커토시스)는 확률분포의 뾰족한 정도를 나타내는 척도이다. 관측치들이 어느 정도 집중적으로 중심에 몰려 있는가를 측정할 때 사용된다.

첨도값(K)이 3에 가까우면 산포도가 정규분포에 가깝다.

3보다 작을 경우에는(K<3) 산포는 정규분포보다 더 뾰족한 분포(꼬리가 얇은 분포)로 생각할 수 있다.

첨도값이 3보다 큰 양수이면(K>3) 정규분포보다 더 완만한 납작한 분포(꼬리가 두꺼운 분포)로 판단할 수 있다.

 

KURT 함수

데이터 집합의 kurtosis를 반환합니다. Kurtosis는 일반 분포와 비교하여 분포의 상대적 피크화도 또는 평탄성을 특징으로 합니다. 양수 kurtosis는 비교적 피크 분포를 나타냅니다. 음수 kurtosis는 비교적 평평한 분포를 나타냅니다.

 

KURT(number1, [number2], ...)

KURT 함수 구문에는 다음과 같은 인수가 사용됩니다.

  • number1, number2, ...    number1은 필수 요소이고, 이후의 number는 선택 요소입니다. 첨도를 계산할 인수로, 1개에서 255개까지 지정할 수 있습니다. 쉼표로 구분된 인수 대신 단일 배열이나 배열에 대한 참조를 사용할 수도 있습니다.

 

VAR 함수

표본의 분산을 예측합니다.

 

VAR(number1,[number2],...)

VAR 함수 구문에는 다음과 같은 인수가 사용됩니다.

  • number1     필수 요소입니다. 모집단 표본에 해당하는 첫 번째 숫자 인수입니다.
  • number2, ...     선택 요소입니다. 모집단 표본에 해당하는 숫자 인수로, 2개에서 255개까지 지정할 수 있습니다.

 

VAR.S 함수

논리값과 텍스트를 무시하고 표본의 분산을 예측합니다.

VAR.S(number1,[number2],...)

VAR.S 함수 구문에는 다음과 같은 인수가 사용됩니다.

  • number1     필수 요소입니다. 모집단 표본에 해당하는 첫 번째 숫자 인수입니다.
  • number2, ...     선택 요소입니다. 모집단 표본에 해당하는 숫자 인수로, 2개에서 254개까지 지정할 수 있습니다.

 

반응형

+ Recent posts