오리진 위키
Advertisement

상위 항목: 기술통계량

범위

최댓값

  • 자료값 중 가장 큰 값

최솟값

  • 자료값 중 가장 작은 값

범위

  • 최댓값 - 최솟값

사분위수

자료값을 작은 값부터 순서대로 정렬하고 이를 4등분했을 경우, 각각의 4등분(25%)되는 위치에 해당하는 값

  • Q1 = 25%
  • Q2 = 50%(중앙값)
  • Q3 = 75%
  • Q4 = 100%(최댓값)

사분위 범위

  • Q3 - Q1

상자와 수염 그림

다섯 숫자 요약을 그림으로 표현

다섯 숫자:

  • 최솟값(0%), Q1(25%), 중앙값(50%), Q3(75%), 최댓값(Q4, 100%)

상자 수염 그림.jpg

편차

자료값과 중심 척도 간의 차이점

편차 공식:

  • Xi - ¯X

편차의 합 = 0 → 편차의 평균 = 0

분산과 표준편차

분산.JPG

분산

  • X1, X2..., XN의 평균값을 ¯X라 할 때 평균에 대한 편차의 제곱합을 n-1로 나눈 값

표준편차

  • 분산에 루트 씌운것

예제

14, 9, 1, 22, 1, 4, 5, 17, 24, 3에서 다음을 구하시오

중앙값

최빈값

범위

평균

편차

분산

표준편차

표준편차, 사분위 번위, 범위의 비교

표준편차

  • 평균을 대표값으로 사용할 경우 적합
  • 단점: 극단적인 값에 영향을 많이 받는다

사분위 범위

  • 중앙값을 대표값으로 사용할 경우 적합
  • 단점: 각 관측값의 퍼진 정도를 전체적으로 반영하지 못한다

범위

  • 전체 관측값의 퍼진 정도 반영 가능
  • 단점: 극단적인 값에 영향을 받는다, 관측값을 골고루 반영하지 않는다

변동계수

단위가 다르거나 중심위치가 다른 두 개 이상의 분포를 비교할 때 사용하는 수치

상대적으로 퍼진 정도를 나타내는 수치

변동계수 식

  • 표준편차 ÷ 평균 × 100
  • 예) <A 표본> 평균 4, 표준편차 1 = 37.5
  • <B 표본> 평균 70, 표준편차 14 = 20
  • A 표본이 B 표본보다 퍼짐 정도가 더 크다

데이터의 상대적 위치 측정

해당 문서 참조

모수

모집단을 구성하고 있는 데이터의 특성

모수의 종류

위치모수

  • 모집단의 데이터가 이루는 분포의 중심위치를 나타냄
  • 예) 평균(μ)

척도모수

  • 모집단의 데이터가 퍼져있는 정도를 나타냄
  • 예) 분산(σ2), 표준편차(σ)

형상모수

  • 모집단의 데이터가 이루는 분포의 형태를 나타냄
  • 예) 왜도, 첨도
Advertisement