728x90
먼저 변수는 2가지로 나뉜다. Quantitative냐 Categorical이냐
숫자로 측정되면 Quantitative, 범주로 측정되면 Categorical
먼저 변수의 성질부터 알아보자.
(1) 두 변수의 비율이 의미가 유지되는가?
(2) 두 변수의 차이의 의미가 유지되는가?
(3) 두 변수간 대소비교가 가능한가?
3가지 모두 만족 -> Ratio scale, 예를 들면 대한민국의 매년 GDP값(quantative)
(2), (3)만 만족 -> Interval scale, 예를 들면 년도와 온도(0이 절대 0이라는 의미를 갖고 있지 않아 비율로써 의미가 없음)(quantatative)
(3)만 만족 -> Ordinal scale, 예를 들면 학점(A, B, C, D, F), 순위 비교는 가능하지만 사칙연산이 의미가 보존되지 않음(categorical)
(1), (2), (3) 모두 불만족 -> Nominal scale, 예를 들면 종교, 남성/여성
고용상태는? Nominal(Ordinal로 착각하면 안됨)
사람의 몸무게(kg)은? Ratio
산성도(ph)는? Interval
728x90
'Math' 카테고리의 다른 글
F1-score을 왜 Harmonic mean of precision and recall으로 정의하였을까 (0) | 2020.12.20 |
---|---|
[Statistics] Skewness & Kurtosis (0) | 2020.11.15 |
(미완)Softmax with scale converges to Hardmax(argmax) when (0) | 2020.11.06 |
(미완)Missing data를 어떻게 다룰 것인가 (0) | 2020.10.26 |
[Statistics]Likelihood, MLE, MAP (0) | 2020.10.25 |