728x90
즉 왜 Arithmetic mean, Geometric mean이 아니라 Harmonic mean으로 했는가?
1.
AM >= GM >= HM인 와중에 HM으로 정의함으로서
좀 더 낮은 값인 HM을 통해, reliable함을 얻을 수 있다.
2.
large outlier metric에 대한 기여를 낮출 수 있다.
즉, precision과 recall 중 하나가 나머지 하나에 비해 클 때, 그 큰 값의 영향력을 보정하여 mesure함
3. 주어진 데이터 값의 scale/unit이 어떻냐에 따라 활용하는 mean이 다르다.
AM은 각각이 same units일 때
GM은 각각이 다른 units일 때
HM은 각각이 rate일 때
4. (Fbeta를 쓰는 이유)
recall이 precision보다 beta만큼 더 중요도를 부과하고 싶다면(weighted harmonic mean)
그 때의 weighted harmonic mean으로 fbeta사용(beta=2->recall이 precision보다 2배 중요)
참고자료:
Harmonic Mean (mathsisfun.com)
Arithmetic, Geometric, and Harmonic Means for Machine Learning (machinelearningmastery.com)
728x90
'Math' 카테고리의 다른 글
변수의 종류(quantatative, categorical, ratio scale, interval scale, ordinal scale, nominal scale) (0) | 2020.12.12 |
---|---|
[Statistics] Skewness & Kurtosis (0) | 2020.11.15 |
(미완)Softmax with scale converges to Hardmax(argmax) when (0) | 2020.11.06 |
(미완)Missing data를 어떻게 다룰 것인가 (0) | 2020.10.26 |
[Statistics]Likelihood, MLE, MAP (0) | 2020.10.25 |