728x90
Accuracy는 데이터의 내용이 정확한 지
예를 들어 A의 계좌에 $1 million이 존재한다는 데이터의 내용이 실제와 같은가?
Completeness는 필요한 데이터가 모두 존재하는 지
예를 들어 First, Middle, Last name중 Middle도 필요한 데, Middle도 존재하는 지
Reliability는 해당 데이터가 다른 소스에서 온 데이터와 일치하는 지
예를 들어 S로 온 데이터에서 A의 생년월일과 T로 온 데이터에서 A의 생년월일이 같은지
Relevance는 해당 데이터가 정말로 필요한 지
예를 들어 날씨 정보를 크롤링하는 데 정말로 이게 필요한 것인 지
Timeliness는 해당 데이터가 얼마나 최신의 것인 지
예를 들어 과거의 데이터가 현재의 것으로 렌더링 된 것인지
기본적으로 새로운 도메인의 데이터를 까볼 때 위의 내용들이 충분히 자연스럽게 떠오르지만
DB를 설계한다거나 분석에 앞서서, 위의 ACRRT를 염두하여 빠뜨린 것은 없는 지 체크하는 데에 사용하자.
728x90
'ML' 카테고리의 다른 글
[Tensorflow][Keras]Memory leak from Multiple call fit (0) | 2020.11.20 |
---|---|
(미완)[MachineLearning] SVM(Support Vector Machine)이란 (0) | 2020.11.14 |
Bias-Variance Tradeoff (0) | 2020.11.10 |
[MachineLearning] Optimizer에 대해서 (0) | 2020.11.05 |
[MachineLearning] Batch Normalization (0) | 2020.11.05 |