728x90

Accuracy는 데이터의 내용이 정확한 지

예를 들어 A의 계좌에 $1 million이 존재한다는 데이터의 내용이 실제와 같은가?

 

Completeness는 필요한 데이터가 모두 존재하는 지

예를 들어 First, Middle, Last name중 Middle도 필요한 데, Middle도 존재하는 지

 

Reliability는 해당 데이터가 다른 소스에서 온 데이터와 일치하는 지

예를 들어 S로 온 데이터에서 A의 생년월일과 T로 온 데이터에서 A의 생년월일이 같은지

 

Relevance는 해당 데이터가 정말로 필요한 지

예를 들어 날씨 정보를 크롤링하는 데 정말로 이게 필요한 것인 지

 

Timeliness는 해당 데이터가 얼마나 최신의 것인 지

예를 들어 과거의 데이터가 현재의 것으로 렌더링 된 것인지

 

 

 

기본적으로 새로운 도메인의 데이터를 까볼 때 위의 내용들이 충분히 자연스럽게 떠오르지만

DB를 설계한다거나 분석에 앞서서, 위의 ACRRT를 염두하여 빠뜨린 것은 없는 지 체크하는 데에 사용하자.

 

728x90

+ Recent posts