주의점
-
스마트팩토리에서 수치 데이터 기반 예측 모델 프로젝트를 하면서 주의할 점들Data Science/데이터마이닝 2023. 4. 23. 20:46
이번 글에서는 회귀 예측 모델을 기반으로한 프로젝트들을 진행하면서, 짚고 넘어가야하는 부분에 대해서 글을 작성해보려한다. 해당 글에서 나오는 모든 내용은 경험 기반의 내용들로 빠진 부분이나 틀린 부분이 있다면 피드백 주시기바란다. 1. 데이터 정합성 확인(실제로 내가 생각하는 데이터가 들어오고 있는가?) 통상적으로 수치 데이터 과제를 진행한다면, 여러 DB에서 얻어진 데이터를 기반으로 진행하게 된다. 이때, 사용하는 데이터들이 실제로 측정되고 있는 값인지, 도메인적/수치적으로 정합한 값인지 꼭 확인하는 과정이 필요하다. 아래는 실제로 발생했던 케이스 들을 예시로 들어본다. 1) 센싱된 데이터가 잘못된 값일 경우 수치적으로는 이상이 없는 변수였으나, 도메인적 사실과 너무 다른 양상을 보이기에 확인해본 결과..