상관관계
-
편상관계수 정의 및 파이썬 코드 구현(Partial Correlation Coefficient)Data Science/데이터마이닝 2023. 5. 7. 22:31
데이터 분석에 있어서 가장 많이 활용되는 기법 중 하나로 상관관계 분석이 있다. 그러나 실제 현업의 데이터에서는 여러 독립변수들이 직/간접적으로 영향을 미치며 이에 대한 정확한 상관관계/인과관계의 분석이 어렵다. 그렇기에 단순히 상관관계만을 보고 분석을 하는것은 한계가 있으며, 같이 활용 될 수 있는 편상관계수를 설명하고, 파이썬 코드로 구현하는 예시를 작성해본다. 1. 상관계수의 정의 및 한계(Correlation Coefficient) 상관계수는 두 변수간의 상호관계정도를 나타내는 통계적 수치이다. -1 ~ +1 사이의 값을 가지며, -1일때 완벽한 음의 상관관계 그리고 +1일때 완벽한 양의 상관관계를 나타낸다. 주의할 점은 상관계수가 0일 경우 상관관계가 0인 것이 아닌, 선형의 상관관계가 보이지 ..