본문 바로가기
AI/AI 부트캠프

[AI 부트캠프] DAY 62 - 머신러닝 프로젝트 6

by HOHHOH 2023. 10. 19.

[오늘의 일지]

머신러닝 프로젝트 - 시간순으로 상관관계 확인, 다시 피처 선택

[상세 내용]

머신러닝 프로젝트

시간순으로 상관관계 확인

- 대회가 초기화되면서 초기화되는 과정에서 피처 선택의 중요도를 제대로 확인했기 때문에 일단 피처들을 시간 순서대로 다시 상관관계를 확인해서 타깃과 상관관계가 높은 피처로만 다시 설정하기로 했습니다. 상관관계를 찾는 과정에서 지난번에 사용했던 로그변환을 취해주니 매우 높은 상관관계를 발견하기도 했습니다.

 

- 타깃 피처가 CI_HOUR인데 DIST와 상관관계가 0.8로 올라감

상관관계 히트맵

 

다시 피처 선택

- 타깃 피처와 상관관계가 상대적으로 높은 피처들로 13개를 선정해서 다시 optuna를 통해서 최적의 하이퍼파라미터를 찾고 있습니다. 근데 이제는 미래 예측 데이터라고 볼 수 있는 피처들이 모두 사라졌기 때문에 또다시 정체 구간에 진입한 거 같습니다. 

 

[마무리]

 오늘은 다시 새롭게 시작된 대회를 처음으로 돌아가서 피처 파악부터 다시 하였습니다. 우선 상관관계가 중요할 거 같아서 히트맵으로 파악한 뒤 다시 학습과 하이퍼파라미터를 찾는 과정을 시작했는데 사실 전 상황에서 크게 달라진 것이 없습니다. 이제 프로젝트가 2일밖에 남지 않았기 때문에 일단 내일은 프로젝트 과정을 정리해 보도록 하겠습니다.

반응형

댓글