본문 바로가기

AI/AI 부트캠프77

[AI 부트캠프] DAY 76 - 딥러닝 프로젝트 1 [오늘의 일지] 딥러닝 프로젝트 - 주제 선정, 대회 파악하기, 데이터 파악하기 [상세 내용] 주제 선정 - 우선 주제는 선택지가 두 가지밖에 없었습니다. 케글에서 진행 중인 대회와 이미 끝난 대회 중에서 하나를 선택하는 것이었는데 이왕이면 진행 중인 대회를 선택해서 하는 게 동기부여에 좋을 거 같아서 선택을 했습니다. 그래서 대회의 도메인이 증권시장과 관련이 되어있었는데 증권 관련 도메인 지식이 없다 보니 프로젝트를 진행하는데 난항이 될 거 같다는 생각이 들었습니다. 대회 파악하기 - 대회의 주제는 미국 주식시장인 나스닥에서 시장이 마감하기 10분 전에 데이터들을 활용해서 10초마다 예측되는 target값을 구하는 것이었습니다. target을 구하는 공식이 존재하는데 이걸 그냥 주변 데이터들만을 이용해.. 2023. 11. 8.
[AI 부트캠프] DAY 64 - 머신러닝 프로젝트 8 [오늘의 일지] 머신러닝 프로젝트 - 발표, 프로젝트 최종 리뷰 [상세 내용] 머신러닝 프로젝트 발표 리뷰 - 이번 발표를 들으면서 느낀 점은 전체적으로 지난 프로젝트보다 완성도적인 면에서 극명하게 갈렸던 거 같습니다. 어느 조는 체계적으로 진행한 것 같았고 아닌 조도 많은 거처럼 보였습니다. 난이도적인 측면에서 수업시간에 배웠던 머신러닝 지식을 제외하고도 새롭게 접근해야 하는 부분들이 생각보다 많았기 때문인 거 같았습니다. 특히 우리 조가 했던 프로젝트 주제는 심지어 대회가 초기화되면서 중간에 다시 시작했던 상황이었기 때문에도 그런 느낌을 크게 받았습니다. 다른 조의 발표 내용을 들으면서 머신러닝을 활용하는 분야도 생각보다 더 많다는 것을 느꼈습니다. 그리고 케글이나 데이콘의 대회들의 특징이 머신러닝의.. 2023. 10. 21.
[AI 부트캠프] DAY 63 - 머신러닝 프로젝트 7 [오늘의 일지] 머신러닝 프로젝트 - 지금까지 과정 정리, 발표 자료 만들기 [상세 내용] 머신러닝 프로젝트 지금까지 과정 정리 - 이제 프로젝트가 내일 발표만을 남은 상황입니다. 아직 대회는 한참 친행 중이지만 프로젝트는 마무리해야 되기 때문에 지금까지 과정을 타임라인으로 정리해보려고 합니다. 대회 주제 확인 데이터 확인 베이스 라인 코드 확인 베이스 라인 코드 기반으로 모델링 시작 전처리 및 하이퍼 파라미터 튜닝 후 1차 평가 지표 획득(처음 110등 정도) 평가 지표 정체기(전처리 및 다른 모델 사용 해봤지만 극복 실패) 3가지 모델 앙상블로 평가 지표 상승 대회 초기화 다시 새로운 전처리 후 2차 평가 지표 획득 발표 자료 만들기 - 위에서 정리한 내용들을 토대로 아래의 순서대로 발표자를 만들었습.. 2023. 10. 20.
[AI 부트캠프] DAY 62 - 머신러닝 프로젝트 6 [오늘의 일지] 머신러닝 프로젝트 - 시간순으로 상관관계 확인, 다시 피처 선택 [상세 내용] 머신러닝 프로젝트 시간순으로 상관관계 확인 - 대회가 초기화되면서 초기화되는 과정에서 피처 선택의 중요도를 제대로 확인했기 때문에 일단 피처들을 시간 순서대로 다시 상관관계를 확인해서 타깃과 상관관계가 높은 피처로만 다시 설정하기로 했습니다. 상관관계를 찾는 과정에서 지난번에 사용했던 로그변환을 취해주니 매우 높은 상관관계를 발견하기도 했습니다. - 타깃 피처가 CI_HOUR인데 DIST와 상관관계가 0.8로 올라감 다시 피처 선택 - 타깃 피처와 상관관계가 상대적으로 높은 피처들로 13개를 선정해서 다시 optuna를 통해서 최적의 하이퍼파라미터를 찾고 있습니다. 근데 이제는 미래 예측 데이터라고 볼 수 있는.. 2023. 10. 19.
반응형