본문 바로가기

AI126

[AI 부트캠프] DAY 77 - 딥러닝 프로젝트 2 [오늘의 일지] 딥러닝 프로젝트 - EDA와 Feature Engineering [상세 내용] EDA 데이터 파악 - 일단 데이터에 존재하는 주식의 종목의 수를 알아보았습니다. 그리고 하나의 주식에 대한 정보를 파악해 보았습니다. 주식의 종목의 수는 stock_id라는 피처를 중복을 제외시킨 뒤에 개수를 파악해 보니 총 200개의 종목이 있었습니다. 그리고 선택한 하나의 종목에서 시간을 반복해서 나타내는 피처인 seconds_in_bucket의 0초일 때를 파악해서 총 481일의 데이터 자료라는 것도 파악을 했습니다. 그리고 seconds_in_bucket이 주식시장의 마감 10분 전의 10초 단위의 데이터라는 것을 통해서 총 9분을 540초로 바꾸고 10초 단위씩 55단계의 상황을 보여주는 자료라는 것.. 2023. 11. 9.
[AI 부트캠프] DAY 76 - 딥러닝 프로젝트 1 [오늘의 일지] 딥러닝 프로젝트 - 주제 선정, 대회 파악하기, 데이터 파악하기 [상세 내용] 주제 선정 - 우선 주제는 선택지가 두 가지밖에 없었습니다. 케글에서 진행 중인 대회와 이미 끝난 대회 중에서 하나를 선택하는 것이었는데 이왕이면 진행 중인 대회를 선택해서 하는 게 동기부여에 좋을 거 같아서 선택을 했습니다. 그래서 대회의 도메인이 증권시장과 관련이 되어있었는데 증권 관련 도메인 지식이 없다 보니 프로젝트를 진행하는데 난항이 될 거 같다는 생각이 들었습니다. 대회 파악하기 - 대회의 주제는 미국 주식시장인 나스닥에서 시장이 마감하기 10분 전에 데이터들을 활용해서 10초마다 예측되는 target값을 구하는 것이었습니다. target을 구하는 공식이 존재하는데 이걸 그냥 주변 데이터들만을 이용해.. 2023. 11. 8.
[AI 부트캠프] DAY 75 - 딥러닝 11 오늘의 일지] 딥러닝 녹화 강의 - TabNet, AutoEncoder [상세 내용] TabNet - TabNet은 트리 기반의 해석 가능한 딥러닝 모델로, 특히 표 형태의 데이터(탭규칙 형태의 데이터)에 적합한 모델입니다. TabNet은 트리 기반의 모델과 딥러닝 모델의 혼합으로, 각각의 특성을 선택하고 중요한 패턴을 학습하는 데 사용됩니다. TabNet은 탭 네트워크 (Tabular Attention Network)의 약어로, 표 형식 데이터를 처리하기 위해 디자인된 네트워크 구조를 나타냅니다. 원리 피처 선택 및 중요성: TabNet은 각 레이어에서 특성 선택과 특성 중요도를 학습합니다. 이것은 입력 데이터의 각 특성이 얼마나 중요한지를 알려주며, 중요하지 않은 특성은 무시됩니다. 트리 기반 아키텍.. 2023. 11. 7.
[AI 부트캠프] DAY 74 - 딥러닝 10 오늘의 일지] 딥러닝 녹화 강의 - MLP 회귀, 분류 실습 [상세 내용] MLP 회귀, 분류 실습 실습 순서 - 이번 강의는 MLP 딥러닝 모델을 활용해서 현업이나 프로젝트 과정에서 전체적으로 어떻게 작업을 수행하면 좋을지에 대한 내용이었습니다. 강의의 내용을 바탕으로 큰 틀을 잡고 앞으로 하게 될 프로젝트에서 적용하면 좋을 거 같다고 생각했습니다. 사실 전체적인 틀은 지금까지 해온 머신러닝의 틀과 크게 다르지 않기 때문에 강의를 보는데 어려움은 없었습니다. 다만 머신러닝과의 차이점은 EDA 과정에서 더 세심하게 스케일링을 해줘야 한다는 점과 파이토치를 사용해서 모델의 코드를 짜는 것이 좀 더 해야 될 일이 많다는 점을 알게 되었습니다. 우선 전체적인 순서를 보여드리겠습니다. 문제상황 및 데이터 살펴보.. 2023. 11. 4.
반응형