본문 바로가기

2023/1122

[AI 부트캠프] DAY 76 - 딥러닝 프로젝트 1 [오늘의 일지] 딥러닝 프로젝트 - 주제 선정, 대회 파악하기, 데이터 파악하기 [상세 내용] 주제 선정 - 우선 주제는 선택지가 두 가지밖에 없었습니다. 케글에서 진행 중인 대회와 이미 끝난 대회 중에서 하나를 선택하는 것이었는데 이왕이면 진행 중인 대회를 선택해서 하는 게 동기부여에 좋을 거 같아서 선택을 했습니다. 그래서 대회의 도메인이 증권시장과 관련이 되어있었는데 증권 관련 도메인 지식이 없다 보니 프로젝트를 진행하는데 난항이 될 거 같다는 생각이 들었습니다. 대회 파악하기 - 대회의 주제는 미국 주식시장인 나스닥에서 시장이 마감하기 10분 전에 데이터들을 활용해서 10초마다 예측되는 target값을 구하는 것이었습니다. target을 구하는 공식이 존재하는데 이걸 그냥 주변 데이터들만을 이용해.. 2023. 11. 8.
[AI 부트캠프] DAY 75 - 딥러닝 11 오늘의 일지] 딥러닝 녹화 강의 - TabNet, AutoEncoder [상세 내용] TabNet - TabNet은 트리 기반의 해석 가능한 딥러닝 모델로, 특히 표 형태의 데이터(탭규칙 형태의 데이터)에 적합한 모델입니다. TabNet은 트리 기반의 모델과 딥러닝 모델의 혼합으로, 각각의 특성을 선택하고 중요한 패턴을 학습하는 데 사용됩니다. TabNet은 탭 네트워크 (Tabular Attention Network)의 약어로, 표 형식 데이터를 처리하기 위해 디자인된 네트워크 구조를 나타냅니다. 원리 피처 선택 및 중요성: TabNet은 각 레이어에서 특성 선택과 특성 중요도를 학습합니다. 이것은 입력 데이터의 각 특성이 얼마나 중요한지를 알려주며, 중요하지 않은 특성은 무시됩니다. 트리 기반 아키텍.. 2023. 11. 7.
[AI 부트캠프] DAY 74 - 딥러닝 10 오늘의 일지] 딥러닝 녹화 강의 - MLP 회귀, 분류 실습 [상세 내용] MLP 회귀, 분류 실습 실습 순서 - 이번 강의는 MLP 딥러닝 모델을 활용해서 현업이나 프로젝트 과정에서 전체적으로 어떻게 작업을 수행하면 좋을지에 대한 내용이었습니다. 강의의 내용을 바탕으로 큰 틀을 잡고 앞으로 하게 될 프로젝트에서 적용하면 좋을 거 같다고 생각했습니다. 사실 전체적인 틀은 지금까지 해온 머신러닝의 틀과 크게 다르지 않기 때문에 강의를 보는데 어려움은 없었습니다. 다만 머신러닝과의 차이점은 EDA 과정에서 더 세심하게 스케일링을 해줘야 한다는 점과 파이토치를 사용해서 모델의 코드를 짜는 것이 좀 더 해야 될 일이 많다는 점을 알게 되었습니다. 우선 전체적인 순서를 보여드리겠습니다. 문제상황 및 데이터 살펴보.. 2023. 11. 4.
[AI 부트캠프] DAY 73 - 딥러닝 9 오늘의 일지] 딥러닝 실시간 강의 - LLM, Hugging Face [상세 내용] LLM - Large Language Model(LLM)은 딥러닝 기반의 자연어 처리 모델로, 대규모의 텍스트 데이터를 사용하여 학습되고, 텍스트에 대한 이해와 생성 능력을 갖춘 모델을 가리킵니다. LLM은 컴퓨터가 자연어를 처리하고 이해하는 데 사용되며, 텍스트 생성, 번역, 질문 응답, 감정 분석 등 다양한 자연어 처리 작업에서 활용됩니다. 대규모 데이터 학습: LLM은 대량의 텍스트 데이터로 사전 훈련됩니다. 이 데이터는 웹 문서, 뉴스 기사, 소셜 미디어 게시물, 책 등 다양한 출처에서 수집됩니다. Transformer 아키텍처: LLM은 주로 "Transformer"라고 불리는 딥러닝 아키텍처를 사용합니다. Tr.. 2023. 11. 3.
반응형