본문 바로가기

전체 글192

[AI 부트캠프] DAY 71 - 딥러닝 7 [오늘의 일지] 딥러닝 실시간 강의 - Diffusion Model [상세 내용] Diffusion Model - 확산 모델(Diffusion Model)은 확률적인 데이터 생성 및 이미지 생성과 관련된 딥러닝 모델 중 하나입니다. 확산 모델은 데이터의 생성 과정을 시뮬레이션하고, 이론적으로 이미지 생성 작업에 사용될 수 있습니다. 확산 모델은 이미지 생성의 역과정을 시뮬레이션하는 과정에서 데이터 분포를 모델링하고, 원본 이미지와 생성된 이미지 간의 차이를 최소화하도록 학습합니다. 이 모델은 다양한 종류의 이미지 생성 작업에 적용될 수 있으며, 특히 고해상도 이미지 생성 및 이미지 복원 작업에 유용합니다. 이미지 생성: 확산 모델은 고품질 이미지 생성에 사용됩니다. 예를 들어, 고해상도 얼굴 이미지 생성.. 2023. 11. 1.
[AI 부트캠프] DAY 70 - 딥러닝 6 [오늘의 일지] 딥러닝 실시간 강의 - Generation (이미지 생성, AutoEncoder, Generative Adversarial Network ) [상세 내용] Generation 이미지 생성 - Generation는 러닝 모델을 사용하여 데이터를 생성하는 기술을 가리킵니다. 이것은 주로 이미지, 음악, 텍스트 등 다양한 유형의 콘텐츠를 생성하는 데 사용됩니다. Conditional Generation (조건부 생성): 이 방법은 입력 데이터나 조건을 기반으로 새로운 데이터를 생성합니다. 예를 들어, 조건부 생성은 이미지 스타일 변환, 이미지 캡션 생성, 텍스트-투-이미지 변환 등에 사용됩니다. GANs (Generative Adversarial Networks)와 VAEs (Variation.. 2023. 10. 31.
[AI 부트캠프] DAY 69 - 딥러닝 5 [오늘의 일지] 딥러닝 실시간 강의 - CNN, RNN 실습 [상세 내용] CNN, RNN 실습 - 실습에 들어가기에 앞서서 수업 때 사용한 라이브러리는 pytorch였습니다. 기존에 tensorflow를 사용해 본 경험이 있어서 그런지 pytorch가 훨씬 더 코드를 짜야할 부분이 많았고 귀찮은 부분이 많았습니다. 그래도 코드를 자주 사용하면서 연습한다는 생각으로 실습을 따라갔습니다. CNN 실습 코드 # Conv -> ReLU -> Conv -> ReLU -> MaxPool -> fc1 -> fc2 -> fc3(output) (model1) # Conv block(Conv-ReLU x 2) -> MaxPool -> Conv block -> MaxPool -> fc(output) (model2) cla.. 2023. 10. 28.
[AI 부트캠프] DAY 68 - 딥러닝 4 [오늘의 일지] 딥러닝 실시간 강의 - RNN [상세 내용] RNN 등장배경 - 시퀀스 데이터 처리의 필요성: 다양한 분야에서 발생하는 시퀀스 데이터(시계열 데이터, 자연어 텍스트, 음성 신호 등)를 효과적으로 처리하고 모델링하기 위한 필요성이 대두되었습니다. 이러한 데이터는 순서와 상호 의존성을 가지며, 전통적인 신경망 모델로는 처리하기 어려웠습니다. - Feedforward Neural Networks의 한계: 기존의 피드포워드 신경망 모델은 각 입력과 출력 간의 관계를 고려하는데 적합하지만, 시퀀스 데이터와 같이 순서 정보를 갖는 데이터를 다루기 어려웠습니다. 이로 인해 순서 정보를 활용하고 의미를 추출하는 방법이 필요했습니다. - 기존 모델의 과거 정보 손실: 이전 단계의 정보를 현재 상태에서 유.. 2023. 10. 27.
[AI 부트캠프] DAY 67 - 딥러닝 3 [오늘의 일지] 딥러닝 실시간 강의 - CNN [상세 내용] CNN 등장배경 - David Hubel과 Torsten Wiesel은 20세기 중반에 중요한 연구를 통해 시각 피질 내에서 뉴런의 작동과 시각 정보 처리를 이해하는 데 기여한 노벨 생리학과 의학상 수상자입니다. 그들의 연구는 신경 과학과 컴퓨터 비전 분야에서 컨볼루션 신경망(CNN)의 개발에 영향을 미쳤습니다. 영향을 미쳤던 부분은 아래와 같습니다. 뉴런의 특징 감지: Hubel과 Wiesel은 고양이 시각 피질의 뉴런을 연구하면서, 이 뉴런들이 특정 방향, 모양 및 패턴의 시각적 자극에 반응하는 것을 발견했습니다. 이러한 뉴런을 "특징 감지 뉴런"이라고 불렀습니다. 각각의 특징 감지 뉴런: Hubel과 Wiesel은 감각 정보를 처리하는 계.. 2023. 10. 26.
[AI 부트캠프] DAY 66 - 딥러닝 2 [오늘의 일지] 딥러닝 실시간 강의 - 딥러닝 기본 실습 코드, 설정( Learning Rate Scheduling, Transfer Learning, Back-propagation) [상세 내용] 딥러닝 기본 설정을 위한 실습 코드 # 파이토치 라이브러리와 필요한 모듈들을 불러옵니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import random from time import time import os from tqdm.auto import tqdm import torch import torchvision from torchinfo import summary seed = 20.. 2023. 10. 25.
[AI 부트캠프] DAY 65 - 딥러닝 1 [오늘의 일지] 딥러닝 실시간 강의 - 딥러닝 역사, 정의, 설정( Loss function, Optimizer, Mini-batch) [상세 내용] 딥러닝 역사 퍼셉트론 (Perceptron) (1957): 프랑크 로젠블라트(Frank Rosenblatt)가 개발한 퍼셉트론은 인공 신경망의 초기 형태 중 하나로, 간단한 형태의 이진 분류에 사용되었습니다. 역전파 알고리즘 (Backpropagation) (1986): 역전파 알고리즘은 가중치 조정을 통해 인공 신경망이 학습하도록 하는 중요한 알고리즘입니다. 이 알고리즘은 1986년 제프리 힌튼(Jeffrey Hinton)과 다이앤 시긴토니(Diane Sevigny)에 의해 개발되었습니다. 컨볼루션 신경망 (CNN) (1998): CNN은 이미지 처리에 .. 2023. 10. 24.
[AI 부트캠프] DAY 64 - 머신러닝 프로젝트 8 [오늘의 일지] 머신러닝 프로젝트 - 발표, 프로젝트 최종 리뷰 [상세 내용] 머신러닝 프로젝트 발표 리뷰 - 이번 발표를 들으면서 느낀 점은 전체적으로 지난 프로젝트보다 완성도적인 면에서 극명하게 갈렸던 거 같습니다. 어느 조는 체계적으로 진행한 것 같았고 아닌 조도 많은 거처럼 보였습니다. 난이도적인 측면에서 수업시간에 배웠던 머신러닝 지식을 제외하고도 새롭게 접근해야 하는 부분들이 생각보다 많았기 때문인 거 같았습니다. 특히 우리 조가 했던 프로젝트 주제는 심지어 대회가 초기화되면서 중간에 다시 시작했던 상황이었기 때문에도 그런 느낌을 크게 받았습니다. 다른 조의 발표 내용을 들으면서 머신러닝을 활용하는 분야도 생각보다 더 많다는 것을 느꼈습니다. 그리고 케글이나 데이콘의 대회들의 특징이 머신러닝의.. 2023. 10. 21.
[AI 부트캠프] DAY 63 - 머신러닝 프로젝트 7 [오늘의 일지] 머신러닝 프로젝트 - 지금까지 과정 정리, 발표 자료 만들기 [상세 내용] 머신러닝 프로젝트 지금까지 과정 정리 - 이제 프로젝트가 내일 발표만을 남은 상황입니다. 아직 대회는 한참 친행 중이지만 프로젝트는 마무리해야 되기 때문에 지금까지 과정을 타임라인으로 정리해보려고 합니다. 대회 주제 확인 데이터 확인 베이스 라인 코드 확인 베이스 라인 코드 기반으로 모델링 시작 전처리 및 하이퍼 파라미터 튜닝 후 1차 평가 지표 획득(처음 110등 정도) 평가 지표 정체기(전처리 및 다른 모델 사용 해봤지만 극복 실패) 3가지 모델 앙상블로 평가 지표 상승 대회 초기화 다시 새로운 전처리 후 2차 평가 지표 획득 발표 자료 만들기 - 위에서 정리한 내용들을 토대로 아래의 순서대로 발표자를 만들었습.. 2023. 10. 20.
[AI 부트캠프] DAY 62 - 머신러닝 프로젝트 6 [오늘의 일지] 머신러닝 프로젝트 - 시간순으로 상관관계 확인, 다시 피처 선택 [상세 내용] 머신러닝 프로젝트 시간순으로 상관관계 확인 - 대회가 초기화되면서 초기화되는 과정에서 피처 선택의 중요도를 제대로 확인했기 때문에 일단 피처들을 시간 순서대로 다시 상관관계를 확인해서 타깃과 상관관계가 높은 피처로만 다시 설정하기로 했습니다. 상관관계를 찾는 과정에서 지난번에 사용했던 로그변환을 취해주니 매우 높은 상관관계를 발견하기도 했습니다. - 타깃 피처가 CI_HOUR인데 DIST와 상관관계가 0.8로 올라감 다시 피처 선택 - 타깃 피처와 상관관계가 상대적으로 높은 피처들로 13개를 선정해서 다시 optuna를 통해서 최적의 하이퍼파라미터를 찾고 있습니다. 근데 이제는 미래 예측 데이터라고 볼 수 있는.. 2023. 10. 19.
반응형