본문 바로가기
AI/머신러닝

[AI 부트캠프] DAY 56 - 머신러닝 11

by HOHHOH 2023. 10. 11.

[오늘의 일지]

머신러닝 실시간 강의 - 예측 모델 개발 및 적용(성능 평가), 머신러닝 프로젝트 OT

[상세 내용]

ML PJT Workflow 

예측 모델 개발 및 적용

성능 평가

대표적인 분류 모델 평가 지표

- 기준을 predicted로 잡고 판단을 기준으로 positive와 negative를 설정하고 실제와 비교하여 true와 false를 결정한다. 아래의 표에 대한 자세한 설명은 지난 학습일지에 자세하게 나와 있습니다.

 

[AI 부트캠프] DAY 47 - 머신러닝 2

[오늘의 일지] 머신러닝 녹화 강의 - 머신러닝을 위한 개념 수업 (Classification) [상세 내용] 머신러닝을 위한 개념 Classification - Classification(분류)은 머신 러닝 및 통계 분석의 하위 분야로, 데이터

odds-endz.com

 

출처:https://en.wikipedia.org/wiki/Template:Diagnostic_testing_diagram

 

대표적인 회귀 모델 평가 지표

- 회귀 모델의 평가 지표도 지난 학습일지에 자세하게 나와 있습니다.

 

[AI 부트캠프] DAY 46 - 머신러닝 1

[오늘의 일지] 머신러닝 녹화 강의 - 머신러닝을 위한 개념 수업 (Regression) [상세 내용] 머신러닝을 위한 개념 Regression - 회귀(Regression)는 통계 및 기계 학습에서 사용되는 개념으로, 입력 변수(또

odds-endz.com

 

머신러닝을 위한 실습 템플릿

Machine Learning 프로젝트 수행을 위한 코드 구조화
ML project를 위해서 사용하는 템플릿 코드를 만듭니다.
필요한 라이브러리와 데이터를 불러옵니다.
EDA를 수행합니다. 이 때 EDA의 목적은 풀어야하는 문제를 위해서 수행됩니다.
전처리를 수행합니다. 이 때 중요한건 feature engineering을 어떻게 하느냐 입니다.
데이터 분할을 합니다. 이 때 train data와 test data 간의 분포 차이가 없는지 확인합니다.
학습을 진행합니다. 어떤 모델을 사용하여 학습할지 정합니다. 성능이 잘 나오는 GBM을 추천합니다.
hyper-parameter tuning을 수행합니다. 원하는 목표 성능이 나올 때 까지 진행합니다. 검증 단계를 통해 지속적으로 overfitting이 되지 않게 주의하세요.
최종 테스트를 진행합니다. 데이터 분석 대회 포맷에 맞는 submission 파일을 만들어서 성능을 확인해보세요.

 

 

머신러닝 프로젝트 OT

Kaggle과 Dacon

- 이번 프로젝트의 주제는 기본적으로 캐글과 데이콘에 올라와 있는 대회를 바탕으로 진행되었습니다. 우선 캐글은 특정 회사나 캐글 자체적으로 데이터를 제공해 주고 그 데이터를 바탕으로 머신러닝을 통한 AI 모델을 개발하여 정해진 평가 지표를 통해서 점수를 선정해서 순위를 정해주는 시스템을 가지고 있습니다. 순위 별로 상위권은 상금도 있고 메달도 주는데 머신러닝이나 딥러닝을 공부하는 사람들 사이에서는 자신의 능력을 평가받을 수 있는 사이트라고 할 수 있습니다. 세계적으로 잘 알려진 것이 캐글이고 국내에서 캐글의 시스템을 보고 만들어진 곳이 데이콘입니다. 데이콘도 시스템적으로는 캐글과 크게 다를 게 없다고 말할 수 있습니다. 다만 머신러닝 자체가 외국에서 시작한 만큼 아직까지는 의사소통 부분에서 활발함이 다소 떨어진다는 점은 어쩔 수 없는 부분이고 한글로 된 대회 설명이 있어서 접근하기 편하다는 점을 가지고 있습니다.

 

템플릿 활용

- 캐글이든 데이콘이든 머신러닝을 시작할 때 어떻게 코드를 짜면서 시작해야 하나 막막한 상황이 많은데 대회의 커뮤니티에 여러 사람들이 올려놓은 기본 템플릿과 전처리를 위한 EDA 템플릿을 활용해서 기본적인 환경을 구축하는 것도 좋은 팁이라고 강사님이 말씀해 주셨습니다.

 

OT 정리

- 대략적으로 정리하자면 대회의 주제에서 무엇을 중점으로 AI 모델을 구축하기를 원하는지 파악하고 평가지표가 무엇인지도 잘 확인해서 그것에 맞게 라이브러리들을 활용하는 것이 중요하다고 말씀하셨습니다. 그리고 사이트에 올라와 있는 커뮤니티에서 여러 사람들이 어떤 부분을 중요하게 생각하는지 잘 찾아보는 것도 좋은 모델을 만들기 위한 팁이라고 하셨습니다.

 

[마무리]

 오늘 진짜 마지막으로 머신러닝에 대한 이론적인 보충수업을 마쳤고 프로젝트 OT까지 마무리하였습니다. 프로젝트 팀도 정해졌고 이제 내일부터 프로젝트에 대한 상황을 하루하루 정리해 보도록 하겠습니다.

반응형

댓글