본문 바로가기

AI/머신러닝11

[AI 부트캠프] DAY 56 - 머신러닝 11 [오늘의 일지] 머신러닝 실시간 강의 - 예측 모델 개발 및 적용(성능 평가), 머신러닝 프로젝트 OT [상세 내용] ML PJT Workflow 예측 모델 개발 및 적용 성능 평가 대표적인 분류 모델 평가 지표 - 기준을 predicted로 잡고 판단을 기준으로 positive와 negative를 설정하고 실제와 비교하여 true와 false를 결정한다. 아래의 표에 대한 자세한 설명은 지난 학습일지에 자세하게 나와 있습니다. [AI 부트캠프] DAY 47 - 머신러닝 2 [오늘의 일지] 머신러닝 녹화 강의 - 머신러닝을 위한 개념 수업 (Classification) [상세 내용] 머신러닝을 위한 개념 Classification - Classification(분류)은 머신 러닝 및 통계 분석의 하위 분.. 2023. 10. 11.
[AI 부트캠프] DAY 55 - 머신러닝 10 [오늘의 일지] 머신러닝 실시간 강의 - 예측 모델 개발 및 적용 [상세 내용] ML PJT Workflow 예측 모델 개발 및 적용 예측 모델 개발 과정 규칙 → 통계 → ML → DL 모델 학습 및 평가 주어진 데이터로 모델을 학습시키는 것은 지정한 성능 평가 지표를 향상시키는 과정입니다. 데이터를 학습 데이터와 검증 및 테스트 데이터로 나누는 과정이 필요합니다. 정량적 기준을 설정하고, 달성할 때까지 모델을 학습시키고 성능을 개선합니다. 목표한 성능에 도달한 모델을 실제 서비스에 적용합니다. 모델 성능 개선 전략 Main Skills for Data Scientist Hyper-parameter tuning Grid Search vs Random Search - Random Search를 사용하면 .. 2023. 10. 7.
[AI 부트캠프] DAY 54 - 머신러닝 9 [오늘의 일지] 머신러닝 실시간 강의 - 데이터 분석 문제 정의 (Boosting 마무리), 데이터 수집 및 정제, 탐색적 데이터 분석, 피처 엔지니어링 [상세 내용] 데이터 분석 문제 정의 CatBoost (CAT) kaggle 같은 실전 데이터 분석 대회에 서 가장 많이 사용하는 모델 GBDT가 Categorical feature에 대해서 학습이 잘돼도록 설계되어 있습니다. 오랜 연구로 default parameter 설계가 잘되어있어, parameter tuning이 쉽습니다. GPU 사용 최적화가 잘 되어있습니다. Hyper-parameter Tuning (feature 중에 50% 이상이 categorical 일 때) Parameter Tuning (for performance) one_hot_.. 2023. 10. 6.
[AI 부트캠프] DAY 53 - 머신러닝 8 [오늘의 일지] 머신러닝 실시간 강의 - 데이터 분석 문제 정의 (클러스터링(Clustering), Boosting) [상세 내용] 데이터 분석 문제 정의 클러스터링(Clustering) 정의 - 클러스터링은 비슷한 데이터를 같은 그룹에 묶고, 비슷하지 않은 데이터를 다른 그룹으로 분리하여 결국 데이터를 서로 비슷한 특성을 가진 그룹끼리 모이게 하는 데이터 분석 기술입니다. K-Means Clustering - K-Means Clustering은 가장 직관적이고 이해하기 쉬운 클러스터링 방법으로 'K-평균 알고리즘'으로 불리며, 데이터를 평균(mean)을 기준으로 묶어주는 방법으로 알려져 있습니다. 이 알고리즘은 엄청나게 빠른 속도로 수행되며, 결과가 반드시 나오는 것이 보장되어 있어 데이터 클러스터링의.. 2023. 10. 5.
반응형