본문 바로가기

AI126

[AI 부트캠프] DAY 53 - 머신러닝 8 [오늘의 일지] 머신러닝 실시간 강의 - 데이터 분석 문제 정의 (클러스터링(Clustering), Boosting) [상세 내용] 데이터 분석 문제 정의 클러스터링(Clustering) 정의 - 클러스터링은 비슷한 데이터를 같은 그룹에 묶고, 비슷하지 않은 데이터를 다른 그룹으로 분리하여 결국 데이터를 서로 비슷한 특성을 가진 그룹끼리 모이게 하는 데이터 분석 기술입니다. K-Means Clustering - K-Means Clustering은 가장 직관적이고 이해하기 쉬운 클러스터링 방법으로 'K-평균 알고리즘'으로 불리며, 데이터를 평균(mean)을 기준으로 묶어주는 방법으로 알려져 있습니다. 이 알고리즘은 엄청나게 빠른 속도로 수행되며, 결과가 반드시 나오는 것이 보장되어 있어 데이터 클러스터링의.. 2023. 10. 5.
[AI 부트캠프] DAY 52 - 머신러닝 7 [오늘의 일지] 머신러닝 실시간 강의 - 데이터 분석 문제 정의 (회귀 실습 마무리, 분류(Classification)) [상세 내용] 데이터 분석 문제 정의 회귀 실습 마무리 (test 데이터 가공해서 lreg.predict로 출력하기) ## test 데이터를 x_test로 가공해서 lreg.predict(X_test)가 에러가 나지 않고 출력이 되게끔 만들기 # 1. is_Cabin # 2. FamilySize # 3. column drop # 4. age column 채우기 # 5. dropna ?! # 6. Sex -> Ordinal, Embarked -> One-Hot # test.info() x_test = test.copy() # deep copy x_test['is_Cabin'] = x_t.. 2023. 9. 28.
[AI 부트캠프] DAY 51 - 머신러닝 6 [오늘의 일지] 머신러닝 실시간 강의 - 머신러닝 정의 (Training), 데이터 분석 문제 정의 (회귀(Regression)) [상세 내용] 머신러닝 정의 Training - 어제 마무리하지 못했던 Training부터 정리를 시작하겠습니다. 일반적으로 Training은 모델을 학습시키는 과정이라고 말할 수 있습니다. 보통 test와 training을 위해서 데이터를 분리시킨다고 한다면 training의 비율을 70~80프로를 가져가면서 학습을 시킵니다. 그런데 이렇게 어떠한 검증 없이 학습을 시키고 성능을 test 한다면 생각했던 결과를 얻지 못하는 상황을 겪을 수 있게 됩니다. 예를 들면 많은 비율의 데이터를 가지면서 학습을 통해 좋은 결과를 얻은 training에 비해서 바로 상대적으로 적은 데이.. 2023. 9. 27.
[AI 부트캠프] DAY 50 - 머신러닝 5 [오늘의 일지] 머신러닝 실시간 강의 - ML PJT Workflow, 머신러닝의 정의 [상세 내용] ML PJT Workflow - 이번 머신러닝 수업은 프로젝트를 위함이기에 아래의 큰 틀을 가지고 있습니다. 머신러닝 시작하면서 느낀점 - 오늘은 머신러닝 실시간 수업이 시작되는 날이었습니다. 지난주 머신러닝 수업 시작 후로 생각해 봤는데 수업을 들으면서 정작 머신러닝 자체의 정의를 한 번도 제대로 정리하고 넘어간 적이 없었던 거 같습니다. 그래서 오늘 수업은 뭔가 근본적으로 머신러닝이라는 것에 대해서 제대로 알고 시작한다는 점에서 의미가 있었던 거 같습니다. 역사 - 역사적인 부분에서 시작한다면 머신러닝의 첫 등장은 대략적으로는 1950년대인 거 같은데 찾아본 사이트들마다 조금씩 다른 이야기를 하고 있.. 2023. 9. 26.
반응형