AI/머신러닝11 [AI 부트캠프] DAY 52 - 머신러닝 7 [오늘의 일지] 머신러닝 실시간 강의 - 데이터 분석 문제 정의 (회귀 실습 마무리, 분류(Classification)) [상세 내용] 데이터 분석 문제 정의 회귀 실습 마무리 (test 데이터 가공해서 lreg.predict로 출력하기) ## test 데이터를 x_test로 가공해서 lreg.predict(X_test)가 에러가 나지 않고 출력이 되게끔 만들기 # 1. is_Cabin # 2. FamilySize # 3. column drop # 4. age column 채우기 # 5. dropna ?! # 6. Sex -> Ordinal, Embarked -> One-Hot # test.info() x_test = test.copy() # deep copy x_test['is_Cabin'] = x_t.. 2023. 9. 28. [AI 부트캠프] DAY 51 - 머신러닝 6 [오늘의 일지] 머신러닝 실시간 강의 - 머신러닝 정의 (Training), 데이터 분석 문제 정의 (회귀(Regression)) [상세 내용] 머신러닝 정의 Training - 어제 마무리하지 못했던 Training부터 정리를 시작하겠습니다. 일반적으로 Training은 모델을 학습시키는 과정이라고 말할 수 있습니다. 보통 test와 training을 위해서 데이터를 분리시킨다고 한다면 training의 비율을 70~80프로를 가져가면서 학습을 시킵니다. 그런데 이렇게 어떠한 검증 없이 학습을 시키고 성능을 test 한다면 생각했던 결과를 얻지 못하는 상황을 겪을 수 있게 됩니다. 예를 들면 많은 비율의 데이터를 가지면서 학습을 통해 좋은 결과를 얻은 training에 비해서 바로 상대적으로 적은 데이.. 2023. 9. 27. [AI 부트캠프] DAY 50 - 머신러닝 5 [오늘의 일지] 머신러닝 실시간 강의 - ML PJT Workflow, 머신러닝의 정의 [상세 내용] ML PJT Workflow - 이번 머신러닝 수업은 프로젝트를 위함이기에 아래의 큰 틀을 가지고 있습니다. 머신러닝 시작하면서 느낀점 - 오늘은 머신러닝 실시간 수업이 시작되는 날이었습니다. 지난주 머신러닝 수업 시작 후로 생각해 봤는데 수업을 들으면서 정작 머신러닝 자체의 정의를 한 번도 제대로 정리하고 넘어간 적이 없었던 거 같습니다. 그래서 오늘 수업은 뭔가 근본적으로 머신러닝이라는 것에 대해서 제대로 알고 시작한다는 점에서 의미가 있었던 거 같습니다. 역사 - 역사적인 부분에서 시작한다면 머신러닝의 첫 등장은 대략적으로는 1950년대인 거 같은데 찾아본 사이트들마다 조금씩 다른 이야기를 하고 있.. 2023. 9. 26. [AI 부트캠프] DAY 49 - 머신러닝 4 [오늘의 일지] 머신러닝 녹화 강의 - 머신러닝을 위한 개념 수업 (Dimensionality Reduction, Anomaly Detection) [상세 내용] 머신러닝을 위한 개념 Dimensionality Reduction - Dimensionality reduction (차원 축소)은 데이터의 특성 (차원) 수를 줄이는 기술을 가리킵니다. 이 기술은 데이터 공간의 차원을 감소시켜 데이터를 더 효율적으로 다루고 시각화하거나, 머신 러닝 및 데이터 분석 작업을 단순화하는 데 사용됩니다. 이를 통해 데이터의 복잡성을 줄이고 중요한 정보를 보존하려고 합니다. Curse of dimensionality - Curse of dimensionality(차원의 저주)는 고차원 데이터 공간에서 발생하는 다양한 문.. 2023. 9. 23. 이전 1 2 3 다음 반응형