본문 바로가기

AI126

[AI 부트캠프] DAY 31 - EDA 프로젝트 2 [오늘의 일지] EDA 프로젝트 - 수집한 자료 전처리 과정 [상세 내용] EDA 프로젝트 수집한 자료 전처리를 위한 회의 - 어제는 자료 수집을 위해서 각자 파트를 분담해서 크롤링을 한 후에 csv파일의 형태로 업로드를 시켰습니다. 사이트에 나온 자료들은 사이트에서 설정한 그대로의 칼럼이나 값들을 가지고 있었고 각각의 사이트마다 나타내는 값들이 달랐습니다. 예를 들면 선수의 이름이 표기방법이 다른 것들이 많았습니다. 알파벳에서도 유럽의 각 나라마다 쓰는 표기법이 다 달랐던 것입니다. 특히 독일, 덴마크, 스페인어권 나라 출신 사람들은 자국의 알파벳을 유독 사용하는 것 같았습니다. 간단한 예시로는 '마르틴 외데고르'라는 선수와 '다윈 누녜스'라는 선수들이 있습니다. 유니폼이나 공식적으로 사용하는 알파벳의.. 2023. 8. 30.
[AI 부트캠프] DAY 30 - EDA 프로젝트 1 [오늘의 일지] EDA 프로젝트 - 주제 정하기, 자료 수집(크롤링) [상세 내용] EDA 프로젝트 도메인 설정 - 이번 프로젝트는 EDA를 하는 과정으로서 어떤 도메인을 정하고 그 주제에 맞는 분석 주제를 따로 설정해서 여러 명이 조가 되어서 분석을 수행한느 것에 초점을 두었습니다. 프로젝트의 도메인을 정하는 방식은 설문조사를 통해서 이루어졌습니다. 여러 가지 선택지가 있었지만 저는 평소에 스포츠를 좋아하기도 하고 좋아하는 분야의 EDA를 접하면 흥미로움이 배가 되지 않을까 해서 고르게 되었습니다. 그렇게 스포츠를 선택한 4명이 조로 선정되었습니다. 사실 조은 저번주 금요일에 정해졌고 그때 어떤 내용의 EDA를 해볼지 주제까지 정했던 상황입니다. 처음에는 스포츠 중에서도 야구를 주제로 시작을 하려고 했.. 2023. 8. 29.
[AI 부트캠프] DAY 29 - 파이썬 EDA 9 [오늘의 일지] 파이썬 EDA 실시간 강의 - 데이터분석을 위한 선형대수학 강의 [상세 내용] 파이썬 EDA 데이터분석을 위한 선형대수학 - 강의의 제목은 선형대수학이지만 사실 짧은 시간에 선형대수학이라는 과목을 제대로 이해하고 넘어간 다는 것은 불가능하기에 가장 기본적인 벡터라는 것에 대해서 알아보고 앞으로 머신러닝을 하기 위해 필요한 몇 가지 용어들과 공식들에 대해서 간단하게 정의를 정리하고 그 공식들을 파이썬에서 써보는 걸로 강의를 마무리했습니다. 그럼 이제 정리해 보겠습니다. - 벡터 : 백터라는 용어를 처음 접하게 되는 것은 아마도 고등학교 수학이나 물리였던 걸로 기억하는데 사실 그땐 위치, 속도, 힘 등과 같이 크기와 방향성을 갖는 물리량을 나타내는 데 사용하는 기하학적 대상이라고 배웠던 기억.. 2023. 8. 26.
[AI 부트캠프] DAY 28 - 파이썬 EDA 8 [오늘의 일지] 파이썬 EDA 실시간 강의 - 타이타닉 데이터로 EDA 해보기, 데이터분석을 위한 선형대수학 강의 [상세 내용] 파이썬 EDA 타이타닉 데이터로 EDA 해보기 - 어제는 타이타닉 데이터를 이용해서 생존자와 상관관계가 높은 요소 찾기를 했었습니다. 근데 어제 일지의 앞부분에서 말했던 보통 데이터 분석을 하면 디폴트값처럼 이행해야 하는 3가지 전처리 과정이 있었지만 소개만 하고 할 필요성이 없어서 그냥 넘어갔는데 오늘은 그 전처리 과정 3가지를 자세하게 알아보겠습니다. 결측치가 존재하는지 dtype이 object인 column이 있는지 target value(예측 대상)의 distribution(분포)이 어떻게 되는지 그리고 이번 데이터를 EDA 하는 주제는 그냥 전처리 과정만 하고 넘어갈 .. 2023. 8. 25.
반응형