본문 바로가기

AI/데이터 사이언스9

[AI 부트캠프] DAY 29 - 파이썬 EDA 9 [오늘의 일지] 파이썬 EDA 실시간 강의 - 데이터분석을 위한 선형대수학 강의 [상세 내용] 파이썬 EDA 데이터분석을 위한 선형대수학 - 강의의 제목은 선형대수학이지만 사실 짧은 시간에 선형대수학이라는 과목을 제대로 이해하고 넘어간 다는 것은 불가능하기에 가장 기본적인 벡터라는 것에 대해서 알아보고 앞으로 머신러닝을 하기 위해 필요한 몇 가지 용어들과 공식들에 대해서 간단하게 정의를 정리하고 그 공식들을 파이썬에서 써보는 걸로 강의를 마무리했습니다. 그럼 이제 정리해 보겠습니다. - 벡터 : 백터라는 용어를 처음 접하게 되는 것은 아마도 고등학교 수학이나 물리였던 걸로 기억하는데 사실 그땐 위치, 속도, 힘 등과 같이 크기와 방향성을 갖는 물리량을 나타내는 데 사용하는 기하학적 대상이라고 배웠던 기억.. 2023. 8. 26.
[AI 부트캠프] DAY 28 - 파이썬 EDA 8 [오늘의 일지] 파이썬 EDA 실시간 강의 - 타이타닉 데이터로 EDA 해보기, 데이터분석을 위한 선형대수학 강의 [상세 내용] 파이썬 EDA 타이타닉 데이터로 EDA 해보기 - 어제는 타이타닉 데이터를 이용해서 생존자와 상관관계가 높은 요소 찾기를 했었습니다. 근데 어제 일지의 앞부분에서 말했던 보통 데이터 분석을 하면 디폴트값처럼 이행해야 하는 3가지 전처리 과정이 있었지만 소개만 하고 할 필요성이 없어서 그냥 넘어갔는데 오늘은 그 전처리 과정 3가지를 자세하게 알아보겠습니다. 결측치가 존재하는지 dtype이 object인 column이 있는지 target value(예측 대상)의 distribution(분포)이 어떻게 되는지 그리고 이번 데이터를 EDA 하는 주제는 그냥 전처리 과정만 하고 넘어갈 .. 2023. 8. 25.
[AI 부트캠프] DAY 27 - 파이썬 EDA 7 [오늘의 일지] 파이썬 EDA 실시간 강의 - 공공데이터로 EDA 해보기, 타이타닉 데이터로 EDA 해보기 [상세 내용] 파이썬 EDA 공공데이터로 EDA 해보기 - 어제 사용했던 공공데이터 상권분석 자료를 이용해서 마저 남아 있던 주제의 분석을 마무리해 보겠습니다. 주제는 아래에 나와 있습니다. 한식 음식점들이 많이 사용하는 단어 찾아보기 '많이 사용하는'이라는 말을 다르게 표현하자면 빈도분석이라고 하는데요. 빈도를 분석하기 위해서는 일단 각각 전국단위로 분리되어 있는 데이터를 하나로 묶어주는 것이 중요합니다. 이 과정은 어제 진행했었는데 다시 해보겠습니다. 여기서 데이터 파일을 불러올 때 glob()이라는 라이브러리가 유용하게 사용됩니다. glob()은 원하는 폴더 안에 존재하는 파일들 중 원하는 단.. 2023. 8. 24.
[AI 부트캠프] DAY 26 - 파이썬 EDA 6 [오늘의 일지] 파이썬 EDA 실시간 강의 - Seaborn 복습, 공공데이터로 EDA 해보기 [상세 내용] 파이썬 EDA Seaborn 복습 - 오늘 복습은 lineplot, scatterplot, pairplot, heatmap까지 마무리를 하였습니다. lineplot과 scatterplot은 hue 파라미터를 첨가해서 그래프를 분석해 보면 두 plot의 경향성은 hue에서 설정한 칼럼의 데이터 별로 보면 각각의 분포를 파악할 수 있다는 점에서 비슷한 부분을 가지고 있습니다. # penguin 데이터에 lineplot을 출력합니다. sns.lineplot(data=data, x='body_mass_g', y='flipper_length_mm', errorbar=None, hue='species',pa.. 2023. 8. 23.
반응형