본문 바로가기

AI126

[AI 부트캠프] DAY 27 - 파이썬 EDA 7 [오늘의 일지] 파이썬 EDA 실시간 강의 - 공공데이터로 EDA 해보기, 타이타닉 데이터로 EDA 해보기 [상세 내용] 파이썬 EDA 공공데이터로 EDA 해보기 - 어제 사용했던 공공데이터 상권분석 자료를 이용해서 마저 남아 있던 주제의 분석을 마무리해 보겠습니다. 주제는 아래에 나와 있습니다. 한식 음식점들이 많이 사용하는 단어 찾아보기 '많이 사용하는'이라는 말을 다르게 표현하자면 빈도분석이라고 하는데요. 빈도를 분석하기 위해서는 일단 각각 전국단위로 분리되어 있는 데이터를 하나로 묶어주는 것이 중요합니다. 이 과정은 어제 진행했었는데 다시 해보겠습니다. 여기서 데이터 파일을 불러올 때 glob()이라는 라이브러리가 유용하게 사용됩니다. glob()은 원하는 폴더 안에 존재하는 파일들 중 원하는 단.. 2023. 8. 24.
[AI 부트캠프] DAY 26 - 파이썬 EDA 6 [오늘의 일지] 파이썬 EDA 실시간 강의 - Seaborn 복습, 공공데이터로 EDA 해보기 [상세 내용] 파이썬 EDA Seaborn 복습 - 오늘 복습은 lineplot, scatterplot, pairplot, heatmap까지 마무리를 하였습니다. lineplot과 scatterplot은 hue 파라미터를 첨가해서 그래프를 분석해 보면 두 plot의 경향성은 hue에서 설정한 칼럼의 데이터 별로 보면 각각의 분포를 파악할 수 있다는 점에서 비슷한 부분을 가지고 있습니다. # penguin 데이터에 lineplot을 출력합니다. sns.lineplot(data=data, x='body_mass_g', y='flipper_length_mm', errorbar=None, hue='species',pa.. 2023. 8. 23.
[AI 부트캠프] DAY 25 - 파이썬 EDA 5 [오늘의 일지] 파이썬 EDA 실시간 강의 - Pandas, Seaborn [상세 내용] 파이썬 EDA Pandas 추가 내용 - pandas를 이용하면 mysql이나 oracle 같은 sql 언어를 사용하는 프로그램처럼 데이터를 합치는 기능인 join을 사용할 수 있습니다. 그 기능을 정리해 보겠습니다. 정리할 함수는 concat()과 merge()입니다. 일단 데이터를 만들어 보겠습니다. # 넘파이 판다스 기능 사용 import numpy as np import pandas as pd # 데이터 만들어 놓기(실제데이터가 있다며 더 좋다) df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0'.. 2023. 8. 22.
[AI 부트캠프] DAY 24 - 파이썬 EDA 4 [오늘의 일지] 파이썬 온라인 녹화 강의 - Matplotlib 복습 및 Seaborn 추가 내용 정리, 데이터 이용해서 EDA 해보기 [상세 내용] 파이썬 EDA Seaborn 추가 내용 - Seanborn은 화려한 시각화 기법들을 제공하며 histplot, barplot, jointplot, lineplot 등과 같은 식의 함수의 형태를 가지고 있으며 sns.xxxplot(data=df)의 구조로 사용됩니다. 또 pandas DataFrame과 매우 호환이 잘 되는 특징을 가지고 있습니다. - Histplot : 지난 일지에서도 설명했지만 헷갈리는 부분이 있어서 다시 정의하려고 합니다. 히스토그램과 막대그래프는 비슷한 형태를 가지고 있지만 차이점을 가지고 있습니다. 히스토그램은 연속형 데이터에 사용되.. 2023. 8. 19.
반응형