본문 바로가기
AI/AI 부트캠프

[AI 부트캠프] DAY 36 - EDA 프로젝트 7

by HOHHOH 2023. 9. 6.

[오늘의 일지]

EDA 프로젝트 - 분석 마무리 하기

[상세 내용]

EDA 프로젝트

팀별로 확인해 보는 공격지표와 수비지표

- 일반적인 생각으로 강팀은 공격적이고 약팀은 수비적일 거라는 생각을 많이 합니다. 또한 미디어에서도 보통 그렇게 말하는 경우도 많았습니다. 그래서 정말 그런지 팀별로 공격지표와 수비지표를 나눠서 확인해 봤습니다. 확실히 강팀이었던 맨시티와 리버풀이 매우 공격적이라는 것을 알 수 있었습니다. 그리고 그래프는 신뢰도가 있는 그래프와 없는 그래프를 나눠서 만들어 보았습니다. 신뢰도에 대한 설명은 아래에서 하겠습니다.

plt.figure(figsize=(25, 12))
plt.subplot(2, 1, 1)
sns.lineplot(data=eda_df, x='Team', y='KeyP', label='KeyP',errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='SpG', label='SpG',errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='Disp', label='Disp',errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='Drb_Off', label='Drb_Off',errorbar=None)
plt.title("Offensive Indicators By Team",fontsize = 15, y=1)
plt.xlabel('Team', fontsize=12)
plt.xticks(rotation=45, fontsize=12)
plt.ylabel("Offensive Indicators", fontsize=12)
plt.legend(title='Offensive index',loc='upper left')

plt.subplot(2, 1, 2)
sns.lineplot(data=eda_df, x='Team', y='G', label='G',errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='xG', label='xG',errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='A', label='A',errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='xA', label='xA',errorbar=None)
plt.title("Offensive Indicators By Team",fontsize = 15, y=1)
plt.xlabel('Team', fontsize=12)
plt.xticks(rotation=45, fontsize=12)
plt.ylabel("Offensive Indicators", fontsize=12)
plt.legend(title='Offensive index',loc='upper left')

plt.tight_layout()
plt.show()

신뢰도가 있는 팀별 공격지표
신뢰도가 없는 팀별 공격지표

 

- 팀별 수비지표를 보면 약팀이 확실히 더 수비적이라는 지표도 확인할 수 있었습니다. 중간중간 약팀도 공격적이거나 수비를 조금 약하게 하는 경우도 있었는데 그런 팀은 이미 강등당해 있는 팀인 경우였습니다. 결과적으로 강팀은 공격적이고 약팀은 수비적이라는 말은 어느 정도 맞는 말이라는 게 입증되는 것 같습니다.

plt.figure(figsize=(25, 12))
plt.subplot(2, 1, 1)
sns.lineplot(data=eda_df, x='Team', y='Fouls', label='Fouls', errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='Clear', label='Clear', errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='Tackles', label='Tackles', errorbar=None)
plt.title("Defensive Indicators By Team",fontsize = 15, y=1)
plt.xlabel('Team', fontsize=12)
plt.xticks(rotation=45, fontsize=12)
plt.ylabel("Defensive Indicators", fontsize=12)
plt.legend(title='Defensive index', loc='upper left')

plt.subplot(2, 1, 2)
sns.lineplot(data=eda_df, x='Team', y='Inter', label='Inter', errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='Drb_Def', label='Drb_Def', errorbar=None)
sns.lineplot(data=eda_df, x='Team', y='Blocks', label='Blocks', errorbar=None)
plt.title("Defensive Indicators By Team",fontsize = 15, y=1)
plt.xlabel('Team', fontsize=12)
plt.xticks(rotation=45, fontsize=12)
plt.ylabel("Defensive Indicators", fontsize=12)
plt.legend(title='Defensive index', loc='upper left')


plt.tight_layout()
plt.show()

신뢰도가 있는 수비 지표
신뢰도가 없는 수비 지표

 

[마무리]

 오늘은 마지막으로 팀별로 수비지표와 공격지표를 분석해 보는 시간을 가져 보았습니다. 뻔할 수도 있겠지만 상대적 강팀은 공격적이고 상대적 약팀은 수비적인 축구를 지향하는 것처럼 보였습니다. 팀별 그래프를 보면서 재미있었던 점은 약팀 중에서도 공격적인 축구를 하는 경향을 가지는 팀들이 있었는데 신뢰구간을 보면 넓은 수치를 보여주고 있었습니다. 그 말은 약팀 중에서도 공격적인 성향을 가지는 팀이 더 변칙적인 전술을 사용한다는 의미가 있다고 생각했습니다. 이제 어느 정도 분석은 마무리가 된 거 같습니다. 이번 프로젝트에서 분석을 통한 결과는 있었지만 이렇다 하게 낼 수 있는 결론은 없었던 거 같습니다. 데이터가 한정적이었던 것이 원인인 점도 있다고 생각합니다. 어찌 됐든 이제 분석적인 것은 마무리하고 내일부터는 지금까지 과정을 프레젠테이션으로 만들어 봐야 할 거 같습니다.

반응형

댓글