본문 바로가기
AI/AI 부트캠프

[AI 부트캠프] DAY 35 - EDA 프로젝트 6

by HOHHOH 2023. 9. 5.

[오늘의 일지]

EDA 프로젝트 - 본격적으로 분석하기

[상세 내용]

EDA 프로젝트

공격수의 수비지표와 수비수의 공격지표 확인하기

- 현대 축구로 발전하면서 공격수의 수비가담 횟수와 수비수의 공격가담 횟수가 점점 늘어나고 있다는 내용을 미디어에서 많이 접했던 기억이 났습니다. 그래서 이 내용이 사실인지 epl 데이터를 통해서 어느 정도 수치인지 확인해 보았습니다. 수비수의 공격지표를 보면 전체적으로 어느 정도는 올라가고 있는 추세는 맞는 거 같았습니다. 그렇지만 저희가 수집한 데이터가 2014년도부터 모아진 데이터이다 보니 이미 수비수의 공격 가담이 어느 정도 자리를 잡힌 상황이라 급진적으로 증가하는 그래프는 보이지 않았던 걸로 판단했습니다. 그리고 한 가지 특이한 점은 한 시즌 만다 지그재그 형태의 그래프를 확인할 수 있었는데 이 부분은 아마도 전시즌의 전술을 통해서 다음시즌을 대비하기 때문에 지그재그 형태가 나온 것이라고 생각했습니다.  그럼 그래프를 확인해 보겠습니다.

plt.figure(figsize=(10, 12))
plt.subplot(2, 1, 1)
sns.lineplot(data=Defender_eda_df, x='year', y='KeyP', label='KeyP')
sns.lineplot(data=Defender_eda_df, x='year', y='SpG', label='SpG')
sns.lineplot(data=Defender_eda_df, x='year', y='Disp', label='Disp')
sns.lineplot(data=Defender_eda_df, x='year', y='Drb_Off', label='Drb_Off')
plt.title("Defender's Offensive Indicators",fontsize = 15, y=1)
plt.xlabel('Year')
plt.ylabel("Defender's Offensive")
plt.legend(title='Offensive index',loc='upper left')

plt.subplot(2, 1, 2)
sns.lineplot(data=Defender_eda_df, x='year', y='G', label='G')
sns.lineplot(data=Defender_eda_df, x='year', y='xG', label='xG')
sns.lineplot(data=Defender_eda_df, x='year', y='A', label='A')
sns.lineplot(data=Defender_eda_df, x='year', y='xA', label='xA')
plt.title("Defender's Offensive Indicators",fontsize = 15, y=1)
plt.xlabel('Year')
plt.ylabel("Defender's Offensive")
plt.legend(title='Offensive index',loc='upper left')

수비수의 공격지표 그래프

 

- 그리고 공격수의 수비지표는 생각 외로 오히려 내려가는 그래프를 보였습니다. 이 부분은 정말 의외였던 거 같습니다. 아마도 공격수가 수비나 미드필더들의 지원을 받아서 공격수는 더 공격적인 성향이 강해진 것이 아닐까 하는 생각이 들었습니다. 그래프로 확인해 보겠습니다.

lt.figure(figsize=(10, 12))
plt.subplot(2, 1, 1)
sns.lineplot(data=forward_eda_df, x='year', y='Fouls', label='Fouls')
sns.lineplot(data=forward_eda_df, x='year', y='Tackles', label='Tackles')
plt.title("Forward's Defensive Indicators",fontsize = 15, y=1)
plt.xlabel('Year')
plt.ylabel("Forward's Defensive")
plt.legend(title='Defensive index', loc='upper right')

plt.subplot(2, 1, 2)
sns.lineplot(data=forward_eda_df, x='year', y='Inter', label='Inter')
sns.lineplot(data=forward_eda_df, x='year', y='Clear', label='Clear')
sns.lineplot(data=forward_eda_df, x='year', y='Drb_Def', label='Drb_Def')
plt.title("Forward's Defensive Indicators",fontsize = 15, y=1)
plt.xlabel('Year')
plt.ylabel("Forward's Defensive")
plt.legend(title='Defensive index', loc='upper right')

공격수의 수비지표 그래프

 

신뢰도에 대해서 알아보기

- 위에 나오는 그래프들을 보면 실선의 주위에 여러 범위가 연한 색으로 되어 있는 것을 확인할 수 있습니다. 이것을 신뢰 구간이라고 합니다. 신뢰 구간은 표본 통계량에서 파생되어 알 수 없는 모집단 모수 값이 포함될 가능성이 있는 값의 범위입니다. 무작위 표본을 여러 번 추출하면 신뢰 구간 중 특정 비율이 모집단 평균을 포함하게 됩니다. 이 비율이 바로 신뢰 수준입니다. 간단히 말해, 신뢰 구간은 통계적으로 어떤 값이 어떤 범위 내에 있을 가능성이 높은지에 대한 정보를 제공합니다. 예를 들어, "95% 신뢰 구간에서 평균 길이는 10에서 15 사이에 있을 것으로 예상됩니다"라는 말은 해당 신뢰 수준에서 해당 모집단의 평균 길이를 추정하고 그 신뢰성을 나타냅니다.

출처:https://www.youtube.com/watch?v=1WSTBVFeQ-4

 

[마무리]

 오늘은 기존에 모았던 자료를 이용해서 새로운 분석을 시도해 보았습니다. 처음에는 데이터가 많다고 느꼈었는데 분석을 하다 보니 데이터가 생각했던 것보다 한정적이라 어떤 분석을 해야 할지 고민도 많았습니다. 그래서 분석의 결과도 예상했던 결과와 다르게 나오는 경우도 많았던 거 같습니다. 이번에 분석 과정을 통해서 느낀 것은 당연하겠지만 더 많은 자료가 있어야 더 좋은 결과를 낼 수 있겠구나라는 생각이 확 와닿을 만큼 좋은 경험을 했다고 생각합니다. 

반응형

댓글