본문 바로가기
AI/AI 부트캠프

[AI 부트캠프] DAY 129 - 파이널 프로젝트 20

by HOHHOH 2024. 1. 24.

[오늘의 일지]

프로젝트 - 로컬에서 gpu 재설정

[상세 내용]

로컬에서 gpu 재설정

재설정 계기

- 지난 일지 중에서 로컬에서 gpu를 설정하는 방법에 대해서 정리한 적이 있습니다. 그런데 gpu를 이용해서 YOLOv8 모델을 돌리던 중에 업데이트 관련으로 경고 메시지가 뜬다는 것을 확인하게 되었습니다. 저는 지난 일지에서 온라인 후기에서 많은 사람들이 문제없이 사용하고 있는 cuda 버전을 선택해서 사용했는데 해당 cuda 버전이 오래된 버전이다 보니까 최신 torch 버전으로는 업데이트가 안 되는 버전이라는 것을 알게 되어서 다시 새로운 버전을 선택해서 업데이트를 하게 되었습니다. 지난 gpu 설정 정리는 아래의 링크로 남겨두겠습니다.

 

[AI 부트캠프] DAY 123 - 파이널 프로젝트 14

[오늘의 일지] 프로젝트 - 로컬 환경에서 gpu 설정하기 [상세 내용] 로컬 환경에서 gpu 설정하기 - 지난 일지에서 언급을 했듯이 제가 쓰는 노트북 환경에서 여러 가지 드라이버를 설치하고도 gpu는

odds-endz.tistory.com

 

경고 메시지

- 어차피 시간이 흐르면 새로운 버전으로 업데이트를 하는 것이 좋다고 생각했습니다. 경고 메시지는 아래와 같은 형태로 나타났습니다.

 

설정 방법

- 설정 방법은 지난번에 정리했던 내용과 크게 다르지는 않습니다. 다만 다시 설치하면서 몇 번의 실패를 경험한 것을 토대로 순서는 꼭 지켰으면 좋을만한 것을 강조하려고 합니다.

 

설정 순서

- 제가 설정한 방법으로 똑같이 따라 하시면 실패확률이 적어질 거 같습니다.

- 우선 저는 기존 그래픽 카드 드라이버를 삭제하고 시작했습니다. 특히 새로운 그래픽 카드 드라이버를 다운로드하면 cuda 추천 버전이 뜨기 때문에 혼선이 생길 수 있는 상황이 발생하기도 해서 기존 드라이버가 있더라고 삭제하고 시작하는 것이 좋다고 생각합니다. 그리고 cuda 버전을 설치할 때 자동으로 cuda 버전에 맞는 드라이버가 설치되기도 합니다.

- 그런 뒤 anaconda를 다운로드하여서 설치했습니다.

- anaconda 환경은 자유롭게 파이썬 버전을 선택해서 새로 만들어도 좋고 그냥 기본 base에 설정해도 될 거 같습니다. 다만 제가 선택한 파이썬 버전은 3.10이었습니다.

- 그런 뒤 conda 업데이트를 해줬습니다. conda 버전 코어 업데이트와 패키지 업데이트 두 가지를 진행했습니다. 명령어는 아래와 같습니다.

# conda 코어 업데이트
conda update -n base conda

# conda 패키지 업데이트
conda update --all

 

- 그런 다음에 cuda를 버전에 맞게 설치해 줍니다. cuda 설치는 지난 일지에 자세하게 정리해 뒀습니다. 여기서 중요한 점은 기존에 설치되어 있는 cuda 버전을 잘 제거해 주고 cudnn도 알맞게 복사 붙여 넣기 해주는 것입니다. 제 경험으로는 anaconda와 cuda의 설치 순서는 크게 상관없었던 거 같습니다.

- 그렇게 설치된 cuda 버전을 nvcc --version 명령어를 이용해서 확인해 줍니다. 저는 11.8 버전을 선택했습니다.

nvcc --version

 

- 그리고 여기서부터 중요한 점은 conda 환경에 맞는 명령어로 torch 버전을 잘 설치해 주면 된다는 것입니다. 저는 YOLOv8 모델을 위해서 설치해야 되는 Ultralytics 패키지를 먼저 설치하는 바람에 그 안에 존재하는 torch 버전이 같이 설치되면서 삭제를 하고 새로운 버전을 설치해도 인식이 안 되는 상황이 계속 발생했습니다. 이 부분만 조심한다면 계속해서 conda 환경을 재설치하는 수고로움은 덜 수 있을 거 같습니다. 

- 그렇게 모든 설치를 마무리하고 설치와 인식이 잘 되는지 확인하면 끝입니다. 아래는 잘 인식된 것을 확인한 것입니다.

 

최종 설치 환경 정리

- gpu는 rtx 3070 laptop용입니다.

- cuda 버전은 11.8입니다.

- 파이썬 버전은 3.10입니다.

- torch 버전은 2.1.2입니다.

 

[마무리]

 오늘은 구버전 torch를 사용하면 나타나는 경고를 해결하기 위해서 환경을 재설정하는 방법에 대해서 정리해 보았습니다. 재설정을 하고 나서 YOLO 모델을 다시 학습시켜 봤는데 크게 달라진 점은 없지만 온라인상에 나오는 문서를 보면 성능적인 면에서도 조금 차이가 있다고 하니 이제는 안심하고 사용할 수 있을 거 같습니다.

반응형

댓글