본문 바로가기
AI/AI 부트캠프

[AI 부트캠프] DAY 123 - 파이널 프로젝트 14

by HOHHOH 2024. 1. 16.

[오늘의 일지]

프로젝트 - 로컬 환경에서 gpu 설정하기

[상세 내용]

로컬 환경에서 gpu 설정하기

- 지난 일지에서 언급을 했듯이 제가 쓰는 노트북 환경에서 여러 가지 드라이버를 설치하고도 gpu는 확인이 되는데 pytorch가 gpu를 가져오지 못하는 상황에 대해서 정리해 보려고 합니다.

 

로컬 환경 (본인 노트북 환경)

- cpu는 라이젠 5000번 때입니다.

- 그래픽 카드는 rtx 3070 laptop용입니다.

- cuda 버전 11.3입니다.

- 파이썬 환경은 3.9와 3.10에서 모두 돌아가는 것을 확인했습니다.

 

환경 설정 요약

- gpu 드라이버 설치 (처음에 해도 되고 나중에 해도 되고 기존에 설치되어 있다면 안 해도 될 거 같습니다.)

- anaconda 환경 구축 (기존 로컬에 해도 되지만 만약을 위해서 가상환경을 만들어서 하는 것을 추천합니다.)

- cuda 버전 찾아서 설치

- cuda 버전에 맞는 cuDNN 설치하고 cuda 설치 경로에 추가

- cuda 버전에 맞는 pytorch 설치

- 파이썬 환경에서 잘 작동하는지 확인

 

환경 설정 방법

- 우선 gpu의 공식 드라이버는 기존에 있는 것을 업그레이드해도 좋고 안 해도 크게 상관없는 것으로 파악을 했습니다. 저는 둘 다 해봤는데 나중에 드라이버를 설치해도 괜찮았습니다. 그리고 CUI 환경인 명령프롬프트에서 검색할 수 있는 nvidia-smi 명령어는 크게 신경 쓰지 않아도 될 거 같고 특히 여기에서 추천해 주는 cuda 버전을 현재 버전으로 착각하지 않는 것이 좋습니다. 아래의 이미지에 오른쪽 위쪽에 나오는 cuda 버전은 현재 사용 중인 그래픽 카드의 드라이버의 맞는 추천 버전임을 다시 한번 강조드립니다.

오른쪽 위는 추천 cuda 버전일 뿐입니다.

 

- 그렇게 gpu의 드라이버를 다운로드하거나 기존 드라이버를 그냥 사용한 다치고 넘어가면 anaconda 환경을 만들어 주는 것이 좋다고 생각합니다. 기존 로컬 환경에서 그냥 환경설정을 해도 상관은 없다고 생각하지만 그래도 여러 가지 오류가 발생했을 상황을 생각하면 anaconda의 가상환경을 세팅해서 사용하는 것이 편하다고 생각합니다. 저는 여기서 파이썬 환경을 3.9와 3.10을 실험을 해봤는데 둘 다 잘 돌아가는 것을 확인했습니다. anaconda는 아래의 링크에서 무료 다운로드하실 수 있습니다. 

 

Anaconda | Unleash AI innovation and value

Accelerate growth efficiently for everyone with the AI and data science experts.

www.anaconda.com

 

- 다만 anaconda를 다운로드하고 나면 환경 자체가 최신 파이썬 버전으로 세팅이 되어 있는데 그냥 사용하지 마시고 확실하게 인식이 되었던 3.9 버전이나 3.10 버전으로 다운그레이드하시기를 추천드립니다. 그리고 여기서 다운그레이드할 때는 그냥 하시면 무한로딩에 걸릴 수 있는데 라이브러리 업그레이드를 해주고 파이썬을 다운로드하여 주시면 잘 넘어가는 것을 확인했습니다. 아래에 코드로 보여드리겠습니다.

# anaconda 업그레이드
conda update --all

# 파이썬 다운그레이드 버전 찾기
conda search python

# 파이썬 다운
conda install python=원하는 버전


- 이제 anaconda 환경이 설정이 되었으면 cuda driver를 다운로드하여야 합니다. 적절하게 맞는 cuda버전을 찾는 방법을 위키패디아에 나와있습니다. 저는 laptop용 rtx3070 버전이지만 따로 laptop을 구별하지 않아서 그냥 3070에 대입시켰을 때 초록색 칸이 8.6점이 나와서 안전하게 11.3 버전을 다운로드하여서 설치했습니다. 아래의 이미지와 홈페이지를 참고하시면 좋을 거 같습니다. (근데 아래의 이미지를 확인해 보면 8.6점이면 11.1 버전부터 최신 12.3까지 가능하다고 나오기는 합니다. 저는 검색을 통해서 많은 사람들이 이견없이 성공했던 버전으로 그냥 사용을 했습니다.)

출처:https://en.wikipedia.org/wiki/CUDA#GPUs_supported

 

CUDA - Wikipedia

From Wikipedia, the free encyclopedia Parallel computing platform and programming model CUDA (or Compute Unified Device Architecture) is a proprietary and closed source parallel computing platform and application programming interface (API) that allows sof

en.wikipedia.org

 

- 적절한 cuda 드라이버를 설치한 뒤에는 cuDNN이라는 파일을 다운로드하여서 추가시켜줘야 합니다. 방법은 간단합니다. 아래의 홈페이지에서 로그인하시고 cuda 버전에 맞는 cuDNN 파일을 다운로드하여서 압축을 풀어준 뒤에 복사해서 cuda가 설치된 곳에 붙여 넣기를 하면 됩니다. cuda의 위치 경로는 다음과 같습니다. 

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.3

 

 

Log in

Log in or sign up for an NVIDIA account

developer.nvidia.com

 

- 마지막으로 cuda 버전이 잘 설치가 되어서 있는지 확인한 뒤에 버전에 맞는 pytorch를 다운로드하면 끝이 납니다. 우선 cuda 버전 확인은 CUI 환경인 명령 프롬프트에서 nvcc --version을 치시면 나옵니다. 

cuda 11.3 설치 확인

 

- pytorch는 홈페이지를 가시면 맞는 버전을 다운로드하실 수 있습니다. 이전 버전은 이전 버전 메뉴바를 눌러서 스크롤을 내리다 보면 나올 것입니다.

출처:https://pytorch.kr/get-started/locally/

 

파이토치 한국 사용자 모임 (PyTorch Korea User Group)

파이토치 한국 사용자 모임에 오신 것을 환영합니다. 딥러닝 프레임워크인 파이토치(PyTorch)를 사용하는 한국어 사용자들을 위해 문서를 번역하고 정보를 공유하고 있습니다.

pytorch.kr

 

- 최종적으로 잘 실행이 되는지만 확인하면 끝이 납니다. 저는 파이썬 환경에 들어가서 직접 버전을 치고 torch.cuda.is_available()를 사용해서 확인을 했습니다.

import torch

# 버전확인
print(torch.__version__)

# gpu 사용여부 확인 (True 라고 떠야 사용가능)
torch.cuda.is_available()

 

[마무리]

 오늘은 로컬환경에서 딥러닝을 위한 pytorch의 gpu 환경을 구축하는 것을 정리해 보았습니다. 생각보다 크게 어려운 것은 없었지만 안 되는 상황에서 지우고 다시 설치하는 반복 작업이 발생할 수 있어서 조금 귀찮을 수 있습니다. 위에 처럼 잘 gpu 환경을 구축했지만 아쉽게도 제가 사용하고 있는 데이터의 크기가 커서 학습을 하는 도중에 멈추는 현상이 발생했습니다.  나중에 다른 가벼운 작업을 할 때 유용하게 사용할 수 있을 거라 생각하며 마무리하겠습니다.

반응형

댓글