본문 바로가기

AI126

[AI 부트캠프] DAY 121 - 파이널 프로젝트 12 [오늘의 일지] 프로젝트 - YOLO 모델을 위한 데이터셋 구성 완료 [상세 내용] 데이터셋을 위한 작업 목록 - 참고 코드를 기반으로 내 데이터에 적용시키기 - 완성된 데이터셋 확인 후 문제점 수정 - 모델에 돌려보기 참고 코드를 기반으로 내 데이터에 적용시키기 - 데이콘 대회에 올라온 코드를 기반으로 했지만 결과적으로는 데이터가 많이 달랐기 때문에 얻어야 하는 annotation을 기반으로 데이터셋을 완성시키려고 노력했습니다. 어제도 설명했듯이 YOLO의 annotation의 형태는 아래와 같았습니다. # annotation 내용 완성된 데이터셋 확인 후 문제점 수정 - 완성된 데이터를 확인해 봤을 때는 뒤에 4개의 값은 무조건 0~1의 데이터를 가지고 있어야 한다는 것을 알게 되었습니다. 이유는 위.. 2024. 1. 12.
[AI 부트캠프] DAY 120 - 파이널 프로젝트 11 [오늘의 일지] 프로젝트 - YOLO 모델을 위한 데이터셋 알아보기 [상세 내용] YOLO 모델을 위한 데이터셋 - 다른 모델과는 다르게 딥러닝 모델들은 각 모델에 맞는 데이터셋을 잘 구축하는 것이 중요합니다. 제대로 된 데이터셋을 구축하지 않으면 모델이 제대로 학습되지 않기 때문입니다. 그래서 오늘은 YOLO 모델에 맞는 데이터셋을 구축하는 과정에 대해서 정리해 보겠습니다. 오늘은 아마도 일부만 정리하고 나머지는 내일 정리할 것 같습니다. 특징 - 여러 가지 사이트를 검색해 본 결과 YOLO 모델은 예를 들면 하나의 이미지가 존재한다면 하나의 annotation 파일이 존재해야지 학습이 가능한 것으로 파악을 했습니다. annotation이라는 단어는 그 자체로 주석이라는 뜻을 가지는데 YOLO 모델의 .. 2024. 1. 11.
[AI 부트캠프] DAY 119 - 파이널 프로젝트 10 [오늘의 일지] 프로젝트 - 이미지 데이터 확인 [상세 내용] 이미지 데이터 확인 - 이번 프로젝트를 위한 데이터는 이미지마다 하나의 클래스 라벨이 존재하고 그 라벨의 bbox가 존재하고 있습니다. 학습을 시키기 전에 이미지 안에 어떻게 bbox가 생성되어 있는지를 확인하기 위해서 이미지 위에 bbox와 클래스 라벨을 출력시켜 보면서 확인해 보는 과정을 진행해 보았습니다. 실행 코드 - 처음에는 cv2.imread를 사용해서 이미지를 읽으려고 했는데 오류가 나서 image 모듈로 대체해서 읽어왔습니다. def draw_boxes_on_image(image_path, filename): # 이미지 불러오기 image = Image.open(image_path) image = cv2.cvtColor(np.a.. 2024. 1. 10.
[AI 부트캠프] DAY 118 - 파이널 프로젝트 9 [오늘의 일지] 프로젝트 - 데이터 정제 [상세 내용] 데이터 정제 - 지난주에 데이터를 파악했을 때는 반정형 데이터인 json 파일로 되어 있어서 보는데도 불편하고 가져다가 쓰기 위해서도 불편한 부분이 많다는 것을 느꼈습니다. 그래서 기존에 프로젝트 때마다 사용했던 방식인 케글이나 데이콘에서 많이 제공하는 pandas 데이터 프레임 방식으로 정형화시키기를 시도했습니다. json 파일 열고 원하는 부분 정형화 하기 - 기존의 존재하는 라이브러리를 사용하여 json을 열고 pandas의 json을 노멀라이즈 하는 기능이 있어서 사용한 뒤 for문을 통해 순환되는 데이터들을 마지막으로 concat을 토해서 전체적으로 받았다. 아래와 같은 방법을 한 사이클로 해서 데이터를 받았습니다. data1_list = .. 2024. 1. 9.
반응형