컴퓨터 비전
객체 탐지·세그멘테이션·OCR 모델 적용 노트.
4개 글

Open-vocabulary 모델이라며, 결국 fine-tuning이 표준이 된 이유
YOLO-World 같은 open-vocabulary 객체 탐지 모델의 셀링 포인트는 zero-shot 검출인데, 정작 영어권 튜토리얼은 절반 이상이 "fine-tuning하는 법"으로 끝나는 패러독스를 정리. 사실 이 둘은 모순이 아니라 워크플로의 단계가 다른 거고, 한국어 라벨을 쓰는 환경에선 fine-tuning이 더 일찍 필요해진다는 추가 변수까지 짚었음.
- #객체탐지
- #YOLOWorld
- #OpenVocabulary
- #FineTuning
26-05-09 13:38

RT-DETR이 YOLO 자리 가져간다는 얘기, 좀 걸러볼 만한 부분
객체 탐지에서 Transformer 기반 RT-DETR이 YOLO를 대체한다는 주장이 자주 보이는데, NMS-free 구조의 의미와 실제 환경에서 무엇이 바뀌는지 정리. 다만 생태계·엣지 배포·학습 비용 측면에서 YOLO를 통째로 갈아엎기엔 빠진 조각이 많은 이유까지 짚었음.
- #객체탐지
- #컴퓨터비전
- #AI모델
- #모델비교
26-05-09 11:53

YOLOv3 워크스루 글 다시 보다가, 정작 흥미로운 부분은 따로 있었음
어디선가 본 영문 YOLOv3 페이퍼 워크스루 글을 한국 개발자 입장에서 다시 정리. Darknet-53, 멀티스케일 예측, 독립 로지스틱 분류기 같은 변경점을 설명만 하고 끝나는 게 아니라, 그 중에서 실제로 의미 있었던 변화는 무엇인지, 페이퍼 자체의 묘한 톤과 저자의 그 이후 행보까지 묶어서 보는 큐레이션 후기.
- #YOLOv3
- #객체인식
- #ObjectDetection
- #ComputerVision
26-05-01 12:11

YOLO 버리고 RT-DETR 깔아봤더니 이렇게 됨
객체 탐지 모델을 YOLO에서 RT-DETR로 갈아탔다. Transformer 기반이라 NMS가 없고 추론도 안정적인 편. Python 3.12 환경에서 설치부터 이미지/영상 추론까지 직접 돌려본 후기와 솔직한 단점, 그리고 실제 코드까지 정리했다.
- #객체탐지
- #RTDETR
- #Ultralytics
- #Python
26-04-26 14:55