홈 전체 글 태그

카테고리

전체40
인프라3
- 하드웨어2
- ubuntu1
AI34
Backend1
Architecture2
- 분산 시스템1
- 데이터0

태그

#로컬LLM9
#ClaudeCode9
#AI개발7
#LocalLLM6
#AI에이전트5
#에이전트4
#컴퓨터비전4
#MCP4
#LLM4
#RTX30904
#AI코딩4
#Anthropic4
#모델비교3
#객체탐지3
#로컬AI3
#딥러닝3
#개발도구3
#Gemma43
#이미지생성3
#백엔드3

구독

RSS
Sitemap

카테고리 / AI

컴퓨터 비전

객체 탐지·세그멘테이션·OCR 모델 적용 노트.

4개 글

Open-vocabulary 모델이라며, 결국 fine-tuning이 표준이 된 이유

Open-vocabulary 모델이라며, 결국 fine-tuning이 표준이 된 이유

YOLO-World 같은 open-vocabulary 객체 탐지 모델의 셀링 포인트는 zero-shot 검출인데, 정작 영어권 튜토리얼은 절반 이상이 "fine-tuning하는 법"으로 끝나는 패러독스를 정리. 사실 이 둘은 모순이 아니라 워크플로의 단계가 다른 거고, 한국어 라벨을 쓰는 환경에선 fine-tuning이 더 일찍 필요해진다는 추가 변수까지 짚었음.

#객체탐지
#YOLOWorld
#OpenVocabulary
#FineTuning

26-05-09 13:38컴퓨터 비전

RT-DETR이 YOLO 자리 가져간다는 얘기, 좀 걸러볼 만한 부분

RT-DETR이 YOLO 자리 가져간다는 얘기, 좀 걸러볼 만한 부분

객체 탐지에서 Transformer 기반 RT-DETR이 YOLO를 대체한다는 주장이 자주 보이는데, NMS-free 구조의 의미와 실제 환경에서 무엇이 바뀌는지 정리. 다만 생태계·엣지 배포·학습 비용 측면에서 YOLO를 통째로 갈아엎기엔 빠진 조각이 많은 이유까지 짚었음.

#객체탐지
#컴퓨터비전
#AI모델
#모델비교

26-05-09 11:53컴퓨터 비전

YOLOv3 워크스루 글 다시 보다가, 정작 흥미로운 부분은 따로 있었음

YOLOv3 워크스루 글 다시 보다가, 정작 흥미로운 부분은 따로 있었음

어디선가 본 영문 YOLOv3 페이퍼 워크스루 글을 한국 개발자 입장에서 다시 정리. Darknet-53, 멀티스케일 예측, 독립 로지스틱 분류기 같은 변경점을 설명만 하고 끝나는 게 아니라, 그 중에서 실제로 의미 있었던 변화는 무엇인지, 페이퍼 자체의 묘한 톤과 저자의 그 이후 행보까지 묶어서 보는 큐레이션 후기.

#YOLOv3
#객체인식
#ObjectDetection
#ComputerVision

26-05-01 12:11컴퓨터 비전

YOLO 버리고 RT-DETR 깔아봤더니 이렇게 됨

YOLO 버리고 RT-DETR 깔아봤더니 이렇게 됨

객체 탐지 모델을 YOLO에서 RT-DETR로 갈아탔다. Transformer 기반이라 NMS가 없고 추론도 안정적인 편. Python 3.12 환경에서 설치부터 이미지/영상 추론까지 직접 돌려본 후기와 솔직한 단점, 그리고 실제 코드까지 정리했다.

#객체탐지
#RTDETR
#Ultralytics
#Python

26-04-26 14:55컴퓨터 비전

소개 개인정보처리방침 RSS Sitemapaickyway convert prompt

© devway