devway
홈전체 글태그

카테고리

  • 전체40
  • 인프라3
    • 하드웨어2
    • ubuntu1
  • AI34
    • 로컬 LLM8
    • AI 코딩 도구9
    • 컴퓨터 비전4
    • 디자인1
    • 이미지생성2
    • 데이터 아키텍쳐0
    • agent2
    • 모델3
  • Backend1
  • Architecture2
    • 분산 시스템1
    • 데이터0

태그

  • #로컬LLM9
  • #ClaudeCode9
  • #AI개발7
  • #LocalLLM6
  • #AI에이전트5
  • #에이전트4
  • #컴퓨터비전4
  • #MCP4
  • #LLM4
  • #RTX30904
  • #AI코딩4
  • #Anthropic4
  • #모델비교3
  • #객체탐지3
  • #로컬AI3
  • #딥러닝3
  • #개발도구3
  • #Gemma43
  • #이미지생성3
  • #백엔드3

구독

  • RSS
  • Sitemap
카테고리 / AI

컴퓨터 비전

객체 탐지·세그멘테이션·OCR 모델 적용 노트.

4개 글

Open-vocabulary 모델이라며, 결국 fine-tuning이 표준이 된 이유

Open-vocabulary 모델이라며, 결국 fine-tuning이 표준이 된 이유

YOLO-World 같은 open-vocabulary 객체 탐지 모델의 셀링 포인트는 zero-shot 검출인데, 정작 영어권 튜토리얼은 절반 이상이 "fine-tuning하는 법"으로 끝나는 패러독스를 정리. 사실 이 둘은 모순이 아니라 워크플로의 단계가 다른 거고, 한국어 라벨을 쓰는 환경에선 fine-tuning이 더 일찍 필요해진다는 추가 변수까지 짚었음.
  • #객체탐지
  • #YOLOWorld
  • #OpenVocabulary
  • #FineTuning
26-05-09 13:38컴퓨터 비전
RT-DETR이 YOLO 자리 가져간다는 얘기, 좀 걸러볼 만한 부분

RT-DETR이 YOLO 자리 가져간다는 얘기, 좀 걸러볼 만한 부분

객체 탐지에서 Transformer 기반 RT-DETR이 YOLO를 대체한다는 주장이 자주 보이는데, NMS-free 구조의 의미와 실제 환경에서 무엇이 바뀌는지 정리. 다만 생태계·엣지 배포·학습 비용 측면에서 YOLO를 통째로 갈아엎기엔 빠진 조각이 많은 이유까지 짚었음.
  • #객체탐지
  • #컴퓨터비전
  • #AI모델
  • #모델비교
26-05-09 11:53컴퓨터 비전
YOLOv3 워크스루 글 다시 보다가, 정작 흥미로운 부분은 따로 있었음

YOLOv3 워크스루 글 다시 보다가, 정작 흥미로운 부분은 따로 있었음

어디선가 본 영문 YOLOv3 페이퍼 워크스루 글을 한국 개발자 입장에서 다시 정리. Darknet-53, 멀티스케일 예측, 독립 로지스틱 분류기 같은 변경점을 설명만 하고 끝나는 게 아니라, 그 중에서 실제로 의미 있었던 변화는 무엇인지, 페이퍼 자체의 묘한 톤과 저자의 그 이후 행보까지 묶어서 보는 큐레이션 후기.
  • #YOLOv3
  • #객체인식
  • #ObjectDetection
  • #ComputerVision
26-05-01 12:11컴퓨터 비전
YOLO 버리고 RT-DETR 깔아봤더니 이렇게 됨

YOLO 버리고 RT-DETR 깔아봤더니 이렇게 됨

객체 탐지 모델을 YOLO에서 RT-DETR로 갈아탔다. Transformer 기반이라 NMS가 없고 추론도 안정적인 편. Python 3.12 환경에서 설치부터 이미지/영상 추론까지 직접 돌려본 후기와 솔직한 단점, 그리고 실제 코드까지 정리했다.
  • #객체탐지
  • #RTDETR
  • #Ultralytics
  • #Python
26-04-26 14:55컴퓨터 비전
소개개인정보처리방침RSSSitemapaickywayconvertprompt
© devway