Claude Code 옆에 캐시 레이어 붙이겠다는 발상
Claude Code가 한 세션 안에서 같은 파일을 두세 번씩 다시 읽는 문제를 외부 미들웨어로 풀어보겠다는 오픈소스 프로젝트(OpenWolf)가 영어권에서 돌고 있음. 80% 토큰 절감이라는 수치는 어디까지 믿을 수 있는지, 백엔드 입장에서 보면 어떤 부분이 의심스러운지 정리.
태그
이 태그가 달린 글 모음. 최신순.
Claude Code가 한 세션 안에서 같은 파일을 두세 번씩 다시 읽는 문제를 외부 미들웨어로 풀어보겠다는 오픈소스 프로젝트(OpenWolf)가 영어권에서 돌고 있음. 80% 토큰 절감이라는 수치는 어디까지 믿을 수 있는지, 백엔드 입장에서 보면 어떤 부분이 의심스러운지 정리.
에이전틱 개발이 일상이 되면서 토큰 한도가 새로운 생산성 병목이 되어가는 중. 클라우드 단일 의존이 만든 redundancy 문제, pay-to-win 경쟁 구조, 로컬 모델이 지금 와있는 자리, 그리고 한국 개발자 입장에서 더 따끔한 부분까지 정리.
AI가 Google Drive에서 raw 데이터 찾아 BigQuery에 적재하고 분석 리포트까지 30분 안에 뽑아낸다는 시연이 도는데, 직접 MCP 깔아본 입장에서 보면 30분에서 빠진 시간이 더 길다. Plan Mode가 진짜 핵심인 이유, 첫 패스가 얕은 이유, 그리고 142GB짜리 로그 파일 일화까지.
"AI 자격증 주말에 따버렸음" 류의 자랑글이 콘텐츠 포맷으로 굳었어요. 그 중 하나를 끝까지 읽고 정리해봤는데, 자격증 자체보다 글 안에 묻혀 있던 한 줄(Anthropic Academy)이 훨씬 쓸모 있었습니다. 한국 개발자 입장에서 두 옵션을 어떻게 비교하면 될지, 그리고 "AI 리터러시 = 새 Excel" 비유의 게으른 부분에 대한 솔직한 정리.
CLI에서 Claude Code 굴리다 Warp로 넘어왔다. Mac/Windows/Ubuntu 다 깔리고 알림이랑 코드 리뷰 코멘트가 진짜 편함. IDE 무게감도 안 받고 깡 터미널 답답함도 없어진 두 달치 솔직 후기.
Google Antigravity 출시 초반에 환호했던 개발자들이 지금은 503 에러랑 "Baseline model quota reached" 메시지에 좌초 중. 이게 단순 버그가 아니라 stateful 아키텍처의 구조적 한계라는 분석을 정리하고, 왜 워크플로우를 한 회사에 묶어두면 안 되는지 한 달 굴려본 경험으로 풀어봤어요.
Sonnet 4.7로 업그레이드한 뒤 Claude Code 토큰 사용량이 갑자기 폭증했다면, 모델 탓이 아닙니다. 진짜 원인은 백엔드 MCP 서버가 컨텍스트 윈도우에 쓰레기를 자꾸 부어넣는 구조. 실측 벤치마크와 InsForge 같은 컨텍스트 엔지니어링 도구로 토큰비 2~3배 줄이는 구조를 정리했어요.
같은 Claude 모델 쓰는데 Claude Code랑 그냥 클로드는 왜 이렇게 다르게 느껴질까. 1조 매출 비결은 새 모델이 아니라 모델 주변에 엮어둔 "하네스(harness)"였다는 분석을 AI 아트 자동화 워크플로우 만든 경험과 함께 풀어본다. 비개발자 AI 창작자도 알면 도움 되는 내용.
Alibaba Qwen 팀이 풀어놓은 35B-A3B 로컬 모델을 RTX 3090에 직접 돌려본 후기. 3B 액티브 파라미터로 Sonnet 4.5급 코딩을 뽑아내는 MoE 구조, 110 tok/s 만드는 플래그 셋업, Ollama가 왜 답이 아닌지까지 정리.