t
2026년 3월 31일
출처: https://x.com/BSPK_/status/2038967043995914742
님이 공유해주신 유출된 Claude Code 소스를 바탕으로 메모리 수요를 전망하는 포스트의 번역 입니다.
------
사람들은 메모리에 대해 약세 전망을 갖고 있지만, 유출된 Claude Code 소스 코드를 보면 시장이 아직 반영하지 못한 추가적인 메모리 수요가 드러나고 있다고 생각합니다.
1. 시장은 AI 메모리 수요를 서버 측 이야기로만 봅니다. 즉, H100/B200에 탑재된 HBM을 통한 추론 수요 말입니다. 그런데 이 코드에서 발견된 버그 리포트들은 AI 코딩 에이전트의 클라이언트 측 역시 엄청나게 메모리를 많이 소모한다는 것을 보여줍니다. 유휴 상태의 Claude Code 프로세스 하나가 15GB까지 늘어나고, 활성 세션은 93~129GB에 달합니다. 이게 중요한 이유는 기능 플래그 파이프라인(DAEMON, PROACTIVE, CRON)이 향후 상시 가동되는 백그라운드 에이전트를 지향하고 있기 때문입니다. 개발자가 활성 세션과 함께 상주형 데몬 에이전트를 돌린다면, IDE나 브라우저 등 다른 것을 열기도 전에 Claude Code만으로 기본 메모리 소비가 15~30GB 이상이 됩니다. 이는 기업 IT 부서가 고용량 RAM 워크스테이션으로 대폭 업그레이드하거나, 메모리 집약적인 워크로드를 클라우드로 더 많이 이전해야 한다는 뜻입니다.
2. Auto Dream 통합 기능은 백그라운드에서 Claude 세션을 실행하여 메모리 파일을 정리합니다. 관측된 한 통합 작업은 913개 세션을 처리하는 데 8~9분이 걸렸습니다. 다시 말해, Anthropic의 토큰 소비 중 상당 부분이 사용자의 생산적인 작업이 아니라 시스템이 자체 메모리를 관리하는 데 쓰이고 있다는 것입니다. 메모리 시스템이 더 정교해질수록(팀 동기화, 크로스 세션 이벤트 버스, 메모리 통합 등) 이 오버헤드는 커집니다. 이건 재귀적 비용입니다. 메모리 기능이 늘어날수록 메모리를 관리하기 위한 추론이 더 필요해지는 것이죠. 토큰 소비량 추정에서 이것을 별도 항목으로 모델링하는 사람은 아직 없다고 봅니다.
3. Claude Code의 100만 토큰 컨텍스트 윈도우입니다. 20만에서 100만으로의 전환은 서버 측에서 세션당 KV 캐시 메모리가 5배 증가하는 것을 의미합니다. 여기에 멀티 에이전트(사용자당 5~15배)와 프로액티브/데몬 기능(세션이 분 단위가 아닌 시간/일 단위로 유지)이 결합되면, 많은 애널리스트들이 모델링하는 선형적 사용자 증가보다 훨씬 가파른 복합적 메모리 수요 곡선이 만들어집니다.
활성 사용자당 메모리 수요가 사용자 수 증가보다 더 빠르게 늘어나고 있습니다. 각 사용자의 세션이 더 길어지고, 더 넓어지고(더 많은 에이전트), 더 깊어지고(더 큰 컨텍스트 윈도우) 있기 때문입니다.