fos-blog/study
01 / 홈02 / 카테고리03 / 시리즈
01 / 홈02 / 카테고리03 / 시리즈

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • agent 페이지로 이동
    • langgraph 페이지로 이동
    • 사람용 CLI와 AI 에이전트용 CLI는 설계가 다르다
    • agents.md
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code 메모리: CLAUDE.md와 .claude/rules를 규칙으로 쓰는 법
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식
    • Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
    • Claude Code 멀티 에이전트 — Teams
    • AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design
    • Docling — IBM Research 의 문서 파싱 toolkit 상세 정리
    • 하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기
    • 하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
    • 멀티모달 LLM (Multimodal Large Language Model)
    • AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
    • OpenClaw는 context와 memory를 어떻게 관리하나 — 나만의 에이전트를 구성하는 법
    • OpenClaw vs Hermes Agent — 갈아탈까 고민하며 정리한 비교
    • 스킬 문서를 신경망처럼 학습시킨다 — Microsoft SkillOpt 분석
  • ai 페이지로 이동
    • agent 페이지로 이동
    • [초안] AI 제품 백엔드 안정성 — 지연·비용·권한·관측·도구 실패·폴백/재시도/사람 에스컬레이션
    • [초안] LLM 평가 프레임워크: 골든셋, 회귀 테스트, LLM-as-a-judge, 사람 피드백 루프
  • algorithm 페이지로 이동
    • live-coding 페이지로 이동
    • 분산 계산을 위한 알고리즘
  • apartment 페이지로 이동
    • 구리 럭키아파트 24평 인테리어 레퍼런스 모음
  • architecture 페이지로 이동
    • [초안] 시니어 백엔드를 위한 API 설계 실전 스터디 팩 — REST · 멱등성 · 페이지네이션 · 버전 전략
    • [초안] API Versioning과 Backward Compatibility: 시니어 백엔드 관점 정리
    • 캐시 설계 전략 총정리
    • [초안] 커머스 Spring 서비스에 Clean/Hexagonal Architecture를 실용적으로 적용하기
    • [초안] 커머스 도메인 모델링: 주문·재고·노출의 세 축을 분리해서 설계하기
    • 커머스 주문 상태와 데이터 정합성 기본기
    • [초안] 쿠폰/프로모션 동시성과 정합성 기본기 — 선착순·중복 사용 방지·발급/사용/복구
    • [초안] DDD와 도메인 모델링: 시니어 백엔드 관점의 전술/전략 패턴 실전 가이드
    • [초안] Decorator & Chain of Responsibility — 행동을 체인으로 조립하는 두 가지 방식
    • 디자인 패턴
    • [초안] 분산 아키텍처 완전 정복: Java 백엔드 시니어 인터뷰 대비 실전 가이드
    • [초안] 분산 트랜잭션과 Outbox 패턴 — 왜 2PC를 피하고 어떻게 대신할 것인가
    • 분산 트랜잭션
    • [초안] e-Commerce 주문·결제 도메인 모델링: 상태머신, 멱등성, Outbox/Saga 실전 정리
    • [초안] Event Sourcing과 CQRS — 상태가 아니라 변화를 저장한다는 발상
    • [초안] F&B 쿠폰·프로모션·멤버십·포인트 설계
    • [초안] F&B · e-Commerce 디지털 채널 도메인 한 장 정리
    • [초안] F&B 주문/매장/픽업 상태머신 설계
    • [초안] F&B 이커머스 결제·환불·정산 운영 가이드
    • [초안] Hexagonal / Clean Architecture를 Spring 백엔드에 적용하기
    • [초안] 대규모 커머스 트래픽 처리 패턴 — 대규모 회원과 메가 프로모션을 버티는 설계
    • [초안] 레거시 JSP/jQuery 화면과 신규 API가 공존하는 백엔드 운영 전략
    • [초안] MSA 서비스 간 통신: Redis [Cache-Aside](../database/redis/cache-aside.md) × Kafka 이벤트 하이브리드 설계
    • [초안] Observability 입문: 시니어 백엔드가 장애를 탐지하고 대응하는 방식
    • [초안] Outbox / Inbox Pattern 심화 — 분산 메시징의 정합성 문제를 DB 트랜잭션으로 풀어내기
    • [초안] 결제 도메인 멱등성과 트랜잭션 재시도 기본기
    • [초안] 시니어 백엔드를 위한 Resilience 패턴 실전 가이드 — Timeout, Retry, Circuit Breaker, Bulkhead, Backpressure
    • [초안] REST API 버저닝과 모바일 앱 하위 호환성 — 디지털 채널 백엔드 관점
    • [초안] Spring Batch vs Event-Driven — 같은 비동기처럼 보이지만 전혀 다른 두 패러다임
    • [초안] Strategy Pattern — 분기문을 없애는 설계, 시니어 백엔드 인터뷰 핵심 패턴
    • [초안] 시니어 백엔드를 위한 시스템 설계 입문 스터디 팩
    • [초안] 템플릿 메서드 패턴 - 백엔드 처리 골격을 강제하는 가장 오래되고 가장 위험한 패턴
    • [초안] 대규모 트래픽 중 무중단 마이그레이션 — Feature Flag + Shadow Mode 실전
  • database 페이지로 이동
    • milvus 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • [초안] DB Connection Pool Saturation과 Thread Pool 격리
    • 커넥션 풀 크기는 얼마나 조정해야 할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • [초안] JPA N+1과 커머스 조회 모델: 주문/메뉴/쿠폰 도메인에서 살아남기
    • [초안] MyBatis 기본기 — XML Mapper, resultMap, 동적 SQL, 운영 패턴 정리
    • [초안] MyBatis와 JPA/Hibernate 트레이드오프 — 레거시 백엔드를 다루는 시니어 관점
    • 벡터 DB 5종은 안이 어떻게 다른가 — 아키텍처 심층 비교
    • 벡터 DB 어떻게 고를까 — OpenSearch · Milvus · Qdrant · Vespa 비교
    • 벡터 DB를 실제로 도입한 사례 — 빅테크 프로덕션
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • observability 페이지로 이동
    • [초안] 커머스/F&B 채널 장애 첫 5분과 관측성 기본기
    • [초안] 운영 데이터 정합성 장애 대응 — 결제 취소 누락과 중복 적재 런북
    • Envoy Proxy
    • [초안] F&B / e-Commerce 운영 장애 대응과 모니터링 — 백엔드 관점 정리
    • Graceful Shutdown
    • [초안] 시니어 백엔드를 위한 SLO와 Error Budget 기반 장애 대응
  • http 페이지로 이동
    • HTTP Connection Pool
    • HTTPS는 어떻게 안전한가 — TLS, 인증서, 그리고 termination
  • interview 페이지로 이동
    • [초안] AI 서비스 팀 경험 기반 시니어 백엔드 면접 질문 뱅크 — Spring Batch RAG / gRPC graceful shutdown / 전략 패턴 / 12일 AI 웹툰 MVP
    • Observability — 면접 답변 프레임
    • [초안] 시니어 Java 백엔드 면접 마스터 플레이북 — 김병태
    • [초안] NSC 슬롯팀 경험 기반 질문 은행 — 도메인 모델링·동시성·성능·AI 협업
  • java 페이지로 이동
    • concurrency 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • testing 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • [초안] Java 동시성 락 정리 — 커머스 메뉴/프로모션 정책 캐시 갱신 관점
    • [초안] JVM 튜닝 실전: 메모리 구조부터 Virtual Threads, GC 튜닝, 프로파일링까지
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node 백엔드 운영 패턴 — Streams 백프레셔, pipe/pipeline, 멱등성 vs 분산 락
    • Node.js
    • npm vs pnpm — 어떤 기준으로 선택했나
    • `setImmediate()`
  • kafka 페이지로 이동
    • [초안] Kafka 기본 개념 — 토픽, 파티션, 오프셋, 복제
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • [초안] Kafka 실전 설계: 파티션 전략, 컨슈머 그룹, 전달 보장, 재시도, 순서 보장 트레이드오프
    • 메시지 전송 신뢰성
    • [초안] Spring Kafka 컨슈머 오프셋 커밋과 트랜잭션 정렬: AckMode, manual ack, 멱등 처리
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • mlops 페이지로 이동
    • Python CUDA 버전 생태계 — nvidia-smi, nvcc, pip, conda가 다 다른 버전을 말하는 이유
    • GPU 컨테이너의 CUDA 버전 호환성 — nvidia-smi부터 이미지 다이어트까지
    • Kubernetes GPU 노드에서 /run tmpfs가 꽉 차서 Pod가 안 뜰 때
    • GPU·CUDA·MPS 기초 — 자바 백엔드 개발자가 처음 만나는 그림
    • Multi-process GPU 워크로드 — 자바 ThreadPool 사용자가 만나는 모델 차이
    • ML 서비스 성능 분석 워크플로 — 자바 백엔드 트러블슈팅과 다른 점
    • 한 GPU 를 여러 프로세스가 나눠 쓰기 — Time-Slicing 과 MPS
  • network 페이지로 이동
    • Connection reset by peer는 누가 보낸 걸까 — 리버스 프록시 홉마다 TCP 연결은 따로 논다
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • python 페이지로 이동
    • Python async/await — CompletableFuture·Reactor 와 다른 점, 그리고 blocking I/O 함정
    • Python 의존성 관리 — Java Maven/Gradle 사용자가 만나는 첫 충격
    • FastAPI 기초 — Spring Boot 사용자가 빠르게 익히는 법
    • Java 개발자를 위한 Python 심화 — OOP·데코레이터·컨텍스트 매니저
    • PyTorch 기초 — 텐서, 디바이스, 그리고 모델 로딩이 무거운 이유
    • Java 개발자를 위한 Python 문법 핵심
    • ThreadLocal 에서 contextvars 로 — Python 의 요청 컨텍스트 전파
    • OCR 동작 원리 — Layout · Text · Post-process 3단계
    • Python 서버의 RSS 가 안 줄어드는 이유 — gc.collect 의 한계와 malloc_trim
  • rabbitmq 페이지로 이동
    • [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
    • [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
  • security 페이지로 이동
    • [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
    • [초안] Spring Security 6.x OAuth2 + JWT 상용 인증 설계 — Grant 선택, Resource Server, Refresh Rotation, 로그아웃
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • sb-dev-team 페이지로 이동
    • the-future-company 페이지로 이동
  • testing 페이지로 이동
    • [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
  • travel 페이지로 이동
    • 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
  • web 페이지로 이동
    • [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점
FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr
Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors
01site
  • Home↗
  • Posts↗
  • Categories↗
  • About↗
02policy
  • 소개/about
  • 개인정보처리방침/privacy
  • 연락처/contact
03categories
  • AI↗
  • Algorithm↗
  • DB↗
  • DevOps↗
  • Java/Spring↗
  • JS/TS↗
  • React↗
  • Next.js↗
  • System↗
04connect
  • GitHub@jon890↗
  • Source repositoryjon890/fos-study↗
  • RSS feed/rss.xml↗
  • Newsletter매주 1 회 · 한 편의 글→
© 2026 FOS Study. All posts MIT-licensed.
built with·Next.js·Tailwind v4·Geist·Pretendard·oklch
fos-blog/python/ThreadLocal 에서 contextva…
system

ThreadLocal 에서 contextvars 로 — Python 의 요청 컨텍스트 전파

자바에서 요청 단위로 값을 들고 다니는 일은 ThreadLocal, 더 정확히는 그 위에 얹은 SLF4J MDC 의 몫이었다. 요청이 들어오면 인터셉터에서 requestId 를 MDC 에 넣고, 로그 패턴에 %X{requestId} 만 박아두면 그 요청에서 찍히는 모든 로그 줄에 같은 id 가 자동으로 붙는다. 함수 인자로 requestId 를 일일이 넘기...

2026.06.25·7 min read·8 views·SERIES · 자바 백엔드 개발자를 위한 Python 입문 · 6/7

자바에서 요청 단위로 값을 들고 다니는 일은 ThreadLocal, 더 정확히는 그 위에 얹은 SLF4J MDC 의 몫이었다. 요청이 들어오면 인터셉터에서 requestId 를 MDC 에 넣고, 로그 패턴에 %X{requestId} 만 박아두면 그 요청에서 찍히는 모든 로그 줄에 같은 id 가 자동으로 붙는다. 함수 인자로 requestId 를 일일이 넘기지 않아도 된다는 게 핵심이다.

Python 으로 같은 일을 하려다 threading.local 을 먼저 떠올렸는데, async 코드에서 깨진다는 걸 알게 됐다. 정답은 contextvars 였다. 이 글은 자바의 ThreadLocal/MDC 감각을 Python 으로 옮기면서 정리한 노트다 — 둘이 거의 1:1 로 대응되지만, async 를 만나는 순간 갈라진다는 점이 요지다.

문제 — 요청마다 다른 값을 인자 없이 꺼내고 싶다

서버에서 한 요청을 처리하는 동안에는 그 요청에만 해당하는 값이 있다. requestId, 호출자 IP, 인증 주체 같은 것들이다. 이 값을 로깅·감사·추적에 쓰려면 호출 스택 깊은 곳까지 전달해야 하는데, 모든 함수 시그니처에 request_id 파라미터를 추가하는 건 끔찍하다.

그래서 "현재 실행 흐름에 묶인 저장소"가 필요하다. 요청 A 를 처리하는 흐름에서 꺼내면 A 의 값이, B 의 흐름에서 꺼내면 B 의 값이 나오는 저장소. 자바는 이걸 스레드 단위로 풀었고, Python 도 같은 출발점을 가진다.

자바에서는 ThreadLocal, 그리고 MDC

ThreadLocal 은 값을 스레드마다 따로 저장한다. 서블릿 컨테이너가 요청 하나를 스레드 하나에 묶어 처리하므로, 스레드별 저장소가 곧 요청별 저장소가 된다.

로깅에서는 이걸 직접 만지지 않고 MDC(Mapped Diagnostic Context)를 쓴다. MDC 내부가 ThreadLocal<Map> 이다.

java
// 진입점(인터셉터)에서 한 번
MDC.put("requestId", requestId);
// 이후 이 스레드에서 찍는 모든 로그에 requestId 가 붙는다 (패턴에 %X{requestId})
// 요청 끝나면 정리
MDC.clear();

전제는 "한 요청 = 한 스레드, 그리고 그 스레드가 요청 내내 유지된다"는 것이다. 이 전제가 깨지는 순간(비동기로 다른 스레드에 넘기면) MDC 도 따라가지 못해서, Reactor 의 context 전파나 ThreadLocalAccessor 같은 장치를 따로 붙여야 한다.

Python 의 답 — contextvars

Python 3.7 부터 표준 라이브러리에 contextvars 가 들어왔다. ContextVar 하나가 자바의 ThreadLocal 한 칸에 대응한다.

python
import contextvars
 
# 모듈 레벨에서 생성한다 (closure 안에서 만들면 GC 가 제대로 안 됨 — 공식 문서 경고)
request_id_var = contextvars.ContextVar("request_id", default=None)
 
# 진입점에서 set
token = request_id_var.set("abc-123")
 
# 어디서든 get
request_id_var.get()   # "abc-123", 없으면 default(None)
 
# 복원 (set 이 돌려준 token 으로)
request_id_var.reset(token)

set() 이 Token 을 돌려주고 reset(token) 으로 이전 값으로 되돌린다는 점이 ThreadLocal 의 set/remove 보다 한 단계 정교하다. 중첩 호출에서 바깥 값을 안전하게 복원할 수 있다(같은 토큰은 두 번 못 쓴다).

ThreadLocal 과 무엇이 같고 다른가

공식 문서가 직접 말한다 — "각 스레드는 자신의 context stack 을 가지므로, 서로 다른 스레드에서 값을 할당하면 ContextVar 는 threading.local() 과 비슷하게 동작한다." 즉 스레드 격리는 똑같다. 차이는 async 에서 드러난다.

항목자바 ThreadLocal/MDCPython threading.localPython contextvars
스레드별 격리OOO
새 스레드가 부모 값 상속XXX (스레드는 빈 context 로 시작)
async/코루틴 단위 격리해당 없음X — 깨짐O — Task 가 context 복사
await 가로질러 값 유지해당 없음XO
표준 위치java.lang / SLF4Jthreadingcontextvars (PEP 567)

왜 threading.local 이 아니라 contextvar 인가 — async 에서 갈린다

threading.local 도 있는데 왜 굳이 contextvars 인가. 동기 스레드 모델만 쓴다면 둘은 사실상 같다. 갈리는 지점은 asyncio 다.

asyncio 는 보통 한 스레드 안에서 여러 코루틴을 번갈아 실행한다. await 에서 실행권이 다른 코루틴으로 넘어갔다가 돌아온다. threading.local 은 "같은 스레드면 같은 값"이라, 한 스레드에서 코루틴 A·B 가 번갈아 돌면 서로의 값을 덮어쓴다 — 격리가 깨진다.

contextvars 는 이걸 푼다. asyncio 의 각 Task 는 생성될 때 현재 context 를 복사해서 들고 시작한다. 그래서 코루틴이 await 를 건너뛰어도 자기 context 의 값이 그대로 유지된다. (자바 진영에서 Reactor 가 Hooks.enableAutomaticContextPropagation() 으로 풀려던 문제와 같은 문제를, Python 은 표준 라이브러리 차원에서 푼 셈이다.)

async 와 blocking 의 경계 감각은 async/await 와 blocking I/O 함정 에서 더 다뤘다.

한 가지 비대칭에 주의한다. Task(asyncio)는 부모 context 를 상속하지만, 스레드(threading)는 상속하지 않는다. 설계 의도가 다르기 때문이다 — Task 는 보통 자신을 띄운 코드와 논리적으로 묶인 짧은 작업이고, 스레드는 독립적인 장기 실행 단위로 본다. 그래서 ThreadPoolExecutor 로 작업을 넘기면 워커 스레드는 부모의 context 값을 못 받는다. 이게 뒤에서 다룰 함정의 핵심이다.

실전 패턴 — 로그에 자동 주입

MDC + %X{requestId} 의 Python 대응은 contextvars + logging.Filter 다. Filter 가 모든 로그 레코드를 지나가므로, 거기서 contextvar 값을 레코드에 꽂으면 모든 로그 줄에 자동으로 붙는다.

python
import logging
from mypkg.trace_context import request_id_var
 
class RequestIdFilter(logging.Filter):
    def filter(self, record):
        # 이미 명시적으로 박힌 값이 있으면 보존, 없을 때만 contextvar 값 주입
        if getattr(record, "requestId", None) is None:
            record.requestId = request_id_var.get()
        return True
 
# 핸들러에 Filter 를 붙여두면 끝. 로그 호출부는 requestId 를 신경 쓸 필요가 없다.
handler.addFilter(RequestIdFilter())

이렇게 하면 로그를 찍는 쪽 코드는 logger.info("done") 만 호출하면 된다. requestId 를 매번 extra= 로 넘기던 걸 진입점 1곳의 set + Filter 자동 주입으로 옮기는 것이다. "새 로그를 추가할 때 requestId 전달을 잊는" 누락이 구조적으로 사라진다.

요청 단위 값을 "어느 계층에서 주입할 것인가"라는 고민은 자바의 Filter · Interceptor · AOP 관심사 분리 와 같은 질문이다. 진입점에 한 번 꽂고 아래로는 전파에 맡긴다는 원칙은 언어와 무관하게 같다.

적용 사례 — gRPC 모델 추론 서버의 분산 추적

최근 내가 다루는 gRPC OCR 모델 추론 서버에 분산 추적을 붙이는 설계를 했다. 상위 API 서버가 자기 requestId 를 X-Request-Id 헤더로 실어 모델 서버를 호출하면, 모델 서버는 그 값을 자기 로그의 requestId 로 채워 양쪽 로그를 한 id 로 묶는 그림이다.

전파 방식으로 두 안을 놓고 고민했다.

  • 호출마다 requestId 를 함수 인자/extra 로 명시 전달
  • 진입점에서 contextvar 에 한 번 넣고 Filter 가 자동 주입

명시 전달은 새 로그가 생길 때마다 빠뜨릴 위험이 있어서, contextvar 방식을 택했다. 구조는 이렇다.

python
# gRPC 진입점(인터셉터)에서 헤더 → contextvar
def set_request_id_from_metadata(metadata):
    rid = _find_header(metadata, "x-request-id")  # gRPC metadata 는 소문자 키
    if not rid:
        rid = uuid.uuid4().hex                      # 헤더 없으면 자체 생성 fallback
    request_id_var.set(rid)
    return rid

여기서 자바 경험이 그대로 도움이 됐다. 상위 API 서버(자바)는 인입 X-Request-Id 를 인터셉터에서 MDC 에 넣고, async 경계를 넘기 위해 Reactor context 전파를 따로 걸었다. 모델 서버(Python)는 같은 일을 진입점 contextvar + Filter 로 한다. 양쪽이 같은 문제(요청 단위 값의 흐름 전파)를 각 언어의 표준 도구로 푼 것이고, 개념이 1:1 로 겹쳐서 설계가 빨랐다.

이 서버는 gRPC 동기 서버라 요청이 워커 스레드에서 실행된다. 그래서 contextvar 의 async 이점을 당장 쓰는 건 아니지만, 표준이고 향후 async 전환에도 안전해서 threading.local 대신 골랐다.

OCR 파이프라인 자체의 구조는 OCR 동작 원리 에 따로 정리했다.

어디서 깨지나

직접 정리하면서 확인한 함정들이다.

  • 스레드 풀에 넘기면 값이 안 따라간다. ThreadPoolExecutor 로 작업을 던지면 워커 스레드는 빈 context 로 시작한다(부모 미상속). 그 스레드 진입점에서 다시 set 하거나, contextvars.copy_context() 로 부모 context 를 복사해 ctx.run(...) 으로 실행해야 한다.
  • 모듈 레벨에서 만들어야 한다. ContextVar 를 함수/클로저 안에서 생성하면 GC 가 제대로 안 된다(공식 문서 경고). 모듈 전역에 한 번 선언한다.
  • reset 을 안 하면 값이 남는다. 한 스레드를 재사용하는 풀에서 set 만 하고 reset 을 안 하면 다음 작업에 이전 값이 새어든다. 단, 요청마다 진입점에서 항상 set 하는 구조라면 매번 덮어쓰므로 안전하다. 애매하면 token 으로 reset 하거나 finally 에서 정리한다.
  • threading.local 을 async 에 쓰면 조용히 틀린다. 에러가 안 나고 값만 뒤섞여서 디버깅이 어렵다. async 코드면 처음부터 contextvars 를 쓴다.

가져갈 기준

  • async 코드(asyncio)면 고민 없이 contextvars. threading.local 은 await 에서 격리가 깨진다.
  • 동기 스레드 모델만이면 둘 다 동작하지만, 표준이고 미래에 안전한 contextvars 를 기본으로 둔다.
  • 요청 단위 값은 진입점 한 곳에서 set, 아래로는 Filter(또는 자바라면 MDC 패턴)로 자동 주입한다. 함수 인자로 끌고 다니지 않는다.
  • 스레드 풀·executor 경계를 넘기면 context 가 자동으로 안 따라간다는 걸 기억한다 — 그 경계에서 명시적으로 복사하거나 다시 set 한다.

회고

자바에서 MDC 를 당연하게 쓰다가 Python 으로 넘어오니 "이건 뭘로 하지" 싶었는데, contextvars 가 거의 같은 모델이라 옮겨오는 비용이 거의 없었다. 오히려 contextvars 쪽이 async 까지 표준으로 커버해서 더 깔끔했다. 양쪽 언어가 같은 문제를 각자의 표준으로 푼 걸 나란히 놓고 보니, "요청 컨텍스트는 진입점에 한 번 꽂고 전파에 맡긴다"는 원칙 자체는 언어와 무관하다는 게 분명해졌다.

참고 링크

  • contextvars — Context Variables (Python 공식 문서)
  • PEP 567 – Context Variables
  • PEP 550 – Execution Context
on this page
  • 01문제 — 요청마다 다른 값을 인자 없이 꺼내고 싶다
  • 02자바에서는 ThreadLocal, 그리고 MDC
  • 03Python 의 답 — contextvars
  • 04ThreadLocal 과 무엇이 같고 다른가
  • 05왜 threading.local 이 아니라 contextvar 인가 — async 에서 갈린다
  • 06실전 패턴 — 로그에 자동 주입
  • 07적용 사례 — gRPC 모델 추론 서버의 분산 추적
  • 08어디서 깨지나
  • 09가져갈 기준
  • 10회고
  • 11참고 링크
tags
📚 자바 백엔드 개발자를 위한 Python 입문
← PREVIOUSPython async/await — CompletableFuture·Reactor 와 다른 점, 그리고 blocking I/O 함정NEXT →PyTorch 기초 — 텐서, 디바이스, 그리고 모델 로딩이 무거운 이유

이런 글도

  • Python 서버의 RSS 가 안 줄어드는 이유 — gc.collect 의 한계와 malloc_trim
    Python 으로 long-running 서버 (FastAPI / Flask / Celery / uWSGI 등) 를 운영하다 보면 한 번쯤 마주치는 증상이 있다. - 워커 프로세스의 RSS 가 시간이 지날수록 단조 증가한다 - 큰 객체를 del 하고 gc.collect() 를 불러도 RSS 가 줄지 않는다 - 결국 max-requests / workerma...
    📁 system
    system
    2026.05.22
  • OCR 동작 원리 — Layout · Text · Post-process 3단계
    자바 백엔드만 다뤄오다가 OCR (Optical Character Recognition) 서비스를 분석할 일이 생겼다. "이미지에서 글자를 뽑는다" 라는 한 줄 요약은 알았지만, 실제 코드를 열어보면 모델이 둘이상이고, 여러 단계가 직렬·병렬로 엮여 있고, "왜 이 단계가 따로 있지" 같은 의문이 계속 생긴다. 이 글은 OCR 파이프라인의 표준 구조를 정리...
    📁 system
    system
    2026.05.19
  • PyTorch 기초 — 텐서, 디바이스, 그리고 모델 로딩이 무거운 이유
    자바 백엔드에서 Spring Boot 가 부팅하는 시간이 5-30초 걸리는 게 일반적이다. 클래스 로딩, 컴포넌트 스캔, 의존성 주입, EntityManagerFactory 초기화 등이 누적된다. 한 번 부팅하면 그 뒤로는 요청 처리에 거의 영향이 없다. PyTorch 기반 ML 서비스는 비슷하지만 한 단계 더 무겁다. 우리 프로젝트의 KR Worker 가...
    📁 system
    system
    2026.05.19
  • Python async/await — CompletableFuture·Reactor 와 다른 점, 그리고 blocking I/O 함정
    자바에서 비동기를 다루는 방법은 시대마다 달랐다. Future.get() 의 블로킹 시절, CompletableFuture 의 콜백 체인, Reactor·RxJava 의 스트림. 모두 별도 스레드에서 작업을 돌리고 결과를 받아오는 모델이다. Python 의 async/await 는 다르다. 단일 스레드 안에서 이벤트 루프가 코루틴을 번갈아 실행한다. 처음...
    📁 system
    system
    2026.05.19

댓글 (0)