fos-blog/study
01 / 홈02 / 카테고리03 / 시리즈
01 / 홈02 / 카테고리03 / 시리즈

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • langgraph 페이지로 이동
    • agents.md
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code 메모리: CLAUDE.md와 .claude/rules를 규칙으로 쓰는 법
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식
    • Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
    • Claude Code 멀티 에이전트 — Teams
    • AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design
    • Docling — IBM Research 의 문서 파싱 toolkit 상세 정리
    • 하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기
    • 하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
    • 멀티모달 LLM (Multimodal Large Language Model)
    • AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
    • OpenClaw는 context와 memory를 어떻게 관리하나 — 나만의 에이전트를 구성하는 법
    • OpenClaw vs Hermes Agent — 갈아탈까 고민하며 정리한 비교
    • 스킬 문서를 신경망처럼 학습시킨다 — Microsoft SkillOpt 분석
  • ai 페이지로 이동
    • agent 페이지로 이동
    • [초안] AI 제품 백엔드 안정성 — 지연·비용·권한·관측·도구 실패·폴백/재시도/사람 에스컬레이션
    • [초안] LLM 평가 프레임워크: 골든셋, 회귀 테스트, LLM-as-a-judge, 사람 피드백 루프
  • algorithm 페이지로 이동
    • live-coding 페이지로 이동
    • 분산 계산을 위한 알고리즘
  • apartment 페이지로 이동
    • 구리 럭키아파트 24평 인테리어 레퍼런스 모음
  • architecture 페이지로 이동
    • [초안] 시니어 백엔드를 위한 API 설계 실전 스터디 팩 — REST · 멱등성 · 페이지네이션 · 버전 전략
    • [초안] API Versioning과 Backward Compatibility: 시니어 백엔드 관점 정리
    • 캐시 설계 전략 총정리
    • [초안] CJ푸드빌 디지털 채널 면접: 슬롯 도메인 경험을 커머스 도메인 설계 능력으로 번역하기
    • [초안] 커머스 Spring 서비스에 Clean/Hexagonal Architecture를 실용적으로 적용하기
    • [초안] 커머스 도메인 모델링: 주문·재고·노출의 세 축을 분리해서 설계하기
    • 커머스 주문 상태와 데이터 정합성 기본기 — CJ푸드빌 면접 대비
    • [초안] 쿠폰/프로모션 동시성과 정합성 기본기 — 선착순·중복 사용 방지·발급/사용/복구
    • [초안] DDD와 도메인 모델링: 시니어 백엔드 관점의 전술/전략 패턴 실전 가이드
    • [초안] Decorator & Chain of Responsibility — 행동을 체인으로 조립하는 두 가지 방식
    • 디자인 패턴
    • [초안] 분산 아키텍처 완전 정복: Java 백엔드 시니어 인터뷰 대비 실전 가이드
    • [초안] 분산 트랜잭션과 Outbox 패턴 — 왜 2PC를 피하고 어떻게 대신할 것인가
    • 분산 트랜잭션
    • [초안] e-Commerce 주문·결제 도메인 모델링: 상태머신, 멱등성, Outbox/Saga 실전 정리
    • [초안] Event Sourcing과 CQRS — 상태가 아니라 변화를 저장한다는 발상
    • [초안] F&B 쿠폰·프로모션·멤버십·포인트 설계
    • [초안] F&B · e-Commerce 디지털 채널 도메인 한 장 정리 — CJ푸드빌 디지털 채널 백엔드 면접 대비
    • [초안] F&B 주문/매장/픽업 상태머신 설계 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] F&B 이커머스 결제·환불·정산 운영 가이드
    • [초안] Hexagonal / Clean Architecture를 Spring 백엔드에 적용하기
    • [초안] 대규모 커머스 트래픽 처리 패턴 — 1,600만 고객과 올영세일을 버티는 설계
    • [초안] 레거시 JSP/jQuery 화면과 신규 API가 공존하는 백엔드 운영 전략
    • [초안] MSA 서비스 간 통신: Redis [Cache-Aside](../database/redis/cache-aside.md) × Kafka 이벤트 하이브리드 설계
    • [초안] Observability 입문: 시니어 백엔드가 장애를 탐지하고 대응하는 방식
    • [초안] Outbox / Inbox Pattern 심화 — 분산 메시징의 정합성 문제를 DB 트랜잭션으로 풀어내기
    • [초안] 결제 도메인 멱등성과 트랜잭션 재시도 기본기
    • [초안] 시니어 백엔드를 위한 Resilience 패턴 실전 가이드 — Timeout, Retry, Circuit Breaker, Bulkhead, Backpressure
    • [초안] REST API 버저닝과 모바일 앱 하위 호환성 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] Spring Batch vs Event-Driven — 같은 비동기처럼 보이지만 전혀 다른 두 패러다임
    • [초안] Strategy Pattern — 분기문을 없애는 설계, 시니어 백엔드 인터뷰 핵심 패턴
    • [초안] 시니어 백엔드를 위한 시스템 설계 입문 스터디 팩
    • [초안] 템플릿 메서드 패턴 - 백엔드 처리 골격을 강제하는 가장 오래되고 가장 위험한 패턴
    • [초안] 대규모 트래픽 중 무중단 마이그레이션 — Feature Flag + Shadow Mode 실전
  • database 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • [초안] DB Connection Pool Saturation과 Thread Pool 격리
    • 커넥션 풀 크기는 얼마나 조정해야 할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • [초안] JPA N+1과 커머스 조회 모델: 주문/메뉴/쿠폰 도메인에서 살아남기
    • [초안] MyBatis 기본기 — XML Mapper, resultMap, 동적 SQL, 운영 패턴 정리
    • [초안] MyBatis와 JPA/Hibernate 트레이드오프 — 레거시 백엔드를 다루는 시니어 관점
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • observability 페이지로 이동
    • [초안] 커머스/F&B 채널 장애 첫 5분과 관측성 기본기
    • [초안] 운영 데이터 정합성 장애 대응 — 결제 취소 누락과 중복 적재 런북
    • Envoy Proxy
    • [초안] F&B / e-Commerce 운영 장애 대응과 모니터링 — 백엔드 관점 정리
    • Graceful Shutdown
    • [초안] 시니어 백엔드를 위한 SLO와 Error Budget 기반 장애 대응
  • finance 페이지로 이동
    • industry-cycle 페이지로 이동
    • investing 페이지로 이동
  • http 페이지로 이동
    • HTTP Connection Pool
    • HTTPS는 어떻게 안전한가 — TLS, 인증서, 그리고 termination
  • interview 페이지로 이동
    • [초안] AI 서비스 팀 경험 기반 시니어 백엔드 면접 질문 뱅크 — Spring Batch RAG / gRPC graceful shutdown / 전략 패턴 / 12일 AI 웹툰 MVP
    • [초안] 커머스/F&B 면접 답변집 — 슬롯 도메인 경험을 주문·결제·쿠폰·매장 설계로 매핑하기
    • Observability — 면접 답변 프레임
    • [초안] 시니어 Java 백엔드 면접 마스터 플레이북 — 김병태
    • [초안] NSC 슬롯팀 경험 기반 질문 은행 — 도메인 모델링·동시성·성능·AI 협업
  • java 페이지로 이동
    • concurrency 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • [초안] Java 동시성 락 정리 — 커머스 메뉴/프로모션 정책 캐시 갱신 관점
    • [초안] JVM 튜닝 실전: 메모리 구조부터 Virtual Threads, GC 튜닝, 프로파일링까지
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node 백엔드 운영 패턴 — Streams 백프레셔, pipe/pipeline, 멱등성 vs 분산 락
    • Node.js
    • npm vs pnpm — 어떤 기준으로 선택했나
    • `setImmediate()`
  • kafka 페이지로 이동
    • [초안] Kafka 기본 개념 — 토픽, 파티션, 오프셋, 복제
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • [초안] Kafka 실전 설계: 파티션 전략, 컨슈머 그룹, 전달 보장, 재시도, 순서 보장 트레이드오프
    • 메시지 전송 신뢰성
    • [초안] Spring Kafka 컨슈머 오프셋 커밋과 트랜잭션 정렬: AckMode, manual ack, 멱등 처리
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • network 페이지로 이동
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • python 페이지로 이동
    • Python async/await — CompletableFuture·Reactor 와 다른 점, 그리고 blocking I/O 함정
    • Python 의존성 관리 — Java Maven/Gradle 사용자가 만나는 첫 충격
    • FastAPI 기초 — Spring Boot 사용자가 빠르게 익히는 법
    • GPU·CUDA·MPS 기초 — 자바 백엔드 개발자가 처음 만나는 그림
    • Multi-process GPU 워크로드 — 자바 ThreadPool 사용자가 만나는 모델 차이
    • Java 개발자를 위한 Python 심화 — OOP·데코레이터·컨텍스트 매니저
    • PyTorch 기초 — 텐서, 디바이스, 그리고 모델 로딩이 무거운 이유
    • Java 개발자를 위한 Python 문법 핵심
    • ML 서비스 성능 분석 워크플로 — 자바 백엔드 트러블슈팅과 다른 점
    • OCR 동작 원리 — Layout · Text · Post-process 3단계
    • Python 서버의 RSS 가 안 줄어드는 이유 — gc.collect 의 한계와 malloc_trim
  • rabbitmq 페이지로 이동
    • [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
    • [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
  • security 페이지로 이동
    • [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
    • [초안] Spring Security 6.x OAuth2 + JWT 상용 인증 설계 — Grant 선택, Resource Server, Refresh Rotation, 로그아웃
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • sb-dev-team 페이지로 이동
    • the-future-company 페이지로 이동
  • testing 페이지로 이동
    • [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
  • travel 페이지로 이동
    • 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
  • web 페이지로 이동
    • [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점
FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr
Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors
01site
  • Home↗
  • Posts↗
  • Categories↗
  • About↗
02policy
  • 소개/about
  • 개인정보처리방침/privacy
  • 연락처/contact
03categories
  • AI↗
  • Algorithm↗
  • DB↗
  • DevOps↗
  • Java/Spring↗
  • JS/TS↗
  • React↗
  • Next.js↗
  • System↗
04connect
  • GitHub@jon890↗
  • Source repositoryjon890/fos-study↗
  • RSS feed/rss.xml↗
  • Newsletter매주 1 회 · 한 편의 글→
© 2026 FOS Study. All posts MIT-licensed.
built with·Next.js·Tailwind v4·Geist·Pretendard·oklch
fos-blog/java/[초안] Spring 스케줄러 다중 인스턴스…
java

[초안] Spring 스케줄러 다중 인스턴스 안전성 — @Scheduled가 N번 도는 문제와 해결

> 학습 목표: 단일 서버에서 잘 돌던 @Scheduled 작업이 인스턴스를 2대 이상으로 늘리는 순간 왜 중복 실행되는지 이해하고, ShedLock·분산 락·리더 선출·외부 스케줄러 같은 선택지를 trade-off와 함께 고를 수 있게 한다. > > 한 줄 결론: @Scheduled는 JVM 하나 안에서만 동작하므로 인스턴스 간 조율 장치가 전혀 없다....

2026.06.16·7 min read·0 views

학습 목표: 단일 서버에서 잘 돌던 @Scheduled 작업이 인스턴스를 2대 이상으로 늘리는 순간 왜 중복 실행되는지 이해하고, ShedLock·분산 락·리더 선출·외부 스케줄러 같은 선택지를 trade-off와 함께 고를 수 있게 한다.

한 줄 결론: @Scheduled는 JVM 하나 안에서만 동작하므로 인스턴스 간 조율 장치가 전혀 없다. 같은 잡을 한 번만 돌리려면 외부 저장소 기반의 잠금(또는 단 하나의 실행 주체)을 별도로 붙여야 한다.

관련 문서: Redis 분산 락, Spring Batch vs Event-Driven


왜 중요한가

처음 서비스를 띄울 때는 인스턴스가 한 대다. 매일 새벽 정산을 돌리는 @Scheduled, 만료 쿠폰을 정리하는 배치, 외부 API로 상태를 동기화하는 폴링 작업이 모두 그 한 대에서 한 번씩 돈다. 문제가 없다.

트래픽이 늘어 인스턴스를 3대로 스케일 아웃하는 순간 조용히 망가진다. 같은 코드가 3대에 똑같이 배포되므로, 새벽 정산이 3번 실행되고, 결제 알림 메일이 3통 나가고, 외부 API 호출이 3배가 된다. 컴파일 에러도, 런타임 예외도 없이 "그냥 결과가 이상한" 형태로 드러나기 때문에 운영에서 가장 늦게 발견되는 부류의 버그다.

핵심은 @Scheduled가 분산 환경을 전혀 모른다는 사실이다. 이 문서는 그 한계를 이해하고, 중복 실행을 막는 표준 패턴들을 정리한다.


@Scheduled는 어떻게 동작하는가

Spring의 @Scheduled는 ScheduledAnnotationBeanPostProcessor가 빈을 스캔해서, cron/fixedDelay/fixedRate 메타데이터를 읽고 TaskScheduler(기본 구현은 ThreadPoolTaskScheduler)에 등록하는 구조다.

java
@Component
public class SettlementJob {
 
    @Scheduled(cron = "0 0 3 * * *") // 매일 새벽 3시
    public void runDailySettlement() {
        // 정산 로직
    }
}

여기서 중요한 사실 두 가지:

  • 스케줄러는 그 JVM 프로세스 내부에만 존재한다. ThreadPoolTaskScheduler는 로컬 스레드 풀일 뿐, 다른 인스턴스의 스케줄러와 통신하지 않는다.
  • 각 인스턴스는 자기 시계로 cron 시각을 판단한다. 인스턴스 A도 새벽 3시에 깨고, 인스턴스 B도 새벽 3시에 깬다. 둘은 서로의 존재를 모른다.

즉 N개 인스턴스 = N개의 독립된 스케줄러 = 같은 잡이 N번 실행. 이것은 버그가 아니라 @Scheduled의 설계 그대로의 동작이다.


흔한 오해

오해 1: "fixedRate면 한 군데서만 돌겠지"

fixedRate/fixedDelay/cron 모두 로컬 트리거 방식이다. 트리거 방식만 다를 뿐, 어느 것도 인스턴스 간 조율을 하지 않는다. 셋 다 똑같이 중복 실행된다.

오해 2: "DB 트랜잭션이 막아주지 않나"

트랜잭션은 같은 행을 동시에 수정할 때의 격리를 보장할 뿐, "이 잡을 한 번만 실행"을 보장하지 않는다. 3개 인스턴스가 각자 트랜잭션을 열고 각자 정산 행을 INSERT하면, 트랜잭션은 모두 정상 커밋되고 중복 데이터가 3건 남는다.

오해 3: "락만 걸면 멱등성은 신경 안 써도 된다"

락은 동시 실행을 줄여줄 뿐 완벽한 단일 실행을 보장하지 못한다. 락 만료(TTL)가 잡 실행 시간보다 짧거나, 시계 차이(clock skew)가 있거나, GC 멈춤으로 락을 늦게 해제하면 두 인스턴스가 겹칠 수 있다. 락은 1차 방어선이고, 잡 로직 자체의 멱등성이 최종 안전망이다.


해결 패턴

패턴 1: ShedLock — 가장 표준적인 선택

ShedLock은 "스케줄 잡 한정 분산 락" 라이브러리다. 범용 분산 락이 아니라 스케줄 중복 실행 방지라는 단일 목적에 최적화돼 있다.

java
@Scheduled(cron = "0 0 3 * * *")
@SchedulerLock(
    name = "dailySettlement",
    lockAtMostFor = "10m",  // 잡이 죽어도 최대 10분 뒤 락 강제 해제
    lockAtLeastFor = "1m"   // 최소 1분은 락 유지 (빠른 재획득/시계차 방어)
)
public void runDailySettlement() {
    LockAssert.assertLocked(); // 락 없이 호출되면 예외
    // 정산 로직
}

동작 원리:

  • 잡이 트리거되면 ShedLock이 먼저 공유 저장소(JDBC/Redis/Mongo/ZooKeeper 등)에 락 행을 INSERT 또는 조건부 UPDATE로 잡으려 한다.
  • 성공한 인스턴스만 잡을 실행한다. 나머지는 락 획득 실패로 조용히 스킵한다.
  • 저장소가 단일 진실의 원천이 되어 인스턴스 간 조율을 대신한다.

JDBC 락 저장소 예시 스키마:

sql
CREATE TABLE shedlock (
    name       VARCHAR(64)  NOT NULL,
    lock_until TIMESTAMP(3) NOT NULL,
    locked_at  TIMESTAMP(3) NOT NULL,
    locked_by  VARCHAR(255) NOT NULL,
    PRIMARY KEY (name)
);

name이 PK라는 점이 핵심이다. 같은 잡 이름으로 두 인스턴스가 동시에 INSERT를 시도하면 PK 제약으로 하나만 성공한다. 데이터베이스의 원자성에 조율을 위임하는 셈이다.

lockAtMostFor vs lockAtLeastFor

이 둘을 헷갈리면 운영 사고가 난다.

  • lockAtMostFor(상한): 잡을 실행한 인스턴스가 락을 해제하지 못하고 죽었을 때를 대비한 안전장치. 이 시간이 지나면 락이 자동 해제돼 다음 실행이 가능해진다. 반드시 잡의 정상 최대 실행 시간보다 넉넉하게 잡는다. 너무 짧으면 긴 잡이 끝나기 전에 락이 풀려 다른 인스턴스가 끼어든다.
  • lockAtLeastFor(하한): 잡이 매우 빨리 끝나도 최소 이 시간만큼은 락을 유지한다. 잡이 0.1초 만에 끝나는데 인스턴스 간 시계가 약간 다르면, 락이 즉시 풀리면서 다른 인스턴스가 같은 cron 시각에 또 잡을 수 있다. 이를 막는다.

패턴 2: 범용 분산 락 직접 사용 (Redis)

이미 Redis 분산 락 인프라가 있다면 ShedLock 없이 직접 잠글 수도 있다. 상세 구현은 Redis 분산 락 문서를 참고한다.

java
@Scheduled(cron = "0 0 3 * * *")
public void runDailySettlement() {
    String lockKey = "lock:job:dailySettlement";
    // SET key value NX EX 600 — 원자적 획득 + TTL
    boolean acquired = redis.opsForValue()
        .setIfAbsent(lockKey, instanceId, Duration.ofMinutes(10));
    if (!Boolean.TRUE.equals(acquired)) {
        return; // 다른 인스턴스가 이미 실행 중
    }
    try {
        // 정산 로직
    } finally {
        // 본인이 건 락만 해제 (Lua로 owner 확인 후 DEL)
        releaseIfOwner(lockKey, instanceId);
    }
}

ShedLock 대비 차이: 직접 구현은 유연하지만 락 만료·소유권 확인·fencing token 같은 디테일을 스스로 책임져야 한다. 스케줄 중복 방지만이 목적이라면 ShedLock이 보일러플레이트를 줄여준다.

패턴 3: 리더 선출 (Leader Election)

"모든 인스턴스가 잡을 경합"하는 대신, 클러스터에서 리더 하나만 스케줄 잡을 돌린다는 접근이다.

  • Kubernetes Lease 오브젝트 기반 리더 선출
  • Spring Integration LeaderInitiator (ZooKeeper/Hazelcast/etcd 등)
  • 리더만 @Scheduled 잡을 활성화하고, 리더가 죽으면 다른 인스턴스가 리더를 이어받는다.

락 방식과의 차이: 락은 "매 실행마다 경합"이고, 리더 선출은 "한 번 리더를 정해두고 그 인스턴스가 계속 실행"이다. 잡이 많고 자주 도는 환경에서는 매번 락을 잡는 비용을 줄일 수 있다.

패턴 4: 외부 스케줄러 / 전용 인스턴스

조율 자체를 애플리케이션 밖으로 빼는 방법.

  • Kubernetes CronJob: cron 시각에 단발성 Pod를 하나만 띄워 잡을 실행. 인스턴스 수와 무관하게 항상 1회.
  • 전용 스케줄러 인스턴스: 배포 프로파일로 한 대만 scheduler 역할을 켜고 나머지는 끈다 (@Profile("scheduler")). 단순하지만 그 한 대가 죽으면 잡이 멈추는 단일 장애점이 된다.
  • Quartz 클러스터 모드: JDBC JobStore를 공유해 Quartz가 자체적으로 클러스터 잡 분배를 처리. 트리거/잡 상태를 DB에 저장한다.

설계·운영 체크포인트

  • 멱등성을 포기하지 않는다. 락은 중복 실행 확률을 크게 낮추지만 0으로 만들지는 못한다. 잡 결과가 "여러 번 실행돼도 안전"하도록 설계한다. 예: INSERT 대신 UPSERT, 처리 여부 플래그 확인 후 진행.
  • lockAtMostFor는 잡의 최악 실행 시간보다 길게. 잡이 평소 2분이라도 외부 API 지연으로 8분 걸릴 수 있으면 상한을 10분 이상으로 둔다.
  • 시계 동기화(NTP)를 확인한다. 분산 락의 TTL과 cron 트리거 모두 각 노드의 시계에 의존한다. 노드 간 시계가 수 초씩 벌어지면 lockAtLeastFor로 방어하더라도 경계 사례가 생긴다.
  • graceful shutdown과 잡 중단. 배포·스케일 인으로 인스턴스가 내려갈 때 실행 중이던 잡이 중간에 끊기면 락은 lockAtMostFor 이후에야 풀린다. 그동안 잡이 재실행되지 못할 수 있으니 상한 시간과 배포 주기를 함께 고려한다.
  • 관측 가능성. 어느 인스턴스가 잡을 실제로 실행했는지, 락 획득에 실패한 인스턴스가 몇이었는지 로그·메트릭으로 남긴다. 중복 실행 사고는 "한 번만 돌았는지"를 사후에 증명할 수 있어야 빨리 잡힌다.
  • 락 저장소의 가용성이 새 의존성이 된다. ShedLock JDBC를 쓰면 그 DB가, Redis 락을 쓰면 Redis가 스케줄 실행의 단일 의존점이 된다. 저장소 장애 시 잡이 아예 안 도는 것과 중복 실행 중 무엇이 더 위험한지 잡별로 판단한다.

패턴 선택 가이드

상황권장 패턴
일반적인 Spring @Scheduled 중복 방지ShedLock (JDBC 또는 Redis 락 저장소)
이미 Redis 분산 락 인프라 보유직접 락 또는 ShedLock Redis provider
잡이 많고 자주 돌아 매번 락 경합이 부담리더 선출
애플리케이션과 무관하게 1회 실행 보장Kubernetes CronJob 등 외부 스케줄러
복잡한 잡 스케줄·재시도·이력 관리 필요Quartz 클러스터 모드

대부분의 백엔드 서비스에서 첫 선택은 ShedLock이다. 추가 인프라 없이 기존 DB만으로 시작할 수 있고, 목적이 "스케줄 중복 방지" 하나로 명확하기 때문이다.


점검 질문

  1. 인스턴스 3대 환경에서 @Scheduled(cron=...) 잡은 몇 번 실행되는가? 왜 그런가?
  2. ShedLock의 lockAtMostFor와 lockAtLeastFor는 각각 어떤 장애 시나리오를 막기 위한 값인가?
  3. 분산 락을 걸었는데도 잡이 두 번 실행될 수 있는 경우를 두 가지 이상 설명해 보라. (락 TTL, 시계 차이, GC 멈춤 등)
  4. 락을 걸었으니 멱등성은 신경 쓰지 않아도 된다 — 이 주장의 문제점은?
  5. 리더 선출 방식과 매 실행 락 경합 방식의 trade-off는 무엇인가?
  6. Kubernetes CronJob으로 잡을 빼면 애플리케이션 내부 @Scheduled 대비 무엇을 얻고 무엇을 잃는가?

실습 아이디어

  • 로컬에서 같은 Spring Boot 앱을 포트만 바꿔 2개 띄우고, @Scheduled(fixedRate=5000) 잡에 인스턴스 ID와 실행 시각을 로그로 찍어 중복 실행을 눈으로 확인한다.
  • 같은 앱에 ShedLock JDBC를 붙이고 shedlock 테이블의 locked_by를 관찰하며, 매 실행마다 어느 인스턴스가 락을 잡는지 추적한다.
  • lockAtMostFor를 잡 실행 시간보다 짧게 일부러 설정해 두 인스턴스가 겹쳐 실행되는 상황을 재현하고, 값을 늘려 해소되는지 확인한다.
on this page
  • 01왜 중요한가
  • 02@Scheduled는 어떻게 동작하는가
  • 03흔한 오해
  • 오해 1: "fixedRate면 한 군데서만 돌겠지"
  • 오해 2: "DB 트랜잭션이 막아주지 않나"
  • 오해 3: "락만 걸면 멱등성은 신경 안 써도 된다"
  • 04해결 패턴
  • 패턴 1: ShedLock — 가장 표준적인 선택
  • 패턴 2: 범용 분산 락 직접 사용 (Redis)
  • 패턴 3: 리더 선출 (Leader Election)
  • 패턴 4: 외부 스케줄러 / 전용 인스턴스
  • 05설계·운영 체크포인트
  • 06패턴 선택 가이드
  • 07점검 질문
  • 08실습 아이디어

이런 글도

  • [초안] Java 동시성 락 정리 — 커머스 메뉴/프로모션 정책 캐시 갱신 관점
    커머스 백엔드에서 메뉴, 프로모션, 매장 운영 정책 같은 "거의 안 바뀌지만 모든 요청이 읽는" 데이터는 거의 예외 없이 메모리 캐시로 들어간다. 트래픽이 큰 시간대에 이 캐시를 어떻게 갱신할지가 곧 시스템의 안정성을 결정한다. 갱신 순간에 락을 잘못 잡으면 모든 조회 스레드가 멈추고, 락을 너무 느슨하게 풀면 절반은 옛 데이터, 절반은 새 데이터를 보는...
    ☕ java
    java
    2026.05.08
  • [초안] Spring 트랜잭션 전파, 커머스 주문/결제에서 실전으로 이해하기
    CJ푸드빌처럼 매장/배달/예약/결제가 한 트랜잭션 흐름에서 함께 움직이는 커머스 도메인에서는 "이 메서드 하나가 어떤 트랜잭션 안에서 도는가"가 곧 데이터 정합성의 경계가 된다. 주문 저장은 성공했는데 결제 호출은 실패했다, 또는 결제는 통과했는데 알림 발송이 트랜잭션을 같이 끌고 들어가서 전체 롤백되어 사용자 입장에서 "결제는 됐는데 주문은 없는" 상태가...
    ☕ java
    java
    2026.05.07
  • [초안] Filter, Interceptor, AOP: Spring 요청 처리 파이프라인에서의 관심사 분리
    Spring 기반 백엔드에서 "요청이 들어와서 컨트롤러에 도달하기 전까지 뭔가 하고 싶다"는 요구는 끊임없이 생긴다. 로깅, 인증, 요청 ID 주입, 요청/응답 바디 감사(audit), 성능 측정, 예외 변환, 트랜잭션 경계 제어, 특정 어노테이션이 붙은 메서드에만 권한 체크 적용 — 이 모든 게 사실상 같은 질문의 변주다. "이 횡단 관심사를 어느 계층에...
    ☕ java
    java
    2026.04.21
  • [초안] StampedLock vs ReentrantReadWriteLock: 백엔드 동시성 제어의 실전 선택
    백엔드 서비스에서 동시성 제어는 성능과 정확성을 동시에 결정하는 핵심 축이다. 읽기와 쓰기가 섞이는 상황 — 예를 들어 인메모리 캐시, 설정 스냅샷, 메타데이터 테이블, 통계 집계 버퍼 — 에서 적절한 락 선택은 처리량을 수 배에서 수십 배까지 바꿀 수 있다. synchronized와 ReentrantLock은 직관적이지만 읽기 비중이 압도적인 워크로드에서...
    ☕ java
    java
    2026.04.21

댓글 (0)