fos-blog/study
01 / 홈02 / 카테고리
01 / 홈02 / 카테고리

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • langgraph 페이지로 이동
    • agents.md
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식
    • Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
    • Claude Code 멀티 에이전트 — Teams
    • AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design
    • 하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기
    • 하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
    • 멀티모달 LLM (Multimodal Large Language Model)
    • AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
  • ai 페이지로 이동
    • agent 페이지로 이동
  • algorithm 페이지로 이동
    • live-coding 페이지로 이동
    • 분산 계산을 위한 알고리즘
  • architecture 페이지로 이동
    • [초안] 시니어 백엔드를 위한 API 설계 실전 스터디 팩 — REST · 멱등성 · 페이지네이션 · 버전 전략
    • [초안] API Versioning과 Backward Compatibility: 시니어 백엔드 관점 정리
    • 캐시 설계 전략 총정리
    • [초안] CJ푸드빌 커머스/F&B 도메인 설계 면접 대비 — 슬롯 경험을 주문·결제·쿠폰·매장 상태 설계로 번역하기
    • [초안] 커머스 Spring 서비스에 Clean/Hexagonal Architecture를 실용적으로 적용하기
    • [초안] 커머스 주문 상태와 데이터 정합성 기본기 — CJ푸드빌 면접 대비
    • [초안] 쿠폰/프로모션 동시성과 정합성 기본기 — 선착순·중복 사용 방지·발급/사용/복구
    • [초안] DDD와 도메인 모델링: 시니어 백엔드 관점의 전술/전략 패턴 실전 가이드
    • [초안] Decorator & Chain of Responsibility — 행동을 체인으로 조립하는 두 가지 방식
    • 디자인 패턴
    • [초안] 분산 아키텍처 완전 정복: Java 백엔드 시니어 인터뷰 대비 실전 가이드
    • [초안] 분산 트랜잭션과 Outbox 패턴 — 왜 2PC를 피하고 어떻게 대신할 것인가
    • 분산 트랜잭션
    • [초안] e-Commerce 주문·결제 도메인 모델링: 상태머신, 멱등성, Outbox/Saga 실전 정리
    • [초안] F&B 쿠폰·프로모션·멤버십·포인트 설계
    • [초안] F&B · e-Commerce 디지털 채널 도메인 한 장 정리 — CJ푸드빌 디지털 채널 백엔드 면접 대비
    • [초안] F&B 주문/매장/픽업 상태머신 설계 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] F&B 이커머스 결제·환불·정산 운영 가이드
    • [초안] Hexagonal / Clean Architecture를 Spring 백엔드에 적용하기
    • [초안] 대규모 커머스 트래픽 처리 패턴 — 1,600만 고객과 올영세일을 버티는 설계
    • [초안] 레거시 JSP/jQuery 화면과 신규 API가 공존하는 백엔드 운영 전략
    • [초안] MSA 서비스 간 통신: Redis [Cache-Aside](../database/redis/cache-aside.md) × Kafka 이벤트 하이브리드 설계
    • [초안] Observability 입문: 시니어 백엔드가 장애를 탐지하고 대응하는 방식
    • [초안] Outbox / Inbox Pattern 심화 — 분산 메시징의 정합성 문제를 DB 트랜잭션으로 풀어내기
    • [초안] 결제 도메인 멱등성과 트랜잭션 재시도 기본기
    • [초안] 시니어 백엔드를 위한 Resilience 패턴 실전 가이드 — Timeout, Retry, Circuit Breaker, Bulkhead, Backpressure
    • [초안] REST API 버저닝과 모바일 앱 하위 호환성 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] Strategy Pattern — 분기문을 없애는 설계, 시니어 백엔드 인터뷰 핵심 패턴
    • [초안] 시니어 백엔드를 위한 시스템 설계 입문 스터디 팩
    • [초안] 템플릿 메서드 패턴 - 백엔드 처리 골격을 강제하는 가장 오래되고 가장 위험한 패턴
    • [초안] 대규모 트래픽 중 무중단 마이그레이션 — Feature Flag + Shadow Mode 실전
  • database 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • 커넥션 풀 크기는 얼마나 조정해야 할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • [초안] JPA N+1과 커머스 조회 모델: 주문/메뉴/쿠폰 도메인에서 살아남기
    • [초안] MyBatis 기본기 — XML Mapper, resultMap, 동적 SQL, 운영 패턴 정리
    • [초안] MyBatis와 JPA/Hibernate 트레이드오프 — 레거시 백엔드를 다루는 시니어 관점
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • observability 페이지로 이동
    • [초안] 커머스/F&B 채널 장애 첫 5분과 관측성 기본기
    • Envoy Proxy
    • [초안] F&B / e-Commerce 운영 장애 대응과 모니터링 — 백엔드 관점 정리
    • Graceful Shutdown
  • finance 페이지로 이동
    • industry-cycle 페이지로 이동
    • investing 페이지로 이동
    • stock-notes 페이지로 이동
  • http 페이지로 이동
    • HTTP Connection Pool
  • interview 페이지로 이동
    • [초안] AI 서비스 팀 경험 기반 시니어 백엔드 면접 질문 뱅크 — Spring Batch RAG / gRPC graceful shutdown / 전략 패턴 / 12일 AI 웹툰 MVP
    • [초안] CJ푸드빌 디지털 채널 Back-end 개발자 직무 분석
    • [초안] CJ푸드빌 디지털 채널 Back-end 면접 답변집 — 슬롯 도메인 경험을 커머스/F&B 설계로 번역하기
    • [초안] F&B / e-Commerce 운영 모니터링과 장애 대응 인터뷰 정리
    • Observability — 면접 답변 프레임
    • [초안] 시니어 Java 백엔드 면접 마스터 플레이북 — 김병태
    • [초안] NSC 슬롯팀 경험 기반 질문 은행 — 도메인 모델링·동시성·성능·AI 협업
  • java 페이지로 이동
    • concurrency 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • [초안] Java 동시성 락 정리 — 커머스 메뉴/프로모션 정책 캐시 갱신 관점
    • [초안] JVM 튜닝 실전: 메모리 구조부터 Virtual Threads, GC 튜닝, 프로파일링까지
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node 백엔드 운영 패턴 — Streams 백프레셔, pipe/pipeline, 멱등성 vs 분산 락
    • Node.js
    • npm vs pnpm — 어떤 기준으로 선택했나
    • `setImmediate()`
  • kafka 페이지로 이동
    • [초안] Kafka 기본 개념 — 토픽, 파티션, 오프셋, 복제
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • [초안] Kafka 실전 설계: 파티션 전략, 컨슈머 그룹, 전달 보장, 재시도, 순서 보장 트레이드오프
    • 메시지 전송 신뢰성
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • network 페이지로 이동
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • rabbitmq 페이지로 이동
    • [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
    • [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
  • security 페이지로 이동
    • [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • sb-dev-team 페이지로 이동
    • the-future-company 페이지로 이동
  • testing 페이지로 이동
    • [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
  • travel 페이지로 이동
    • 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
  • web 페이지로 이동
    • [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점
FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr
Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors
01site
  • Home↗
  • Posts↗
  • Categories↗
  • About↗
02policy
  • 소개/about
  • 개인정보처리방침/privacy
  • 연락처/contact
03categories
  • AI↗
  • Algorithm↗
  • DB↗
  • DevOps↗
  • Java/Spring↗
  • JS/TS↗
  • React↗
  • Next.js↗
  • System↗
04connect
  • GitHub@jon890↗
  • Source repositoryjon890/fos-study↗
  • RSS feed/rss.xml↗
  • Newsletter매주 1 회 · 한 편의 글→
© 2026 FOS Study. All posts MIT-licensed.
built with·Next.js·Tailwind v4·Geist·Pretendard·oklch
fos-blog/architecture/분산 트랜잭션
system

분산 트랜잭션

분산 트랜잭션은 두 개 이상의 네트워크로 연결된 시스템(데이터베이스, 메시지 큐 등)에 걸쳐 있는 트랜잭션을 의미한다. 핵심은 원자성을 보장하는 것이다. 즉, 모든 서비스의 작업이 성공하거나, 하나라도 실패하면 모두 이전 상태로 되돌려야 한다. - 가장 전통적인 방법으로, 트랜잭션 조정자(Coordinator)가 모든 참여 서비스에 '준비'를 시키고, 모두...

2026.01.30·3 min read·320 views

분산 트랜잭션은 두 개 이상의 네트워크로 연결된 시스템(데이터베이스, 메시지 큐 등)에 걸쳐 있는 트랜잭션을 의미한다.
핵심은 원자성을 보장하는 것이다. 즉, 모든 서비스의 작업이 성공하거나, 하나라도 실패하면 모두 이전 상태로 되돌려야 한다.

MSA에서 분산 트랜잭션을 달성하는 방법론

2PC (Two-Phase Commit)

  • 가장 전통적인 방법으로, 트랜잭션 조정자(Coordinator)가 모든 참여 서비스에 '준비'를 시키고, 모두 OK 사인을 보내면 '커밋'을 수행한다.
    • 장점 : 강력한 일관성을 보장한다.
    • 단점 : 모든 노드가 응답할 떄까지 리소스를 점유하므로 성능 저하가 심하고, 장애 시 단일 실패 지점이 될 수 있어 현대적인 MSA에서는 잘 사용하지 않는다.

Saga 패턴 (가장 권장되는 방식)

  • 각 서비스의 로컬 트랜잭션을 순차적으로 실행하며, 실패 시 이전에 성공한 작업들을 취소하는 보상 트랜잭션(Compensating Transaction)을 실행하는 방식이다.
    • Choreography 기반 : 중앙 제어자 없이 각 서비스가 이벤트를 주고받으며 다음 단계를 진행한다.
      • 간단한 구조에 유리
    • Orchestration 기반 : 별도의 오케스트레이터가 전체 흐름을 제어한한다.
      • 복잡한 비즈니스 로직 관리에 유리ㅌ

TCC (Try-Confirm-Cancel)

  • Saga와 비슷하지만, 비즈니스 로직을 '시도-확정-취소'의 3단계로 명확히 나눈다.
    • Try : 자원을 가선점 (예: 포인트 차감 전 예약 상태로 변경)
    • Confim : 모든 서비스의 Try가 성공하면 확정
    • Cancel : 하나라도 실패하면 가선점된 자원을 해제

예시 : 유저 서버 <-> 슬롯 서버 트랜잭션 관리 전략

추천 전략 : Saga 패턴 (Orchestration 방식)

  • 유저의 돈이 걸린 문제이므로 최종 일관성(Eventual Consistency)를 유지하는 Saga 패턴이 가장 적합하다.
  1. 유저 서버 (시작) ; 유저의 보유 금액을 차감(또는 점유)하고 BettingStarted 이벤트를 발행한다.
  2. 슬롯 서버 : 이벤트를 수신해 게임 로직을 처리한 뒤, GameResultCalculated 이벤트를 발행한다.
  3. 유저 서버 (마무리) : 게임 결과에 따라 당첨금을 지급하거나 차감 상태를 확정한다.
  4. 에러 처리 (보상) : 슬롯 서버에서 오류가 발생하면 유저 서버로 BettingFaild 이벤트를 보내 차감했던 금액을 다시 복구(보상 트랜잭션)한다.

Tip: Kafka나 RabbitMQ와 같은 메시지 브로커를 활용하고, Transactional Outbox 패턴을 적용해 "DB 업데이트와 메시지 발행"이 원자적으로 일어나도록 설계하는 것이 정석이다.

우리가 했던 방식 - 동기식 요청 기반의 의사 분산 트랜잭션

  • 슬롯 서버에서 스핀 요청을 받아, 유저 정보를 유저 서버를 통해 조회
  • 그리고 유저의 보유 금액이 충분하다면 스핀 로직을 수행하고, 결과를 바탕으로 다시 유저 서버에 베팅 완료 요청을 보냄
  • 유저 서버에서 에러를 전달한다면 슬롯 서버에서도 롤백처리

분산 시스템의 핵심인 결합도 분리와 장애 전파 차단관점에서 위험 요소를 안고 있다.

1. 데이터 저합성의 불일치 (가장 큰 문제)

  • 가장 위험한 시나리오는 네트워크 타임아웃
    • 상황 : 슬롯 서버가 유저 서버에 betting 요청을 보냈는데, 유저 서버는 처리를 완료했지만 네트워크 이슈로 응답만 슬롯 서버에 전달되지 못한 경우
    • 결과 : 유저 서버는 베팅을 완료로 처리함
      • 슬롯 서버 : 응답을 못 받았으므로 에러로 판단하여 자신의 트랜잭션을 롤백
      • 현상 : 유저는 돈만 날리고 게임 결과는 기록되지 않는 대형 사고 발생

2. 가용성 저하 (장애 전파)

  • 두 서버가 동기(Synchronous) HTTP 호출로 묶여 있기 때문에 런타임 의존성이 매우 강하다
    • 유저 서버가 점검 중이거나 장애가 나면 슬롯 서버의 핵심 기능잉ㄴ '스핀' 자체가 불가능해진다.
    • 유저 서버의 응답이 지연 되면 슬롯 서버의 워커 스레드들이 응답을 기다리며 점유되어, 슬롯 서버까지 함께 느려지는 계단식 장애가 발생한다.

3. 성능 병목

  • 유저가 스핀을 한 번 할 때마다 유저 조회(GET) + 베팅 처리(POST)라는 최소 두 번의 네트워크 왕복이 발생한다
    • 단일 DB 트랜잭션에 비해 응답 속도가 현저히 느려지며, 동시 접속자가 몰릴 경우 네트워크 I/O 비용이 서비스의 전체 처리량을 깎아 먹게된다.

1차적으로 우리가 방어한 것 : Resilience4j를 통해 장애 전파 차단, 멱등성 처리


관련 문서

  • 분산 트랜잭션과 Outbox 패턴 — 2PC를 피하고 대신 쓸 방법
  • Resilience 패턴 — Timeout, Retry, Circuit Breaker, Bulkhead 상세
  • MSA 서비스 간 통신 — Cache-Aside × Kafka 이벤트 하이브리드
on this page
  • 01MSA에서 분산 트랜잭션을 달성하는 방법론
  • 2PC (Two-Phase Commit)
  • Saga 패턴 (가장 권장되는 방식)
  • TCC (Try-Confirm-Cancel)
  • 02예시 : 유저 서버 <-> 슬롯 서버 트랜잭션 관리 전략
  • 추천 전략 : Saga 패턴 (Orchestration 방식)
  • 03우리가 했던 방식 - 동기식 요청 기반의 의사 분산 트랜잭션
  • 1. 데이터 저합성의 불일치 (가장 큰 문제)
  • 2. 가용성 저하 (장애 전파)
  • 3. 성능 병목
  • 041차적으로 우리가 방어한 것 : Resilience4j를 통해 장애 전파 차단, 멱등성 처리
  • 05관련 문서

댓글 (0)