fos-blog/study
01 / 홈02 / 카테고리
01 / 홈02 / 카테고리

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • langgraph 페이지로 이동
    • agents.md
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식
    • Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
    • Claude Code 멀티 에이전트 — Teams
    • AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design
    • 하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기
    • 하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
    • 멀티모달 LLM (Multimodal Large Language Model)
    • AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
  • ai 페이지로 이동
    • agent 페이지로 이동
  • algorithm 페이지로 이동
    • live-coding 페이지로 이동
    • 분산 계산을 위한 알고리즘
  • architecture 페이지로 이동
    • [초안] 시니어 백엔드를 위한 API 설계 실전 스터디 팩 — REST · 멱등성 · 페이지네이션 · 버전 전략
    • [초안] API Versioning과 Backward Compatibility: 시니어 백엔드 관점 정리
    • 캐시 설계 전략 총정리
    • [초안] CJ푸드빌 커머스/F&B 도메인 설계 면접 대비 — 슬롯 경험을 주문·결제·쿠폰·매장 상태 설계로 번역하기
    • [초안] 커머스 Spring 서비스에 Clean/Hexagonal Architecture를 실용적으로 적용하기
    • [초안] 커머스 주문 상태와 데이터 정합성 기본기 — CJ푸드빌 면접 대비
    • [초안] 쿠폰/프로모션 동시성과 정합성 기본기 — 선착순·중복 사용 방지·발급/사용/복구
    • [초안] DDD와 도메인 모델링: 시니어 백엔드 관점의 전술/전략 패턴 실전 가이드
    • [초안] Decorator & Chain of Responsibility — 행동을 체인으로 조립하는 두 가지 방식
    • 디자인 패턴
    • [초안] 분산 아키텍처 완전 정복: Java 백엔드 시니어 인터뷰 대비 실전 가이드
    • [초안] 분산 트랜잭션과 Outbox 패턴 — 왜 2PC를 피하고 어떻게 대신할 것인가
    • 분산 트랜잭션
    • [초안] e-Commerce 주문·결제 도메인 모델링: 상태머신, 멱등성, Outbox/Saga 실전 정리
    • [초안] F&B 쿠폰·프로모션·멤버십·포인트 설계
    • [초안] F&B · e-Commerce 디지털 채널 도메인 한 장 정리 — CJ푸드빌 디지털 채널 백엔드 면접 대비
    • [초안] F&B 주문/매장/픽업 상태머신 설계 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] F&B 이커머스 결제·환불·정산 운영 가이드
    • [초안] Hexagonal / Clean Architecture를 Spring 백엔드에 적용하기
    • [초안] 대규모 커머스 트래픽 처리 패턴 — 1,600만 고객과 올영세일을 버티는 설계
    • [초안] 레거시 JSP/jQuery 화면과 신규 API가 공존하는 백엔드 운영 전략
    • [초안] MSA 서비스 간 통신: Redis [Cache-Aside](../database/redis/cache-aside.md) × Kafka 이벤트 하이브리드 설계
    • [초안] Observability 입문: 시니어 백엔드가 장애를 탐지하고 대응하는 방식
    • [초안] Outbox / Inbox Pattern 심화 — 분산 메시징의 정합성 문제를 DB 트랜잭션으로 풀어내기
    • [초안] 결제 도메인 멱등성과 트랜잭션 재시도 기본기
    • [초안] 시니어 백엔드를 위한 Resilience 패턴 실전 가이드 — Timeout, Retry, Circuit Breaker, Bulkhead, Backpressure
    • [초안] REST API 버저닝과 모바일 앱 하위 호환성 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] Strategy Pattern — 분기문을 없애는 설계, 시니어 백엔드 인터뷰 핵심 패턴
    • [초안] 시니어 백엔드를 위한 시스템 설계 입문 스터디 팩
    • [초안] 템플릿 메서드 패턴 - 백엔드 처리 골격을 강제하는 가장 오래되고 가장 위험한 패턴
    • [초안] 대규모 트래픽 중 무중단 마이그레이션 — Feature Flag + Shadow Mode 실전
  • database 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • 커넥션 풀 크기는 얼마나 조정해야 할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • [초안] JPA N+1과 커머스 조회 모델: 주문/메뉴/쿠폰 도메인에서 살아남기
    • [초안] MyBatis 기본기 — XML Mapper, resultMap, 동적 SQL, 운영 패턴 정리
    • [초안] MyBatis와 JPA/Hibernate 트레이드오프 — 레거시 백엔드를 다루는 시니어 관점
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • observability 페이지로 이동
    • [초안] 커머스/F&B 채널 장애 첫 5분과 관측성 기본기
    • Envoy Proxy
    • [초안] F&B / e-Commerce 운영 장애 대응과 모니터링 — 백엔드 관점 정리
    • Graceful Shutdown
  • finance 페이지로 이동
    • industry-cycle 페이지로 이동
    • investing 페이지로 이동
    • stock-notes 페이지로 이동
  • http 페이지로 이동
    • HTTP Connection Pool
  • interview 페이지로 이동
    • [초안] AI 서비스 팀 경험 기반 시니어 백엔드 면접 질문 뱅크 — Spring Batch RAG / gRPC graceful shutdown / 전략 패턴 / 12일 AI 웹툰 MVP
    • [초안] CJ푸드빌 디지털 채널 Back-end 개발자 직무 분석
    • [초안] CJ푸드빌 디지털 채널 Back-end 면접 답변집 — 슬롯 도메인 경험을 커머스/F&B 설계로 번역하기
    • [초안] F&B / e-Commerce 운영 모니터링과 장애 대응 인터뷰 정리
    • Observability — 면접 답변 프레임
    • [초안] 시니어 Java 백엔드 면접 마스터 플레이북 — 김병태
    • [초안] NSC 슬롯팀 경험 기반 질문 은행 — 도메인 모델링·동시성·성능·AI 협업
  • java 페이지로 이동
    • concurrency 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • [초안] Java 동시성 락 정리 — 커머스 메뉴/프로모션 정책 캐시 갱신 관점
    • [초안] JVM 튜닝 실전: 메모리 구조부터 Virtual Threads, GC 튜닝, 프로파일링까지
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node 백엔드 운영 패턴 — Streams 백프레셔, pipe/pipeline, 멱등성 vs 분산 락
    • Node.js
    • npm vs pnpm — 어떤 기준으로 선택했나
    • `setImmediate()`
  • kafka 페이지로 이동
    • [초안] Kafka 기본 개념 — 토픽, 파티션, 오프셋, 복제
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • [초안] Kafka 실전 설계: 파티션 전략, 컨슈머 그룹, 전달 보장, 재시도, 순서 보장 트레이드오프
    • 메시지 전송 신뢰성
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • network 페이지로 이동
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • rabbitmq 페이지로 이동
    • [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
    • [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
  • security 페이지로 이동
    • [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • sb-dev-team 페이지로 이동
    • the-future-company 페이지로 이동
  • testing 페이지로 이동
    • [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
  • travel 페이지로 이동
    • 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
  • web 페이지로 이동
    • [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점
FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr
Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors
01site
  • Home↗
  • Posts↗
  • Categories↗
  • About↗
02policy
  • 소개/about
  • 개인정보처리방침/privacy
  • 연락처/contact
03categories
  • AI↗
  • Algorithm↗
  • DB↗
  • DevOps↗
  • Java/Spring↗
  • JS/TS↗
  • React↗
  • Next.js↗
  • System↗
04connect
  • GitHub@jon890↗
  • Source repositoryjon890/fos-study↗
  • RSS feed/rss.xml↗
  • Newsletter매주 1 회 · 한 편의 글→
© 2026 FOS Study. All posts MIT-licensed.
built with·Next.js·Tailwind v4·Geist·Pretendard·oklch
fos-blog/java/ItemProcessor
java

ItemProcessor

우리의 비즈니스 로직이 살아 숨쉬는 전장으로 진입해보자. 이제부터 ItemProcessor를 올바르게 다루는 방법을 파헤쳐보자. ItemProcessor의 process() 메서드가 null을 반환하면 해당 item은 ItemWriter로 전달되는 Chunk에서 완전히 제외된다. - Spring Batch는 먼저 지정된 청크 사이즈만큼 read() 메서드를...

2026.02.25·3 min read·88 views

우리의 비즈니스 로직이 살아 숨쉬는 전장으로 진입해보자.
이제부터 ItemProcessor를 올바르게 다루는 방법을 파헤쳐보자.

첫 번째 방식: null 반환을 통한 데이터 필터링

ItemProcessor의 process() 메서드가 null을 반환하면 해당 item은 ItemWriter로 전달되는 Chunk에서 완전히 제외된다.

  • Spring Batch는 먼저 지정된 청크 사이즈만큼 read() 메서드를 호출하여 input Chunk를 생성한다.
  • 생성된 input Chunk의 각 item에 대해 ItemProcessor의 process() 메서드를 호출한다.
  • 이 과정에서 process()가 null을 반환한 item은 최종 output Chunk에서 제외된다.
  • 결과적으로 ItemWriter에 전달되는 output Chunk의 크기는 input Chunk의 크기보다 작아진다.

대표적인 필터링 시나리오는 다음과 같다

  • 유효하지 않은 데이터 제거 (비정상적인 금액, 잘못된 주문상태 등)
  • 처리가 불필요한 데이터 제외 (휴면계정, 탈퇴회원 등)
  • 특정 조건에 맞지 않는 데이터 제외 (기준금액 이하 거래, 특정 상태의 주문 등)

Spring Batch에서는 이러한 null 반환 방식을 활용해 데이터를 검증하는 ItemProcessor 구현체를 제공한다. 바로 ValidatingItemProcessor 이다.

ValidatingItemProcessor는 org.springframework.batch.item.validator.Validator를 사용해 데이터 필터링을 수행한다. Validator 인터페이스는 다음과 같다.

java
public interface Validator<T> {
    void validate(T value) throws ValidationException;
}

사용법은 다음과 같다.

java
@Bean
piublic ItemProcessor<Item, Item> itemProcessor() {
    ValidatorItemProcessor<Item> processor = new ValidatingItemProcessor<>(validator);
    processor.setFilter(true); // ValidationException 발생 시 필터링 수행
    return processor;
}
  • ValidatorItemProcessor로 데이터 필터링을 수행하기 위해서는 setFilter(true)로 설정해야 한다.
  • 이렇게 설정하면 Validator에서 ValidationException이 발생했을 떄 해당 데이터가 필터링되도록 null이 반환된다.
  • 기본값인 setFilter(false)로 설정된 경우에는 ValidationException이 발생하면 예외가 상위로 전달되어 Step이 실패하게 된다.
    • 예외가 상위로 전파되면, 현재 Step은 물론 전체 Job까지 바로 실패해버린다.
    • 이것이 바로 데이터 검증을 통한 실패 처리 방식이다.
    • 유효하지 않는 데이터 하나만 발견되어도 즉시 예외를 던져 전체 배치 잡을 중단시킬 수 있다.

두 번째 방식: 데이터 변환

ItemProcessor의 가장 핵심적인 역할은 읽어온 데이터를 우리가 원하는 형태로 변환하는 것이다.
비즈니스 요구사항에 맞춰 데이터를 변환하는 것이 ItemProcessor의 존재 이유다.

세 번째 방식: 데이터 보강

때로는 읽어온 데이터만으로 충분하지 않을때가 있다. 외부 시스템이나 데이터베이스에서 추가 정보를 가져와 기존 데이터를 보강해야 하는 경우가 있다.

이것이 바로 데이터 보강(Data Enrichment)이다. 원본 데이터에 외부 소스로 얻은 정보를 추가하여 더욱 풍부하고 의미 있는 데이터로 만드는 과정이다.

대표적인 데이터 보강 시나리오는 다음과 같다.

  • 거래 내역에 실시간 환율 적용 (외환 API를 통한 원화 환산)
  • 주문 데이터에 재고 현황 추가 (창고 시스템 API 조회)
  • IP 주소에 지역 정보 보강 (GeoIP API를 통한 국가/도시 정보)

그러나 데이터 보강 이면에는 놓치면 안 되는 치명적인 위험이 있다.

외부 시스템 통신 최적화

ItemProcessor의 process() 메서드는 아이템을 하나씩 처리하는 단위성 작업이다.
이런 특성으로 인해 데이터 보강이나 외부 API나 DB 조회가 필요한 경우 심각한 성능 이슈가 발생할 수 있다.

이 한계를 어떻게 돌파할 수 있을까? ItemWriteListener를 활용해볼 수 있을 것이다.
1장에서 살펴본 ItemWriteListener의 beforeWrite() 메서드 시그니처를 다시 한 번 살펴보자.

java
default void beforeWrite(Chunk<? extends S> items) {}

beforeWrite() 메서드의 파라미터 타입에 주목해보자. 개별 item이 아닌 Chunk 전체를 입력으로 받는 것을 알 수 있다.
외부 API가 지원한다면, 여러 건을 동시에 조회하는 API를 사용해서 통신 횟수를 줄여볼 수 있을 것이다.

ItemWriter.write() 에서 API를 호출하고 바로 쓰기까지 한번에 처리하면 안되나?
ItemWriter는 읽기 작업을 설계된 컴포넌트가 아니다.
단일 책임 원칙 (Single Responsibility Principle) 위반이다. 따라서 이런 접근 시도는 하지말자.

필터링, 검증, 변환, 보강까지 ItemProcessor의 역할을 모두 살펴봤다.
이제 한 단계 더 올라가 ItemProcessor들을 조합하고 연계하는 방법을 살펴보자.

CompositeItemProcessor

CompositeItemProcessor는 여러 위임 대상 ItemProcessor를 순차적으로 실행하는 위임 ItemProcessor 구현체다. 각 ItemProcessor는 순차적으로 실행되며, 이전 ItemProcessor의 반환 값이 다음 ItemProcessor의 입력으로 전달된다.

이때 타입의 연속성이 매우 중요한데, 첫 번쨰 ItemProcessor의 입력 타입은 ItemReader의 반환 타입과 일치해야 하고,
마지막 ItemProcessor의 반환 타입은 ItemWriter가 처리할 수 있는 타입이어야 한다.
또한 중간에 위치한 ItemProcessor들도 서로 입력과 출력 타입이 일치해야 한다.

CompositeItemProcessor를 사용하기 위해서는 생성자에 위임 대상 ItemProcessor들을 전달하거나, CompositeItemProcessorBuilder.delegates() 메서드를 통해 설정하면 된다.

다음 작전에서는 청크 지향 처리를 더욱 견고하게 구축하는 기술울 파헤쳐보도록 하자.

on this page
  • 01첫 번째 방식: `null` 반환을 통한 데이터 필터링
  • 02두 번째 방식: 데이터 변환
  • 03세 번째 방식: 데이터 보강
  • 외부 시스템 통신 최적화
  • CompositeItemProcessor

댓글 (0)