fos-blog/study
01 / 홈02 / 카테고리03 / 시리즈
01 / 홈02 / 카테고리03 / 시리즈

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • langgraph 페이지로 이동
    • agents.md
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식
    • Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
    • Claude Code 멀티 에이전트 — Teams
    • AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design
    • Docling — IBM Research 의 문서 파싱 toolkit 상세 정리
    • 하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기
    • 하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
    • 멀티모달 LLM (Multimodal Large Language Model)
    • AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
  • ai 페이지로 이동
    • agent 페이지로 이동
  • algorithm 페이지로 이동
    • live-coding 페이지로 이동
    • 분산 계산을 위한 알고리즘
  • apartment 페이지로 이동
    • 구리 럭키아파트 24평 인테리어 레퍼런스 모음
  • architecture 페이지로 이동
    • [초안] 시니어 백엔드를 위한 API 설계 실전 스터디 팩 — REST · 멱등성 · 페이지네이션 · 버전 전략
    • [초안] API Versioning과 Backward Compatibility: 시니어 백엔드 관점 정리
    • 캐시 설계 전략 총정리
    • [초안] CJ푸드빌 디지털 채널 면접: 슬롯 도메인 경험을 커머스 도메인 설계 능력으로 번역하기
    • [초안] 커머스 Spring 서비스에 Clean/Hexagonal Architecture를 실용적으로 적용하기
    • [초안] 커머스 도메인 모델링: 주문·재고·노출의 세 축을 분리해서 설계하기
    • 커머스 주문 상태와 데이터 정합성 기본기 — CJ푸드빌 면접 대비
    • [초안] 쿠폰/프로모션 동시성과 정합성 기본기 — 선착순·중복 사용 방지·발급/사용/복구
    • [초안] DDD와 도메인 모델링: 시니어 백엔드 관점의 전술/전략 패턴 실전 가이드
    • [초안] Decorator & Chain of Responsibility — 행동을 체인으로 조립하는 두 가지 방식
    • 디자인 패턴
    • [초안] 분산 아키텍처 완전 정복: Java 백엔드 시니어 인터뷰 대비 실전 가이드
    • [초안] 분산 트랜잭션과 Outbox 패턴 — 왜 2PC를 피하고 어떻게 대신할 것인가
    • 분산 트랜잭션
    • [초안] e-Commerce 주문·결제 도메인 모델링: 상태머신, 멱등성, Outbox/Saga 실전 정리
    • [초안] F&B 쿠폰·프로모션·멤버십·포인트 설계
    • [초안] F&B · e-Commerce 디지털 채널 도메인 한 장 정리 — CJ푸드빌 디지털 채널 백엔드 면접 대비
    • [초안] F&B 주문/매장/픽업 상태머신 설계 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] F&B 이커머스 결제·환불·정산 운영 가이드
    • [초안] Hexagonal / Clean Architecture를 Spring 백엔드에 적용하기
    • [초안] 대규모 커머스 트래픽 처리 패턴 — 1,600만 고객과 올영세일을 버티는 설계
    • [초안] 레거시 JSP/jQuery 화면과 신규 API가 공존하는 백엔드 운영 전략
    • [초안] MSA 서비스 간 통신: Redis [Cache-Aside](../database/redis/cache-aside.md) × Kafka 이벤트 하이브리드 설계
    • [초안] Observability 입문: 시니어 백엔드가 장애를 탐지하고 대응하는 방식
    • [초안] Outbox / Inbox Pattern 심화 — 분산 메시징의 정합성 문제를 DB 트랜잭션으로 풀어내기
    • [초안] 결제 도메인 멱등성과 트랜잭션 재시도 기본기
    • [초안] 시니어 백엔드를 위한 Resilience 패턴 실전 가이드 — Timeout, Retry, Circuit Breaker, Bulkhead, Backpressure
    • [초안] REST API 버저닝과 모바일 앱 하위 호환성 — CJ푸드빌 디지털 채널 백엔드 관점
    • [초안] Spring Batch vs Event-Driven — 같은 비동기처럼 보이지만 전혀 다른 두 패러다임
    • [초안] Strategy Pattern — 분기문을 없애는 설계, 시니어 백엔드 인터뷰 핵심 패턴
    • [초안] 시니어 백엔드를 위한 시스템 설계 입문 스터디 팩
    • [초안] 템플릿 메서드 패턴 - 백엔드 처리 골격을 강제하는 가장 오래되고 가장 위험한 패턴
    • [초안] 대규모 트래픽 중 무중단 마이그레이션 — Feature Flag + Shadow Mode 실전
  • database 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • [초안] DB Connection Pool Saturation과 Thread Pool 격리
    • 커넥션 풀 크기는 얼마나 조정해야 할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • [초안] JPA N+1과 커머스 조회 모델: 주문/메뉴/쿠폰 도메인에서 살아남기
    • [초안] MyBatis 기본기 — XML Mapper, resultMap, 동적 SQL, 운영 패턴 정리
    • [초안] MyBatis와 JPA/Hibernate 트레이드오프 — 레거시 백엔드를 다루는 시니어 관점
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • observability 페이지로 이동
    • [초안] 커머스/F&B 채널 장애 첫 5분과 관측성 기본기
    • Envoy Proxy
    • [초안] F&B / e-Commerce 운영 장애 대응과 모니터링 — 백엔드 관점 정리
    • Graceful Shutdown
    • [초안] 시니어 백엔드를 위한 SLO와 Error Budget 기반 장애 대응
  • finance 페이지로 이동
    • industry-cycle 페이지로 이동
    • investing 페이지로 이동
  • http 페이지로 이동
    • HTTP Connection Pool
  • interview 페이지로 이동
    • [초안] AI 서비스 팀 경험 기반 시니어 백엔드 면접 질문 뱅크 — Spring Batch RAG / gRPC graceful shutdown / 전략 패턴 / 12일 AI 웹툰 MVP
    • [초안] 커머스/F&B 면접 답변집 — 슬롯 도메인 경험을 주문·결제·쿠폰·매장 설계로 매핑하기
    • [초안] F&B / e-Commerce 운영 모니터링과 장애 대응 인터뷰 정리
    • Observability — 면접 답변 프레임
    • [초안] 시니어 Java 백엔드 면접 마스터 플레이북 — 김병태
    • [초안] NSC 슬롯팀 경험 기반 질문 은행 — 도메인 모델링·동시성·성능·AI 협업
  • java 페이지로 이동
    • concurrency 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • [초안] Java 동시성 락 정리 — 커머스 메뉴/프로모션 정책 캐시 갱신 관점
    • [초안] JVM 튜닝 실전: 메모리 구조부터 Virtual Threads, GC 튜닝, 프로파일링까지
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node 백엔드 운영 패턴 — Streams 백프레셔, pipe/pipeline, 멱등성 vs 분산 락
    • Node.js
    • npm vs pnpm — 어떤 기준으로 선택했나
    • `setImmediate()`
  • kafka 페이지로 이동
    • [초안] Kafka 기본 개념 — 토픽, 파티션, 오프셋, 복제
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • [초안] Kafka 실전 설계: 파티션 전략, 컨슈머 그룹, 전달 보장, 재시도, 순서 보장 트레이드오프
    • 메시지 전송 신뢰성
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • network 페이지로 이동
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • python 페이지로 이동
    • Python async/await — CompletableFuture·Reactor 와 다른 점, 그리고 blocking I/O 함정
    • Python 의존성 관리 — Java Maven/Gradle 사용자가 만나는 첫 충격
    • FastAPI 기초 — Spring Boot 사용자가 빠르게 익히는 법
    • GPU·CUDA·MPS 기초 — 자바 백엔드 개발자가 처음 만나는 그림
    • Multi-process GPU 워크로드 — 자바 ThreadPool 사용자가 만나는 모델 차이
    • Java 개발자를 위한 Python 심화 — OOP·데코레이터·컨텍스트 매니저
    • PyTorch 기초 — 텐서, 디바이스, 그리고 모델 로딩이 무거운 이유
    • Java 개발자를 위한 Python 문법 핵심
    • ML 서비스 성능 분석 워크플로 — 자바 백엔드 트러블슈팅과 다른 점
    • OCR 동작 원리 — Layout · Text · Post-process 3단계
    • Python 서버의 RSS 가 안 줄어드는 이유 — gc.collect 의 한계와 malloc_trim
  • rabbitmq 페이지로 이동
    • [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
    • [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
  • security 페이지로 이동
    • [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
    • [초안] Spring Security 6.x OAuth2 + JWT 상용 인증 설계 — Grant 선택, Resource Server, Refresh Rotation, 로그아웃
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • sb-dev-team 페이지로 이동
    • the-future-company 페이지로 이동
  • testing 페이지로 이동
    • [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
  • travel 페이지로 이동
    • 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
  • web 페이지로 이동
    • [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점
FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr
Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors
01site
  • Home↗
  • Posts↗
  • Categories↗
  • About↗
02policy
  • 소개/about
  • 개인정보처리방침/privacy
  • 연락처/contact
03categories
  • AI↗
  • Algorithm↗
  • DB↗
  • DevOps↗
  • Java/Spring↗
  • JS/TS↗
  • React↗
  • Next.js↗
  • System↗
04connect
  • GitHub@jon890↗
  • Source repositoryjon890/fos-study↗
  • RSS feed/rss.xml↗
  • Newsletter매주 1 회 · 한 편의 글→
© 2026 FOS Study. All posts MIT-licensed.
built with·Next.js·Tailwind v4·Geist·Pretendard·oklch
fos-blog/python/OCR 동작 원리 — Layout · Tex…
system

OCR 동작 원리 — Layout · Text · Post-process 3단계

자바 백엔드만 다뤄오다가 OCR (Optical Character Recognition) 서비스를 분석할 일이 생겼다. "이미지에서 글자를 뽑는다" 라는 한 줄 요약은 알았지만, 실제 코드를 열어보면 모델이 둘이상이고, 여러 단계가 직렬·병렬로 엮여 있고, "왜 이 단계가 따로 있지" 같은 의문이 계속 생긴다. 이 글은 OCR 파이프라인의 표준 구조를 정리...

2026.05.19·7 min read·17 views

자바 백엔드만 다뤄오다가 OCR (Optical Character Recognition) 서비스를 분석할 일이 생겼다. "이미지에서 글자를 뽑는다" 라는 한 줄 요약은 알았지만, 실제 코드를 열어보면 모델이 둘이상이고, 여러 단계가 직렬·병렬로 엮여 있고, "왜 이 단계가 따로 있지" 같은 의문이 계속 생긴다.

이 글은 OCR 파이프라인의 표준 구조를 정리하고, 자바 백엔드 관점에서 ETL 파이프라인과 1:1 로 비유한다. 내가 직접 분석한 ML 서비스의 흐름을 일반화해서 예시로 든다.

큰 그림 — Layout → Text → Post-process

OCR 시스템은 보통 다음 3단계로 나뉜다.

plaintext
이미지/PDF 페이지
    ↓ [1. Layout Detection]
박스 단위로 잘린 영역들 (텍스트 박스, 테이블 셀, 그림)
    ↓ [2. Text Recognition]
각 박스의 텍스트 + 신뢰도
    ↓ [3. Post-processing]
정렬된 글, 표 구조, markdown

자바 ETL 파이프라인에 비유하면 다음과 같다.

ETL 단계OCR 대응
Extract (소스 데이터 추출)Layout Detection — "어디에 글이 있는가"
Transform (정제·변환)Text Recognition — "이 박스에는 무슨 글자가 적혀 있는가"
Load (정형 저장)Post-processing — "전체를 정렬해 markdown/JSON 으로"

각 단계가 별도 모델 또는 라이브러리로 구현되어 있고, 자바 Spring Batch 의 Reader → Processor → Writer 와 같은 분리 패턴을 따른다.

1단계 — Layout Detection

목적: 이미지 안의 어디에 무엇이 있는지 박스로 잡아낸다. 다음과 같은 구조 요소를 검출한다.

  • 텍스트 영역
  • 테이블
  • 이미지
  • 헤더 / 푸터
  • 페이지 번호

대표 모델은 LayoutLM, DocLayout-YOLO, PubLayNet, Donut 류의 transformer 기반 모델. CV (computer vision) 의 object detection 기법을 문서 영역에 특화한 것.

출력: 각 영역의 (x, y, width, height) 좌표 + 카테고리 (text / table / image / title 등).

python
# Layout 모델 출력 예시
{
  "blocks": [
    {"bbox": (50, 100, 500, 150), "category": "title"},
    {"bbox": (50, 200, 500, 400), "category": "text"},
    {"bbox": (50, 450, 500, 600), "category": "table"},
    {"bbox": (200, 650, 300, 750), "category": "image"},
  ]
}

자바 백엔드 비유: HTML 페이지를 파싱해 <div>, <table>, <img> 같은 구조 요소를 식별하는 작업. JSoup 으로 DOM 트리를 만드는 것과 의도가 같다. 다만 입력이 HTML 마크업이 아니라 픽셀 이미지라 ML 모델이 필요한 것.

이 단계가 빠질 수도 있다. 단순히 "이 이미지의 모든 글자를 뽑아줘" 라면 Layout 없이 Text Recognition 으로 바로 갈 수 있다. 그러나 문서 구조 (표·헤더·본문 분리) 가 필요하면 Layout 이 선행돼야 한다.

2단계 — Text Recognition

목적: 잘린 박스 안의 픽셀을 글자 시퀀스로 변환. OCR 의 핵심.

대표 라이브러리:

  • PaddleOCR — 중국어·일본어·한국어·영어 다국어, 가볍고 빠름. det (detection) + rec (recognition) + cls (orientation) 세 모델 조합.
  • EasyOCR — 다언어 지원, PyTorch 기반.
  • Tesseract — 가장 오래된 OSS OCR, 정확도는 현대 ML 대비 떨어짐.
  • Cloud OCR API (NHN Cloud OCR, AWS Textract, Google Vision 등) — REST 호출, 별도 인프라 불필요, 비용 발생.

내부적으로 Recognition 모델은 보통 CNN + RNN (또는 Transformer) 의 조합. CRNN, TrOCR 같은 아키텍처. 입력은 작은 텍스트 박스 이미지, 출력은 문자 시퀀스 + 각 문자의 신뢰도.

python
# Text Recognition 출력 예시
{
  "text": "안녕하세요",
  "confidence": 0.92,
  "char_confidences": [0.95, 0.93, 0.91, 0.92, 0.89],
}

자바 비유: 한 문자열 필드에 대해 자연어 처리 후 정규화·검증을 적용하는 단계. Bean Validation 의 @Pattern 이 글자가 맞는지 확인하는 것과 비슷한 위치.

한국어·일본어 처리의 분기

언어별로 모델이 다르다. 한국어 OCR 은 한글 음절 + 한자 혼용, 일본어는 히라가나·가타카나·한자가 섞여 모델 학습 데이터가 다르다. 한 시스템 안에 두 OCR 엔진을 두는 게 흔하다.

분석한 ML 서비스도 같은 패턴이었다. KR (한국어) 워커는 Cloud OCR API 를 호출하고, JA (일본어) 워커는 로컬 PaddleOCR 모델을 사용. 같은 Docling 파이프라인 안에서 plugin 으로 분기하는 구조.

자바라면 같은 인터페이스를 구현하는 두 개의 @Service 빈을 @Qualifier 로 분기하는 패턴.

python
# Python 의 OCR 엔진 추상화
class OcrEngine(Protocol):
    def recognize(self, image) -> list[OcrResult]: ...
 
class CloudOcr(OcrEngine):
    def recognize(self, image):
        return call_cloud_api(image)
 
class LocalOcr(OcrEngine):
    def recognize(self, image):
        return paddle_predict(image)

Post 2 의 Protocol 패턴 이 그대로 적용된다.

3단계 — Post-processing

목적: 박스별 인식 결과를 사람이 읽을 수 있는 글로 재조합. 페이지의 reading order 결정, 표 구조 복원, markdown 변환, 신뢰도 필터링.

가장 까다로운 단계. 픽셀 좌표만으로는 "이 박스가 다음 박스의 앞인가 뒤인가" 가 자명하지 않다. 다단 레이아웃, 표 안의 셀, 각주 같은 케이스가 여기서 다뤄진다.

대표적인 처리:

  • Reading order — bbox 좌표 + Layout 카테고리로 자연스러운 순서 추정
  • Table extraction — 셀의 행·열을 좌표로 복원해 표 JSON 만들기 (HTML → JSON, 또는 직접 grid 재구성)
  • Confidence filtering — 낮은 신뢰도 박스 제외 (예: < 0.3 인 결과는 버림)
  • Cell matching — Layout 의 표 영역과 텍스트 박스를 매칭. 표 영역 안에 있는 텍스트만 그 표의 셀로 인식
  • Markdown 변환 — 헤더·리스트·인용·이미지 임베딩 처리

자바 비유: Spring Batch 의 ItemWriter + JSON serialization 단계. 변환된 데이터를 출력 포맷에 맞게 정렬·구조화.

이 단계가 OCR 시스템의 품질을 좌우한다. 같은 모델 출력이라도 후처리가 약하면 표가 깨지거나 reading order 가 뒤죽박죽이 된다.

PDF 처리의 추가 단계

이미지 OCR 은 위 세 단계지만 PDF 는 한 단계 더 있다. PDF 자체가 벡터 + 텍스트 + 이미지 가 섞인 포맷이기 때문.

plaintext
PDF 파일
    ↓ [PDF Backend — pypdfium / poppler / docling-parse]
페이지별 이미지 (PNG/픽셀 데이터) + 메타데이터 (텍스트 레이어 있는 경우)
    ↓ [위 세 단계 OCR 파이프라인]
markdown

PDF 에 텍스트 레이어가 있으면 OCR 없이도 글자 추출 가능 (PyPDF2, pdfplumber). 하지만 스캔본·이미지화된 PDF 는 OCR 이 필수.

분석한 서비스의 Docling 라이브러리가 이 PDF rendering + OCR 통합을 담당한다. PDF backend 선택, page batch size, image scale 같은 옵션이 성능에 직결되는 부분.

성능 함정 — OCR 단계가 외부 API 직렬 호출일 때

OCR 단계가 클라우드 API 호출이면 latency 의 지배 요인이 GPU 가 아니라 네트워크가 된다. 우리 분석에서 가장 큰 병목으로 잡힌 패턴.

python
# 안티 패턴 — 페이지마다 직렬 API 호출
for page in pdf_pages:
    for region in page.text_regions:
        result = call_cloud_ocr_api(region.image)   # 동기 HTTP, 페이지당 N번
        merge(result)

페이지 수 × 영역 수만큼 RTT 가 누적된다. 30 페이지 PDF + 페이지당 평균 5 영역 = 150 회 직렬 HTTP. GPU 는 idle 한 채로 네트워크 대기.

async/await 글 의 run_in_executor 또는 ThreadPoolExecutor 를 활용한 동시 호출이 거의 무조건 필요. 자바 진영에서 마이크로서비스 호출을 CompletableFuture.allOf(...) 로 fan-out 하는 것과 같은 패턴.

python
# 권장 패턴 — 영역 병렬 호출
with ThreadPoolExecutor(max_workers=8) as ex:
    results = list(ex.map(call_cloud_ocr_api, regions))

OCR API 의 rate limit 와 동시 호출 제한을 확인해 worker 수를 결정한다. 너무 많이 동시 호출하면 429 (Too Many Requests) 가 난다.

신뢰도 (confidence) 의 의미

OCR 모델은 각 문자·박스에 0.0 - 1.0 사이의 신뢰도를 부여한다. 자바에서는 직접 다룰 일이 거의 없던 개념.

이걸 후처리 임계값으로 쓴다. 예: confidence_threshold=0.3 이면 30% 미만은 버림. 너무 낮으면 노이즈 (이미지의 점·얼룩을 글자로 인식한 결과) 가 포함되고, 너무 높으면 흐릿한 글자가 누락된다.

분석한 서비스는 기본값이 0.0 으로 모든 결과를 통과시키고 있었다. 표·작은 글자 인식에는 안전하지만 후처리·markdown 생성 부담이 늘어 성능 이슈로 잡혔다. A/B 로 0.3 정도까지 올려도 회귀가 적으면 throughput 이득.

정리

자바 백엔드 개발자가 OCR 시스템을 처음 마주할 때 외울 한 줄.

OCR 은 Layout (어디에 글이 있나) → Recognition (어떤 글자인가) → Post-process (어떻게 묶나) 의 3단계 파이프라인이다. 각 단계는 독립 ML 모델 또는 외부 API 로 구현되며, 자바 ETL 파이프라인의 Extract/Transform/Load 와 같은 분리 원칙을 따른다.

다음 글은 이 시리즈의 마무리 — 자바 백엔드 개발자 시각에서 ML 서비스 성능 분석 워크플로를 정리한다. 분석한 실제 사례 (이슈 17개 등록) 를 자바 백엔드 트러블슈팅과 비교한다.

참고

  • PaddleOCR — Architecture
  • Docling — Document parsing toolkit
  • LayoutLM — Pre-training for Document AI
  • Donut — OCR-free Document Understanding
  • Awesome OCR — curated list
on this page
  • 01큰 그림 — Layout → Text → Post-process
  • 021단계 — Layout Detection
  • 032단계 — Text Recognition
  • 한국어·일본어 처리의 분기
  • 043단계 — Post-processing
  • 05PDF 처리의 추가 단계
  • 06성능 함정 — OCR 단계가 외부 API 직렬 호출일 때
  • 07신뢰도 (confidence) 의 의미
  • 08정리
  • 09참고

이런 글도

  • Python 서버의 RSS 가 안 줄어드는 이유 — gc.collect 의 한계와 malloc_trim
    Python 으로 long-running 서버 (FastAPI / Flask / Celery / uWSGI 등) 를 운영하다 보면 한 번쯤 마주치는 증상이 있다. - 워커 프로세스의 RSS 가 시간이 지날수록 단조 증가한다 - 큰 객체를 del 하고 gc.collect() 를 불러도 RSS 가 줄지 않는다 - 결국 max-requests / workerma...
    📁 system
    system
    2026.05.22
  • ML 서비스 성능 분석 워크플로 — 자바 백엔드 트러블슈팅과 다른 점
    이 시리즈의 마무리 글이다. 앞선 글들에서 다음 주제를 자바 백엔드 비교 관점으로 정리했다. - Python 문법 - 의존성 관리 - FastAPI - async/await - GPU·CUDA·MPS - PyTorch - multi-process worker pool - OCR 파이프라인 마지막은 이 모든 개념을 적용해 실제 ML 서비스의 성능을 분석하는...
    📁 system
    system
    2026.05.19
  • Multi-process GPU 워크로드 — 자바 ThreadPool 사용자가 만나는 모델 차이
    자바 백엔드에서 ThreadPoolExecutor 는 거의 만능이었다. CPU bound 든 I/O bound 든 스레드 풀 크기만 잘 잡으면 동시성을 챙길 수 있었다. JVM 안에서 메모리를 공유하니 작업 간 데이터 전달도 가볍다. Python ML 서비스는 그림이 다르다. ThreadPoolExecutor 가 있지만 CPU/GPU 작업에서는 거의 안 쓰...
    📁 system
    system
    2026.05.19
  • PyTorch 기초 — 텐서, 디바이스, 그리고 모델 로딩이 무거운 이유
    자바 백엔드에서 Spring Boot 가 부팅하는 시간이 5-30초 걸리는 게 일반적이다. 클래스 로딩, 컴포넌트 스캔, 의존성 주입, EntityManagerFactory 초기화 등이 누적된다. 한 번 부팅하면 그 뒤로는 요청 처리에 거의 영향이 없다. PyTorch 기반 ML 서비스는 비슷하지만 한 단계 더 무겁다. 우리 프로젝트의 KR Worker 가...
    📁 system
    system
    2026.05.19

댓글 (0)