fos-blog/study
01 / 홈02 / 카테고리03 / 시리즈
01 / 홈02 / 카테고리03 / 시리즈

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • langgraph 페이지로 이동
    • 사람용 CLI와 AI 에이전트용 CLI는 설계가 다르다
    • agents.md
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code 메모리: CLAUDE.md와 .claude/rules를 규칙으로 쓰는 법
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식
    • Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
    • Claude Code 멀티 에이전트 — Teams
    • AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design
    • Docling — IBM Research 의 문서 파싱 toolkit 상세 정리
    • 하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기
    • 하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
    • 멀티모달 LLM (Multimodal Large Language Model)
    • AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
    • OpenClaw는 context와 memory를 어떻게 관리하나 — 나만의 에이전트를 구성하는 법
    • OpenClaw vs Hermes Agent — 갈아탈까 고민하며 정리한 비교
    • 스킬 문서를 신경망처럼 학습시킨다 — Microsoft SkillOpt 분석
  • ai 페이지로 이동
    • agent 페이지로 이동
    • [초안] AI 제품 백엔드 안정성 — 지연·비용·권한·관측·도구 실패·폴백/재시도/사람 에스컬레이션
    • [초안] LLM 평가 프레임워크: 골든셋, 회귀 테스트, LLM-as-a-judge, 사람 피드백 루프
  • algorithm 페이지로 이동
    • live-coding 페이지로 이동
    • 분산 계산을 위한 알고리즘
  • apartment 페이지로 이동
    • 구리 럭키아파트 24평 인테리어 레퍼런스 모음
  • architecture 페이지로 이동
    • [초안] 시니어 백엔드를 위한 API 설계 실전 스터디 팩 — REST · 멱등성 · 페이지네이션 · 버전 전략
    • [초안] API Versioning과 Backward Compatibility: 시니어 백엔드 관점 정리
    • 캐시 설계 전략 총정리
    • [초안] 커머스 Spring 서비스에 Clean/Hexagonal Architecture를 실용적으로 적용하기
    • [초안] 커머스 도메인 모델링: 주문·재고·노출의 세 축을 분리해서 설계하기
    • 커머스 주문 상태와 데이터 정합성 기본기
    • [초안] 쿠폰/프로모션 동시성과 정합성 기본기 — 선착순·중복 사용 방지·발급/사용/복구
    • [초안] DDD와 도메인 모델링: 시니어 백엔드 관점의 전술/전략 패턴 실전 가이드
    • [초안] Decorator & Chain of Responsibility — 행동을 체인으로 조립하는 두 가지 방식
    • 디자인 패턴
    • [초안] 분산 아키텍처 완전 정복: Java 백엔드 시니어 인터뷰 대비 실전 가이드
    • [초안] 분산 트랜잭션과 Outbox 패턴 — 왜 2PC를 피하고 어떻게 대신할 것인가
    • 분산 트랜잭션
    • [초안] e-Commerce 주문·결제 도메인 모델링: 상태머신, 멱등성, Outbox/Saga 실전 정리
    • [초안] Event Sourcing과 CQRS — 상태가 아니라 변화를 저장한다는 발상
    • [초안] F&B 쿠폰·프로모션·멤버십·포인트 설계
    • [초안] F&B · e-Commerce 디지털 채널 도메인 한 장 정리
    • [초안] F&B 주문/매장/픽업 상태머신 설계
    • [초안] F&B 이커머스 결제·환불·정산 운영 가이드
    • [초안] Hexagonal / Clean Architecture를 Spring 백엔드에 적용하기
    • [초안] 대규모 커머스 트래픽 처리 패턴 — 대규모 회원과 메가 프로모션을 버티는 설계
    • [초안] 레거시 JSP/jQuery 화면과 신규 API가 공존하는 백엔드 운영 전략
    • [초안] MSA 서비스 간 통신: Redis [Cache-Aside](../database/redis/cache-aside.md) × Kafka 이벤트 하이브리드 설계
    • [초안] Observability 입문: 시니어 백엔드가 장애를 탐지하고 대응하는 방식
    • [초안] Outbox / Inbox Pattern 심화 — 분산 메시징의 정합성 문제를 DB 트랜잭션으로 풀어내기
    • [초안] 결제 도메인 멱등성과 트랜잭션 재시도 기본기
    • [초안] 시니어 백엔드를 위한 Resilience 패턴 실전 가이드 — Timeout, Retry, Circuit Breaker, Bulkhead, Backpressure
    • [초안] REST API 버저닝과 모바일 앱 하위 호환성 — 디지털 채널 백엔드 관점
    • [초안] Spring Batch vs Event-Driven — 같은 비동기처럼 보이지만 전혀 다른 두 패러다임
    • [초안] Strategy Pattern — 분기문을 없애는 설계, 시니어 백엔드 인터뷰 핵심 패턴
    • [초안] 시니어 백엔드를 위한 시스템 설계 입문 스터디 팩
    • [초안] 템플릿 메서드 패턴 - 백엔드 처리 골격을 강제하는 가장 오래되고 가장 위험한 패턴
    • [초안] 대규모 트래픽 중 무중단 마이그레이션 — Feature Flag + Shadow Mode 실전
  • database 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • [초안] DB Connection Pool Saturation과 Thread Pool 격리
    • 커넥션 풀 크기는 얼마나 조정해야 할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • [초안] JPA N+1과 커머스 조회 모델: 주문/메뉴/쿠폰 도메인에서 살아남기
    • [초안] MyBatis 기본기 — XML Mapper, resultMap, 동적 SQL, 운영 패턴 정리
    • [초안] MyBatis와 JPA/Hibernate 트레이드오프 — 레거시 백엔드를 다루는 시니어 관점
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • observability 페이지로 이동
    • [초안] 커머스/F&B 채널 장애 첫 5분과 관측성 기본기
    • [초안] 운영 데이터 정합성 장애 대응 — 결제 취소 누락과 중복 적재 런북
    • Envoy Proxy
    • [초안] F&B / e-Commerce 운영 장애 대응과 모니터링 — 백엔드 관점 정리
    • Graceful Shutdown
    • [초안] 시니어 백엔드를 위한 SLO와 Error Budget 기반 장애 대응
  • finance 페이지로 이동
    • industry-cycle 페이지로 이동
    • investing 페이지로 이동
  • http 페이지로 이동
    • HTTP Connection Pool
    • HTTPS는 어떻게 안전한가 — TLS, 인증서, 그리고 termination
  • interview 페이지로 이동
    • [초안] AI 서비스 팀 경험 기반 시니어 백엔드 면접 질문 뱅크 — Spring Batch RAG / gRPC graceful shutdown / 전략 패턴 / 12일 AI 웹툰 MVP
    • Observability — 면접 답변 프레임
    • [초안] 시니어 Java 백엔드 면접 마스터 플레이북 — 김병태
    • [초안] NSC 슬롯팀 경험 기반 질문 은행 — 도메인 모델링·동시성·성능·AI 협업
  • java 페이지로 이동
    • concurrency 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • [초안] Java 동시성 락 정리 — 커머스 메뉴/프로모션 정책 캐시 갱신 관점
    • [초안] JVM 튜닝 실전: 메모리 구조부터 Virtual Threads, GC 튜닝, 프로파일링까지
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node 백엔드 운영 패턴 — Streams 백프레셔, pipe/pipeline, 멱등성 vs 분산 락
    • Node.js
    • npm vs pnpm — 어떤 기준으로 선택했나
    • `setImmediate()`
  • kafka 페이지로 이동
    • [초안] Kafka 기본 개념 — 토픽, 파티션, 오프셋, 복제
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • [초안] Kafka 실전 설계: 파티션 전략, 컨슈머 그룹, 전달 보장, 재시도, 순서 보장 트레이드오프
    • 메시지 전송 신뢰성
    • [초안] Spring Kafka 컨슈머 오프셋 커밋과 트랜잭션 정렬: AckMode, manual ack, 멱등 처리
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • mlops 페이지로 이동
    • Python CUDA 버전 생태계 — nvidia-smi, nvcc, pip, conda가 다 다른 버전을 말하는 이유
    • GPU 컨테이너의 CUDA 버전 호환성 — nvidia-smi부터 이미지 다이어트까지
    • Kubernetes GPU 노드에서 /run tmpfs가 꽉 차서 Pod가 안 뜰 때
    • GPU·CUDA·MPS 기초 — 자바 백엔드 개발자가 처음 만나는 그림
    • Multi-process GPU 워크로드 — 자바 ThreadPool 사용자가 만나는 모델 차이
    • ML 서비스 성능 분석 워크플로 — 자바 백엔드 트러블슈팅과 다른 점
  • network 페이지로 이동
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • python 페이지로 이동
    • Python async/await — CompletableFuture·Reactor 와 다른 점, 그리고 blocking I/O 함정
    • Python 의존성 관리 — Java Maven/Gradle 사용자가 만나는 첫 충격
    • FastAPI 기초 — Spring Boot 사용자가 빠르게 익히는 법
    • Java 개발자를 위한 Python 심화 — OOP·데코레이터·컨텍스트 매니저
    • PyTorch 기초 — 텐서, 디바이스, 그리고 모델 로딩이 무거운 이유
    • Java 개발자를 위한 Python 문법 핵심
    • OCR 동작 원리 — Layout · Text · Post-process 3단계
    • Python 서버의 RSS 가 안 줄어드는 이유 — gc.collect 의 한계와 malloc_trim
  • rabbitmq 페이지로 이동
    • [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
    • [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
  • security 페이지로 이동
    • [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
    • [초안] Spring Security 6.x OAuth2 + JWT 상용 인증 설계 — Grant 선택, Resource Server, Refresh Rotation, 로그아웃
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • sb-dev-team 페이지로 이동
    • the-future-company 페이지로 이동
  • testing 페이지로 이동
    • [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
  • travel 페이지로 이동
    • 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
  • web 페이지로 이동
    • [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점
FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr
Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors
01site
  • Home↗
  • Posts↗
  • Categories↗
  • About↗
02policy
  • 소개/about
  • 개인정보처리방침/privacy
  • 연락처/contact
03categories
  • AI↗
  • Algorithm↗
  • DB↗
  • DevOps↗
  • Java/Spring↗
  • JS/TS↗
  • React↗
  • Next.js↗
  • System↗
04connect
  • GitHub@jon890↗
  • Source repositoryjon890/fos-study↗
  • RSS feed/rss.xml↗
  • Newsletter매주 1 회 · 한 편의 글→
© 2026 FOS Study. All posts MIT-licensed.
built with·Next.js·Tailwind v4·Geist·Pretendard·oklch
fos-blog/task/Playground 문서 파싱 파이프라인 —…
system

Playground 문서 파싱 파이프라인 — 기여 개요

진행 기간: 2026.05 (진행 중) AI 서비스 개발팀의 사내 LLM 워크플로 제품 Playground는 다양한 형식의 문서를 입력으로 받는다. 이 입력을 LLM이 다룰 수 있는 markdown으로 정규화하는 문서 파싱 서비스를 맡아 운영·개선했다. OCR 제품을 만드는 게 아니라, OCR을 활용해 문서를 markdown으로 변환하는 서비스다. - 스택...

2026.06.17·6 min read·0 views

진행 기간: 2026.05 ~ (진행 중)

AI 서비스 개발팀의 사내 LLM 워크플로 제품 Playground는 다양한 형식의 문서를 입력으로 받는다. 이 입력을 LLM이 다룰 수 있는 markdown으로 정규화하는 문서 파싱 서비스를 맡아 운영·개선했다. OCR 제품을 만드는 게 아니라, OCR을 활용해 문서를 markdown으로 변환하는 서비스다.

  • 스택: Python 3.11, FastAPI, docling(+TableFormer), 멀티프로세스 워커 풀, Docker(CUDA)/GPU
  • 입력: PDF / DOC(X) / PPTX / XLSX / HWP / CSV / 이미지 → markdown
  • 한국어는 NHN Cloud OCR, 일본어는 PaddleOCR을 내부 호출
  • 품질 기준: 변환 결과가 기준 출력과 얼마나 일치하는지(0~1 점수, 항목 5에서 설명) 0.95 이상

진행한 업무 개요

각 항목은 "무엇을 / 어떻게 바꿔 기여 / 결과" 순서로 정리했다.

1. OCR 처리 병렬화

  • 문서를 한 번에 하나씩 처리하던 구조를, 여러 워커(작업을 나눠 맡는 별도 프로세스)가 동시에 처리하는 구조로 전환
  • 워커를 별도 OS 프로세스로 분리해 각자 GPU 연산 환경을 갖게 하고, GPU 상태를 고려해 워커에 번갈아 분배
  • 워커 풀은 한국어·일본어·우선순위 세 종류로 나눠 작업을 보냄
  • 워커 수는 인스턴스당 4개로 설정했다. OCR 모델 백엔드가 최대 16개 인스턴스까지 확장되는 점을 고려한 값이다.
  • 결과: 운영 환경(인스턴스 8대 × 워커 4개)에서 문서를 동시에 처리할 수 있게 됐다

2. 비대해진 단일 파서 모듈 분해

  • 한 덩어리로 커진 파서를 입력 받기 / 적재 / 변환 / markdown 생성 네 단계로 분리
  • 결과: 새 형식·변환 경로를 추가할 때 한 단계만 고치면 되도록 변경 비용 축소

3. 관측 정보 단일화

  • 무엇: 요청 하나가 처리되는 과정이 지표(Prometheus)·로그·조회 API 세 곳에 동시에 기록되던 구조를, 지표(Grafana 화면) 한 곳으로 통일
  • 정리 기준: 지표가 이미 보여주는 정보(요청 수·처리 시간·워커 상태)는 로그·조회 API에서 제거하고, 지표로 표현할 수 없는 디버깅 정보(캐시 상태·워커의 GPU 배치·재시작 여부)만 조회 API에 남김
  • 함정 회피: 비슷해 보여도 의미가 다른 지표는 함께 지우지 않음 — 예를 들어 "재시작에 걸린 누적 시간"은 "지금 재시작 중인가"를 대체하지 못한다. 지울 코드와 그것을 쓰는 유일한 API를 한 묶음으로 식별해 정리
  • 결과: 같은 정보가 여러 곳에서 서로 어긋나는 문제와 불필요한 로그 누적 제거, 메트릭이 대체하는 중복 조회 API 제거

4. 워커 작업 대기 현황 대시보드 정립

문서 변환은 여러 워커에 나눠 처리한다. 작업이 어디에 얼마나 쌓이는지 정확히 봐야 "워커를 늘려야 하나"를 판단할 수 있어, 운영 그래프 화면(Grafana)에 작업 대기 현황 패널을 추가했다.

  • 작업은 두 곳에 쌓인다.
    • 대기 작업(pending) — 처리를 기다리는 전체 작업. 제한 없이 쌓인다.
    • 전달 버퍼(call_queue) — 워커에 곧바로 넘기려고 미리 담아두는 짧은 칸. 크기가 작게 고정돼 있다.
  • 그래서 실제로 밀린 양은 대기 작업으로 보고, 전달 버퍼는 "꽉 찼다/아니다" 신호로만 읽도록 해석 기준을 정했다.
  • 결과: "대기 칸이 늘 천장을 친다"는 오해(원래 작게 고정된 칸)를 바로잡고, 대기 작업이 계속 늘면 워커를 늘리는 신호로 삼는 판단 근거를 마련했다.

5. 출력 품질 다층 검증 체계 구축

문서를 markdown으로 바꾸는 과정은 OCR 설정이나 라이브러리를 조금만 바꿔도 결과물이 달라지기 쉽다. 그래서 "바꾼 뒤에도 품질이 유지되는지, 혹은 더 좋아졌는지"를 자동으로 확인하는 검증 장치를 두 겹으로 쌓았다.

  • 1차 — 회귀 검증 (바꾸기 전과 달라졌는지 확인)
    • 회귀(regression) 검증은 코드를 바꾼 뒤 출력이 예전과 달라졌는지 비교해, 의도치 않은 품질 저하를 잡는 안전장치다.
    • OCR 응답을 미리 저장해 두고, 새 변환 결과를 기준 출력과 글자 단위로 비교한다.
    • 얼마나 같은지는 NED(정규화 편집 거리)로 잰다 — 두 텍스트가 얼마나 일치하는지 0~1로 나타내며 1이면 완전히 같다. 0.95 이상을 합격선으로 뒀다.
    • 검증은 한 번 쓰고 버리는 GPU 인스턴스에 운영과 똑같은 이미지를 띄워 돌린다(운영 서버에는 영향 없음). 일부러 출력을 바꾼 변경은 "실패가 아님"으로 따로 표시해 구분한다.
  • 2차 — 정답지(golden) 채점 (정답에 얼마나 가까운지)
    • 1차만으로는 "출력이 달라졌다"는 알 수 있어도 "좋아졌는지 나빠졌는지"는 모른다. 예전과 다르기만 하면 무조건 실패로 잡기 때문이다.
    • 그래서 사람이 정한 "정답 출력"(정답지, golden)을 따로 두고, 새 결과가 그 정답에 얼마나 가까운지 절대 점수로 잰다.
    • 정답지는 LLM이 초안과 교정안을 만들고 사람이 최종 확정한다. 틀린 정답지는 없느니만 못하므로 확정은 사람이 책임진다.
  • 표는 따로 채점한다
    • 전체 글자 유사도(NED) 하나만 보면 표의 셀이 빠지거나 밀린 오류가 점수에 묻힌다.
    • 그래서 표는 셀 단위로 맞았는지 F1 점수(빠뜨린 것과 틀린 것을 함께 보는 정확도 지표)로 따로 잰다.
  • 결과: 품질이 나빠지는 변경은 막고, 품질을 높이는 변경은 안전하게 시도·측정할 수 있는 환경을 만들었다. 라이브러리 업그레이드처럼 위험한 변경도 "검증 장치가 잡아준다"는 전제 위에서 자신 있게 진행할 수 있게 됐다.

6. 안전한 일회성 테스트 환경 구축 (NHN Cloud CLI 자체 제작)

출력 검증(항목 5)을 운영에 영향 없이 돌리려면 운영과 똑같은 환경의 테스트 인스턴스가 필요하다.

  • 처음에는 운영 인스턴스 하나를 트래픽에서 빼내(drain) 검증했다. 운영 자원을 점유하고 검증 중 장애 위험이 있어 부담이 컸다.
  • 이후 NHN Cloud API를 다루는 CLI 도구를 직접 만들어, 일회성 테스트 인스턴스를 필요할 때 발급하고 검증이 끝나면 종료하는 방식으로 바꿨다.
  • 결과: 운영 인스턴스를 건드리지 않아 검증이 안전해졌고, 인스턴스를 검증하는 시간에만 켜 두므로 비용도 줄였다.

7. 워커 메모리 누수 진단·해결

문서 변환 워커의 실제 메모리 사용량(RSS)이 시간당 약 1.4GB씩 계속 늘어나는 문제가 있었다.

  • 처음 방어: 워커가 일정 작업 수를 처리하면 강제로 종료하고 새로 띄워, OS가 죽은 프로세스의 메모리를 회수하게 했다. 누수는 막지만 새 워커마다 모델 로드·캐시 초기화 비용(예열)이 다시 든다.
  • 원인 파악: gc.collect()를 이미 부르고 있는데도 메모리가 안 줄었다. 진단해 보니 Python의 gc.collect()는 OS로 메모리를 돌려주는 동작이 아니고, 작은 메모리 조각들이 OS로 반환되지 않은 채 프로세스 메모리 영역에 흩어져 쌓이는(단편화) 것이 원인이었다.
  • 해결: 메모리 정리 의도를 한 함수로 묶어(gc.collect() + OS 반환을 유도하는 malloc_trim) 흩어진 호출을 일괄 교체했다. 운영 중 즉시 끌 수 있게 환경변수로 토글 가능하게 뒀다.
  • 결과: RSS가 계속 증가하던 패턴이 사라지고 일정 범위에서 진동, 회귀 0건. 워커 강제 종료에 기대던 예열 비용 의존을 줄였다.
  • 상세: Python 서버 RSS 가 안 줄어들어 malloc_trim 을 박은 이야기

8. 일본어 OCR(PaddleOCR) 오류 복구 구조 개선

  • 오류를 같은 프로세스 안에서 잡아 이어가는 대신, 캐시·GPU 메모리를 정리하고 워커를 종료한 뒤 감시 장치가 새 워커를 띄우는 방식으로 전환
  • 사유: 오류가 난 뒤에는 OCR 엔진·GPU 상태가 오염돼 같은 프로세스에서 안전하게 복구할 수 없음
  • 결과: 한 번의 OCR 오류가 뒤따르는 요청까지 오염시키는 문제 방지

9. 코드 변경 검증·리뷰 자동화

  • 사내 GitHub Enterprise 환경의 자체 실행기에 자동 테스트와 코드 리뷰를 붙이고, 인증·호스트 관련 문제를 디버깅해 안정화

작업 방식 — Claude Code 활용과 업무 skill화

위 작업들을 빠르게 반복할 수 있었던 큰 이유는 Claude Code를 적극 활용하고, 자주 하는 작업을 재사용 가능한 skill로 만든 것이다.

  • 반복되는 운영·검증·문서 작업의 절차를 skill로 정리해, 같은 작업을 매번 처음부터 하지 않고 호출만으로 처리
  • 직접 만든 CLI 도구(NHN Cloud·Dooray 등)를 Claude Code에서 호출해 인스턴스 발급·검증·보고 같은 손이 많이 가는 작업을 자동화
  • 결과: 진단 → 검증 → 문서화로 이어지는 사이클을 빠르게 돌려, 분석·설계에 집중하고 반복 작업 비용을 줄였다

협업·운영

  • 운영 지표는 사내 Prometheus + Grafana 화면으로 보고, 작업 추적은 사내 협업 도구로 관리
  • 코딩 규칙: 비동기 처리 중 동기 입출력 금지(별도 실행기로 위임), 자주 실행되는 경로에 로그 금지, OCR 설정 변경 시 출력 바이트 단위 비교 필수

진행 중·다음 단계

  • 진행 중 항목(설정 마이그레이션, 표 인식 모델 v2, OCR API Gateway 제거)은 완료 후 별도 정리
on this page
  • 01진행한 업무 개요
  • 1. OCR 처리 병렬화
  • 2. 비대해진 단일 파서 모듈 분해
  • 3. 관측 정보 단일화
  • 4. 워커 작업 대기 현황 대시보드 정립
  • 5. 출력 품질 다층 검증 체계 구축
  • 6. 안전한 일회성 테스트 환경 구축 (NHN Cloud CLI 자체 제작)
  • 7. 워커 메모리 누수 진단·해결
  • 8. 일본어 OCR(PaddleOCR) 오류 복구 구조 개선
  • 9. 코드 변경 검증·리뷰 자동화
  • 02작업 방식 — Claude Code 활용과 업무 skill화
  • 03협업·운영
  • 04진행 중·다음 단계

이런 글도

  • Python 서버 RSS 가 안 줄어들어 malloc_trim 을 박은 이야기
    진행 기간: 2026.05 > 개념 정리는 Python 서버의 RSS 가 안 줄어드는 이유 — gc.collect 의 한계와 malloctrim 참고. 본 글은 그 개념을 실제 운영 환경에 적용한 작업기. 문서 파싱 API 의 운영을 보다가 워커 프로세스의 실제 메모리 사용량(RSS)이 시간당 약 1.4 GB 씩 증가하는 패턴을 발견했다. PDF·PPTX·...
    📁 system
    system
    2026.05.22
  • 슬롯 당첨 계산 — Decorator 체인 + 우선순위 정렬
    진행 기간: 슬롯 엔진 추상화 작업과 병행 (2025 하반기) 슬롯의 "당첨 금액 계산"은 단순해 보이지만, 실제론 여러 단계의 조합이다. 기본 배당, 프리게임 배수, 프로그레시브 보너스, 멀티플라이어 심볼, 구매 기능(BuyFeature)으로 얻은 추가 배수 등이 층층이 쌓인다. 이걸 하나의 calculateWin() 메서드 안에 분기로 넣기 시작하면,...
    📁 system
    system
    2026.04.19
  • 슬롯 페이 조건 체크 — Factory + 런타임 타입 해석
    진행 기간: 슬롯 엔진 추상화 작업과 병행 (2025 하반기) 슬롯 게임은 "당첨 판정" 로직이 슬롯 타입(Payline, Way 등)에 따라 근본적으로 다르다. 가로줄 기준으로 판정하는 Payline 슬롯과, 릴 조합 경로 수로 판정하는 Way 슬롯(예: 243웨이, 1024웨이)은 파라미터 구조·반환 구조·내부 알고리즘이 전부 다르다. 이걸 처음엔 하나...
    📁 system
    system
    2026.04.19
  • 13개 로케일 다국어 시스템 — Svelte derived 합성 + 백엔드 캐시 사전 구성
    진행 기간: 2023.08 2024.02 스포츠 베팅 플랫폼의 다국어 시스템을 프론트엔드부터 백엔드 캐시까지 설계·구현했다. 글로벌 대응을 위해 13개 로케일을 지원했고, 스포츠 베팅이라는 도메인 특성상 UI 문구뿐 아니라 경기 마켓 이름, 선수 이름 치환, 핸디캡 표기 같은 템플릿 번역까지 필요했다. --- 일반 웹 서비스의 i18n과는 결이 달랐다....
    📁 system
    system
    2026.04.19

댓글 (0)