TASK · AI-SERVICE-TEAM
회사: NHN | 팀: AI 서비스 개발팀
AI 서비스 플랫폼에서 진행한 주요 업무를 정리한 문서 모음. (2025.12 ~)
| 기간 | 업무 | 문서 |
|---|---|---|
| 2026.01 ~ 2026.03 | Confluence 벡터 색인 배치 — RAG 파이프라인, Spring Batch, OpenSearch | rag-vector-search-batch.md |
| 2026.04 | AI 웹툰 제작 도구 MVP — Next.js + Gemini + 하네스 기반 12일 풀스택 | webtoon-maker-ai-pipeline.md |
| 기간 | 업무 | 문서 |
|---|---|---|
| 2026.04 | OCR 서버 배포·스케일인 시 503 에러 수정 — Graceful Shutdown 미적용 | graceful-shutdown-503-fix.md |
| 2026.05 | Python 서버 RSS 누수 — gc.collect 한계, malloc_trim 적용 | glibc-malloc-trim-python-leak.md |
| 기간 | 업무 | 문서 |
|---|---|---|
| 2026.03 | 임베딩 메타데이터 구성 개선 — Blocklist → Allowlist, EmbeddingMetadataProvider | embedding-metadata-provider.md |
AsyncItemProcessor), 삭제 동기화, 다중 스페이스 지원EmbeddingMetadataProvider 인터페이스 도입으로 OCP 준수drain_listeners 후 SIGTERM 즉시 종료로 발생한 30~60초 503 묶음 — gRPC 서버에 graceful shutdown 적용해 preStop sleep 동안 in-flight 요청을 마저 처리하도록 종료 시퀀스 재정렬/planning → /plan-and-build → /build-with-teams, 디자이너 통합용 /integrate-ux 스킬화Spring Boot 3.x Java 21 Spring Batch OpenSearch RAG Vector Search Next.js 16 React 19 Prisma 7 Zod 4 Gemini 3 @google/genai SSE Claude Code 하네스
12일간 AI 웹툰 제작 도구 MVP 만들기 — 하네스 파이프라인으로 혼자 풀스택 돌리기
진행 기간: 2026.04.06 2026.04.30 (전반 12일 MVP + 후반 12일 안정화·운영 단계) 웹소설 원작을 받아 운영자가 작가 없이 웹툰 컷 이미지까지 뽑아내는 MVP를 짧은 기간에 만들어 보자는 사내 과제가 떨어졌다. 참여 인원은 나 한 명이었고, 프론트/백/DB/AI 파이프라인을 전부 내가 붙여야 하는 상황이었다. 요구한 범위가 좁지 않...
Confluence 문서를 OpenSearch에 벡터 색인하기 — Spring Batch 파이프라인 설계기
진행 기간: 2026.01 2026.03 사내 AI 서비스에 RAG 기능을 붙이기 위해 Confluence 문서를 벡터 DB에 색인하는 배치 파이프라인을 처음부터 설계하고 구현했다. 단순히 텍스트를 긁어 넣는 것부터 시작해서, 댓글·첨부파일 처리, 삭제 동기화, 다중 스페이스 지원까지 점진적으로 확장한 과정을 정리했다. --- AI Playground는 사...
OCR 서버 배포·스케일인 시 503 에러 수정 — Graceful Shutdown 미적용
진행 기간: 2026.04 > Graceful shutdown 개념은 devops/graceful-shutdown.md 참고 --- General OCR 서비스를 배포(롤링 업데이트)하거나 오토스케일러가 스케일인할 때마다 짧은 시간 동안 503 에러가 클러스터 단위로 발생했다. 에러 로그를 보면 패턴이 일정했다. upstream connect error o...
Playground 문서 파싱 파이프라인 — 기여 개요
진행 기간: 2026.05 (진행 중) AI 서비스 개발팀의 사내 LLM 워크플로 제품 Playground는 다양한 형식의 문서를 입력으로 받는다. 이 입력을 LLM이 다룰 수 있는 markdown으로 정규화하는 문서 파싱 서비스를 맡아 운영·개선했다. OCR 제품을 만드는 게 아니라, OCR을 활용해 문서를 markdown으로 변환하는 서비스다. - 스택...
Python 서버 RSS 가 안 줄어들어 malloc_trim 을 박은 이야기
진행 기간: 2026.05 > 개념 정리는 Python 서버의 RSS 가 안 줄어드는 이유 — gc.collect 의 한계와 malloctrim 참고. 본 글은 그 개념을 실제 운영 환경에 적용한 작업기. 문서 파싱 API 의 운영을 보다가 워커 프로세스의 실제 메모리 사용량(RSS)이 시간당 약 1.4 GB 씩 증가하는 패턴을 발견했다. PDF·PPTX·...
임베딩 메타데이터 구성 방식 개선 — Blocklist에서 Allowlist로
진행 기간: 2026.03 RAG 파이프라인에서 임베딩 API에 전달할 메타데이터를 구성하는 방식을 blocklist(remove)에서 allowlist(provider) 방식으로 전환했다. 전략 패턴을 실제로 적용한 리팩터링 경험을 정리했다. > 전략 패턴 개념 정리: 디자인 패턴 - 전략 패턴 --- RAG 파이프라인은 Confluence, 사내 협업...