📚FOS Study
홈카테고리
홈카테고리

카테고리

  • AI 페이지로 이동
    • RAG 페이지로 이동
    • agents 페이지로 이동
    • BMAD Method — AI 에이전트로 애자일 개발하는 방법론
    • Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
    • Claude Code 멀티 에이전트 — Teams
    • 멀티모달 LLM (Multimodal Large Language Model)
  • architecture 페이지로 이동
    • 캐시 설계 전략 총정리
    • 디자인 패턴
    • 분산 트랜잭션
  • css 페이지로 이동
    • FlexBox 페이지로 이동
  • database 페이지로 이동
    • mysql 페이지로 이동
    • opensearch 페이지로 이동
    • redis 페이지로 이동
    • 김영한의-실전-데이터베이스-설계 페이지로 이동
    • 커넥션 풀 크기는 얼마나 조정해야할까?
    • 인덱스 - DB 성능 최적화의 핵심
    • 역정규화 (Denormalization)
    • 데이터 베이스 정규화
  • devops 페이지로 이동
    • docker 페이지로 이동
    • k8s 페이지로 이동
    • k8s-in-action 페이지로 이동
    • monitoring 페이지로 이동
  • go 페이지로 이동
    • Go 언어 기본 학습
  • http 페이지로 이동
    • HTTP Connection Pool
  • interview 페이지로 이동
    • 210812 페이지로 이동
    • 뱅크샐러드 AI Native Server Engineer
    • CJ 올리브영 지원 문항
    • CJ 올리브영 커머스플랫폼유닛 Back-End 개발 지원 자료
    • 마이리얼트립 - Platform Solutions실 회원주문개발 Product Engineer
    • NHN 서비스개발센터 AI서비스개발팀
    • nhn gameenvil console backend 직무 인터뷰 준비
    • 면접을 대비해봅시다
    • Tossplace Node.js Developer
    • 토스플레이스 Node.js 백엔드 컬처핏
  • java 페이지로 이동
    • jdbc 페이지로 이동
    • opentelemetry 페이지로 이동
    • spring 페이지로 이동
    • spring-batch 페이지로 이동
    • 더_자바_코드를_조작하는_다양한_방법 페이지로 이동
    • Java의 로깅 환경
    • MDC (Mapped Diagnostic Context)
    • OpenTelemetry 란 무엇인가?
    • Java StampedLock — 읽기 폭주에도 쓰기가 밀리지 않는 락
    • Virtual Thread와 Project Loom
  • javascript 페이지로 이동
    • Data_Structures_and_Algorithms 페이지로 이동
    • Heap 페이지로 이동
    • typescript 페이지로 이동
    • AbortController
    • Async Iterator와 제너레이터
    • CommonJS와 ECMAScript Modules
    • 제너레이터(Generator)
    • Http Client
    • Node.js
    • npm vs pnpm 선택기준은 무엇인가요?
    • `setImmediate()`
  • kafka 페이지로 이동
    • Kafka 기본
    • Kafka를 사용하여 **데이터 정합성**은 어떻게 유지해야 할까?
    • 메시지 전송 신뢰성
  • linux 페이지로 이동
    • fsync — 리눅스 파일 동기화 시스템 콜
    • tmux — Terminal Multiplexer
  • network 페이지로 이동
    • L2(스위치)와 L3(라우터)의 역할 차이
    • L4와 VIP(Virtual IP Address)
    • IP Subnet
  • react 페이지로 이동
    • JSX 페이지로 이동
    • VirtualDOM 페이지로 이동
    • v16 페이지로 이동
  • task 페이지로 이동
    • ai-service-team 페이지로 이동
    • nsc-slot 페이지로 이동
    • the-future-company 페이지로 이동
📚FOS Study

개발 학습 기록을 정리하는 블로그입니다.

바로가기

  • 홈
  • 카테고리

소셜

  • GitHub
  • Source Repository

© 2025 FOS Study. Built with Next.js & Tailwind CSS

목록으로 돌아가기
🗄️database

역정규화 (Denormalization)

약 3분
2026년 3월 24일
2026년 3월 24일 수정
GitHub에서 보기

역정규화 (Denormalization)

정규화된 테이블 구조를 의도적으로 되돌려 조회 성능을 개선하는 기법. 데이터 중복을 감수하고 JOIN을 줄이거나 집계 연산을 미리 계산해두는 방식이다.


왜 역정규화가 필요한가

정규화는 데이터 무결성과 저장 공간 효율을 위한 것이다. 하지만 정규화가 높을수록 조회 시 여러 테이블을 JOIN해야 한다. 데이터가 많아지면 이 JOIN 비용이 성능 병목이 된다.

정규화 우선: 쓰기 성능 좋음, 읽기 성능 나쁠 수 있음
역정규화:    읽기 성능 좋음, 쓰기 복잡도 증가 + 데이터 중복

역정규화는 "읽기가 쓰기보다 훨씬 많은" 상황에서 고려한다.


역정규화 종류

1. 릴레이션 병합

자주 함께 조회되는 두 테이블을 하나로 합친다.

-- before: 매번 JOIN 필요
SELECT u.name, p.bio FROM users u JOIN profiles p ON u.id = p.user_id;

-- after: 단일 테이블 조회
SELECT name, bio FROM users;
-- users 테이블에 bio 컬럼 추가

단점: users 테이블에 nullable 컬럼이 늘어난다.

2. 릴레이션 분할

자주 쓰는 컬럼과 드물게 쓰는 컬럼을 분리한다.

  • 수직 분할: 컬럼 기준. users → users(기본 정보) + user_details(부가 정보)
  • 수평 분할: 행 기준. 최근 1년 주문 / 이전 주문 테이블 분리 (파티셔닝과 유사)

3. 파생 속성 추가 (Derived Column)

매번 집계 연산하는 값을 컬럼으로 저장한다.

-- before: 주문 수를 매번 COUNT
SELECT u.id, COUNT(o.id) as order_count
FROM users u LEFT JOIN orders o ON u.id = o.user_id
GROUP BY u.id;

-- after: users 테이블에 order_count 컬럼 추가
-- 주문 생성/삭제 시 order_count 업데이트
UPDATE users SET order_count = order_count + 1 WHERE id = ?;

장점: 사용자 목록 조회 시 JOIN 없이 집계값 바로 반환 단점: 쓰기 시 두 곳 업데이트 필요, 동기화 오류 위험


실무에서 언제 쓰는가

조회 캐시 대신 역정규화

Redis 같은 캐시를 도입하기 전에, 집계값을 DB에 미리 계산해두는 방식으로 먼저 해결하는 경우가 있다. 좋아요 수, 댓글 수, 팔로워 수 등이 대표적이다.

-- posts 테이블에 like_count 컬럼 유지
-- like 이벤트 발생 시 atomic하게 업데이트
UPDATE posts SET like_count = like_count + 1 WHERE id = ?;

RAG/검색 인덱스

OpenSearch나 Elasticsearch에 문서를 색인할 때, RDB의 여러 테이블에 흩어진 데이터를 하나의 문서로 합쳐서 저장한다. 이것도 역정규화의 일종이다.

{
  "doc_id": "123",
  "title": "...",
  "author_name": "김철수",   // users 테이블에서 가져온 값
  "project_name": "프로젝트A", // projects 테이블에서 가져온 값
  "content": "..."
}

CQRS 패턴

Command(쓰기)와 Query(읽기) 모델을 분리하는 CQRS에서, 읽기 전용 모델은 역정규화된 형태로 관리한다. 쓰기는 정규화된 DB에, 읽기는 역정규화된 Read Model(RDB 또는 검색엔진)을 사용한다.


주의사항

역정규화는 데이터 정합성 관리 비용을 증가시킨다. 원본 데이터가 바뀔 때 역정규화된 컬럼도 함께 업데이트해야 한다. 트랜잭션으로 묶지 않으면 불일치가 발생한다.

  • 역정규화 전에 먼저 인덱스 최적화와 쿼리 튜닝을 시도한다
  • 조회 성능 문제가 실제로 측정됐을 때 적용한다 (추측으로 도입 금지)
  • 업데이트 빈도와 조회 빈도를 비교해서 트레이드오프를 확인한다
database 카테고리의 다른 글 보기수정 제안하기

댓글

댓글을 불러오는 중...
목차
  • 역정규화 (Denormalization)
  • 왜 역정규화가 필요한가
  • 역정규화 종류
  • 1. 릴레이션 병합
  • 2. 릴레이션 분할
  • 3. 파생 속성 추가 (Derived Column)
  • 실무에서 언제 쓰는가
  • 조회 캐시 대신 역정규화
  • RAG/검색 인덱스
  • CQRS 패턴
  • 주의사항