01 / 홈 02 / 카테고리 03 / 시리즈

01 / 홈 02 / 카테고리 03 / 시리즈

카테고리

AI 페이지로 이동
ai 페이지로 이동
algorithm 페이지로 이동
- live-coding 페이지로 이동
- 분산 계산을 위한 알고리즘
apartment 페이지로 이동
- 구리 럭키아파트 24평 인테리어 레퍼런스 모음
architecture 페이지로 이동
database 페이지로 이동
devops 페이지로 이동
http 페이지로 이동
- HTTP Connection Pool
- HTTPS는 어떻게 안전한가 — TLS, 인증서, 그리고 termination
interview 페이지로 이동
java 페이지로 이동
javascript 페이지로 이동
kafka 페이지로 이동
linux 페이지로 이동
- fsync — 리눅스 파일 동기화 시스템 콜
- tmux — Terminal Multiplexer
mlops 페이지로 이동
network 페이지로 이동
python 페이지로 이동
rabbitmq 페이지로 이동
- [초안] RabbitMQ Basics — 실전 백엔드 관점에서 정리하는 메시지 브로커 기본기
- [초안] RabbitMQ vs Kafka — 백엔드 메시징 선택 기준과 실전 운영 관점
security 페이지로 이동
- [초안] 시니어 백엔드를 위한 보안 / 인증 스터디 팩 — Spring Security, JWT, OAuth2, OWASP Top 10
- [초안] Spring Security 6.x OAuth2 + JWT 상용 인증 설계 — Grant 선택, Resource Server, Refresh Rotation, 로그아웃
task 페이지로 이동
testing 페이지로 이동
- [초안] 시니어 Java 백엔드를 위한 테스트 전략 완전 정리 — 피라미드부터 TestContainers, 마이크로벤치, Contract까지
travel 페이지로 이동
- 오사카 3박 4일 일정표: 우메다 쇼핑, USJ, 난바·도톤보리, 오사카성
web 페이지로 이동
- [초안] HTTP / Cookie / Session / Token 인증 기본기 — 레거시 JSP와 모바일 API가 공존하는 백엔드 관점

FOS-BLOG · FOOTERall systems normal·v0.1 · 2026.04.27·seoul, kr

Ffos-blog/study

개발 학습 기록을 정리하는 블로그입니다. 공부하면서 기록하고, 기록하면서 다시 배웁니다.

visitors

01site

Home↗
Posts↗
Categories↗
About↗

02policy

소개/about
개인정보처리방침/privacy
연락처/contact

03categories

AI↗
Algorithm↗
DB↗
DevOps↗
Java/Spring↗
JS/TS↗
React↗
Next.js↗
System↗

04connect

GitHub@jon890↗
Source repositoryjon890/fos-study↗
RSS feed/rss.xml↗
Newsletter매주 1 회 · 한 편의 글→

© 2026 FOS Study. All posts MIT-licensed.

built with·Next.js·Tailwind v4·Geist·Pretendard·oklch

/fos-blog/categories/AI

AI

AI

3폴더·17글·category/AI

READMEAI 시리즈에 대하여

README.md

README.md

AI 에이전트·LLM·RAG·하네스 엔지니어링 학습 기록. 이론편과 실전편을 모두 다룬다.

하위 주제

RAG (Retrieval-Augmented Generation) — 임베딩, 벡터 검색, 실무 사례
LangGraph — 에이전트 워크플로를 그래프로 통제하기
AGENTS.md 포맷 — AI coding agent 동작 지침서
DESIGN.md, Google Stitch, Claude Design — AI 에이전트와 디자인의 새 컨벤션 + fos-blog 6주 도입 회고

Agent 설계 (agent/)

엔터프라이즈 AI Agent 설계 — reasoning, tool, memory, cost, governance를 운영 시스템으로 묶는 허브 문서
LLM Tool Calling 에이전트 워크플로 — Tool Use 루프, 결정성/관측성 설계
멀티턴 메모리 헬스케어 에이전트 — 4계층 메모리, 헬스케어 도메인 특화 정책
Agentic Workflow 상태 관리 — LangGraph State Graph, Checkpoint, HITL, Tool 권한 경계
Agentic Workflow 평가와 Risk Gate — 궤적 평가, LLM-as-a-judge, HITL, 안전 게이트

평가와 운영 (Applied AI)

LLM 평가 프레임워크 — 골든셋·회귀 테스트·LLM-as-a-judge·사람 피드백 루프
AI 제품 백엔드 안정성 — 지연·비용·도구 실패·폴백/재시도/사람 에스컬레이션

하네스 엔지니어링

하네스 엔지니어링 이론편 — 개념, Anthropic/Fowler 사례, 설계 원칙
하네스 엔지니어링 실전편 — 4인 에이전트 팀 파이프라인의 진화

에이전트 프레임워크

OpenClaw는 context와 memory를 어떻게 관리하나 — SOUL.md·MEMORY.md·progressive disclosure·heartbeat, 나만의 에이전트 구성
OpenClaw vs Hermes Agent — 메모리·구성·UI·self-improving 비교, 갈아탈지 선택 가이드

Claude Code

Claude Code 스킬 시스템
Claude Teams 기본 개념 — Agent Teams, SendMessage, 에이전트 타입
Claude Code 11일 사용 회고 — 1탄: 데이터로 본 사용 패턴
Claude Code 5주 더 쓴 결과 — 2탄: 스킬·CLAUDE.md를 키워가는 방식
Claude Code 메모리 규칙 — CLAUDE.md와 .claude/rules를 규칙으로 쓰는 법

방법론

BMAD Method — AI 에이전트로 애자일 개발하는 방법론
AI 에이전트와 함께 MVP 만들기 (dooray-cli 사례)
SkillOpt — 스킬 문서를 신경망처럼 학습시킨다 — 텍스트 공간 옵티마이저, 검증 게이트, 개인 스킬 적용 한계

멀티모달

멀티모달 LLM — 이미지·음성을 함께 다루는 모델

문서 도구

Docling — IBM Research 문서 변환 툴킷

01하위 폴더

3 folders

agent

langgraph

RAG

02이 폴더의 글

17 posts

agents.md

- agents.md는 AI coding agent(예: GitHub Copilot)의 동작 지침서 역할을 하는 문서 - 프로젝트에서 AI 에이전트가 어떤 역할을 수행해야 하는지, 어떤 정보가 필요한지, 무엇을 건드리면 안 되는지 명확히 알려주는 문서. 엄밀히 정해진 표준은 아니지만 사실상 관례로 굳어진 형식이다 (뒤에서 다시 다룬다) 다르게 보면, 사람...

AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design

1년 안에 디자인-개발 경계에서 셋이 동시에 등장했다. 2025년 5월 구글 I/O에서 Stitch가 발표됐고, 2026년 3월 그 안에서 DESIGN.md 포맷이 따로 오픈소스로 떨어졌고, 같은 해 4월에 Anthropic Labs가 Claude Design을 띄웠다. 같은 달에 VoltAgent의 awesome-design-md 같은 71개 브랜드 DE...

AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례

이미 사내에 공유된 dooray-cli 구현체가 있다는 것은 알고 있었습니다. 완전히 처음부터 구현한 것은 아니고, 기존에 만들어둔 dooray-mcp-server를 CLI로 포팅하면서 에이전트 하네스 엔지니어링을 실험해본 것입니다. 여기에 메일 연동이나 파일 첨부 같은 기능도 직접 추가해보며, 에이전트가 자율적으로 동작할 수 있는 환경을 구축하는 방법론을...

BMAD Method — AI 에이전트로 애자일 개발하는 방법론

AI 코딩 도구를 사용할 때 늘 부딪히는 문제가 있다. 자연어 프롬프트로 코드를 빠르게 만들 수는 있는데, 프로젝트가 커질수록 AI가 생성한 코드의 의도와 결정 과정이 불투명해진다. 어느 순간부터 "이 코드가 왜 이렇게 돼 있지?"를 추적하기 어려워진다. BMAD Method는 이 문제를 정면으로 다루는 오픈소스 방법론이다. 새 프로젝트에 적용해보기 전에...

Claude Code 멀티 에이전트 — Teams

Claude Code는 단일 에이전트로 동작하는 것 외에, 여러 전문화된 에이전트를 조율해서 복잡한 작업을 병렬로 처리하는 팀 구조를 지원한다. --- Claude Code는 Agent 도구로 하위 에이전트(서브프로세스)를 생성할 수 있다. 각 에이전트는 독립된 컨텍스트를 갖고, 자신에게 할당된 도구 셋과 역할로 동작한다. 오케스트레이터 (메인 Claude...

Claude Code 메모리: CLAUDE.md와 .claude/rules를 규칙으로 쓰는 법

진행 기간: 2026.06 Claude Code로 한 레포를 오래 다루다 보면 "매번 같은 걸 다시 설명하는" 순간이 온다. PR 본문은 이렇게 써라, Dooray 업무 제목은 이 형식이다, 한국어로 풀어 써라. 이걸 어디에 적어둬야 Claude가 실제로 지키는지 — 그게 이 글의 주제다. 나는 그동안 이런 규칙을 프로젝트 안 .claude/skills/s...

Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴

> 시리즈 1탄. 후속편: Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식 Claude Code 사용 이력을 분석하는 기능이 생겼길래 돌려봤다. 11일치 세션 데이터를 보니 생각보다 솔직한 결과가 나왔다. 잘 됐던 것, 안 됐던 것이 숫자로 찍혀 있으니 부정하기가 어렵다. 수치부터 보면: 549 메시지, 42 세션, 10...

Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식

1탄을 쓴 게 4월 1일이니 5주 정도 지났다. 그때 글의 마지막 인사이트가 "반복 작업은 스킬로 만들 것" 한 줄이었다. 그 한 줄이 이후 5주 동안 어떻게 굴러갔는지 정리해두려고 한다. 11일 회고는 결과 분석에 가까웠다. 549 메시지·42 세션·108 커밋 같은 수치가 중심이었고, 잘됐던 것·안됐던 것·인사이트가 각각 한 칸씩 차지했다. 이번 글은...

Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원

최근 Claude Code를 쓰면서 느낀 생각이 있다. "이게 진짜 내 개발 경험을 바꿀 수 있겠다"는 확신이었다. 특히 Skill 시스템이라는 개념을 알게 된 이후로는 더욱 그렇다. 혹시 Claude Code를 써본 적 있는가? 그렇다면 /commit, /review-pr, /pdf 같은 명령어들을 마주쳤을 것이다. 이것들이 바로 Skill이다. 마치 터...

Docling — IBM Research 의 문서 파싱 toolkit 상세 정리

문서를 RAG·LLM 컨텍스트로 넣으려면 PDF·PPTX·HTML 같은 입력을 깨끗한 텍스트 (또는 markdown / JSON) 으로 변환해야 한다. 이걸 "쉽게" 해주는 라이브러리는 의외로 많지 않다. 표가 있는 PDF, 스캔본, 다단 레이아웃, 페이지 안의 그림과 캡션 같은 변형이 많기 때문. Docling 은 IBM Research (Zurich)...

OpenClaw vs Hermes Agent — 갈아탈까 고민하며 정리한 비교

지금 나는 OpenClaw로 개인 에이전트를 돌리고 있다. 잘 동작하지만, 에이전트를 여러 개 구성하고 그 위에 제대로 된 화면을 얹는 그림을 그리다 보니 Hermes Agent가 자꾸 눈에 들어온다. 갈아탈지 말지를 결정하기 전에, 두 프레임워크가 메모리·구성·UI·자기개선에서 실제로 무엇이 다른지 공식 문서 기준으로 정리했다. OpenClaw 자체의 내...

OpenClaw는 context와 memory를 어떻게 관리하나 — 나만의 에이전트를 구성하는 법

OpenClaw를 쓰면서 "이 에이전트가 어제 일을 어떻게 기억하지?", "긴 대화가 쌓이면 context는 어떻게 관리되지?" 가 궁금해졌다. config 파일 몇 개만 만지면 에이전트가 살아 움직이는데, 그 안에서 무슨 일이 벌어지는지 알아야 내가 원하는 대로 길들일 수 있다. 이 글은 OpenClaw의 context·memory 관리 방식을 공식 문서...

멀티모달 LLM (Multimodal Large Language Model)

- 여러 종류의 입력을 동시에 이해하고 처리할 수 있는 LLM - 즉, 기존 LLM이 텍스트만 이해했다면, 멀티모달 LLM은 다음을 모두 처리할 수 있다 - 텍스트 - 이미지 - 음성 - 비디오 - 코드 이미지와 텍스트를 함께 다루는 모델을 특히 VLM(Vision-Language Model)이라고 부른다. 요즘 쓰는 GPT-4o, Claude, Gemin...

사람용 CLI와 AI 에이전트용 CLI는 설계가 다르다

예전에는 CLI를 사람만 썼다. 지금은 Claude Code 같은 AI 에이전트가 CLI를 호출해 업무를 자동화한다. 같은 도구라도 "에이전트가 쓰기 좋게" 설계하면 자동화가 훨씬 매끄럽고, 그러지 않으면 자동화가 자주 깨진다. 여러 업무 자동화 CLI를 직접 만들어 에이전트로 호출해 보면서 정리한 설계 원칙을 공유한다. (예시는 공개한 개인 도구 door...

스킬 문서를 신경망처럼 학습시킨다 — Microsoft SkillOpt 분석

나는 Claude Code 위에서 30개가 넘는 개인 스킬(skill)을 운영한다. 블로그 글 작성, 이력서 갱신, 주간보고, 사내 결재 자동화 같은 반복 워크플로우를 각각 SKILL.md 한 장으로 정의해두고 쓴다. 이 스킬들은 시간이 지나면서 점점 커진다. 한 번 실수하면 "이런 함정이 있더라"를 문서에 적어두고, 다음에 같은 실수를 피하는 식이다. 그...

하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계

AI 에이전트가 복잡한 작업을 수행하게 하면서 한 가지 사실을 깨달았다. 프롬프트를 잘 짜는 것만으로는 한계가 있다. 에이전트가 몇 시간 동안 돌아가는 작업을 수행할 때 생기는 문제는 모델이 멍청해서가 아니라, 에이전트를 둘러싼 구조(harness)가 없기 때문이다. 20252026년을 기점으로 "하네스 엔지니어링(Harness Engineering)"이라...

하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기

이론은 알겠다. 생성과 평가를 분리하라. 상태를 파일에 외부화하라. Initializer-Executor 패턴으로 세션 간 기억을 만들어라. (→ 하네스 엔지니어링 이론편) 그런데 막상 이걸 실제 코딩 워크플로우에 적용하려고 하면 손이 잘 안 간다. "어떤 에이전트를 몇 개 만들어야 하는가", "critic이 REVISE를 냈을 때 어떻게 처리하는가", "...