AI
AI 에이전트·LLM·RAG·하네스 엔지니어링 학습 기록. 이론편과 실전편을 모두 다룬다.
agents.md
- agents.md는 AI coding agent(예: GitHub Copilot)의 동작 지침서 역할을 하는 문서 - 프로젝트에서 AI 에이전트가 어떤 역할을 수행해야 하는지, 어떤 정보가 필요한지, 무엇을 건드리면 안 되는지 명확히 알려주는 문서. 엄밀히 정해진 표준은 아니지만 사실상 관례로 굳어진 형식이다 (뒤에서 다시 다룬다) 다르게 보면, 사람...
AI 에이전트와 디자인의 새 컨벤션 — DESIGN.md, Google Stitch, Claude Design
1년 안에 디자인-개발 경계에서 셋이 동시에 등장했다. 2025년 5월 구글 I/O에서 Stitch가 발표됐고, 2026년 3월 그 안에서 DESIGN.md 포맷이 따로 오픈소스로 떨어졌고, 같은 해 4월에 Anthropic Labs가 Claude Design을 띄웠다. 같은 달에 VoltAgent의 awesome-design-md 같은 71개 브랜드 DE...
AI 에이전트와 함께 MVP 만들기 — dooray-cli 사례
이미 사내에 공유된 dooray-cli 구현체가 있다는 것은 알고 있었습니다. 완전히 처음부터 구현한 것은 아니고, 기존에 만들어둔 dooray-mcp-server를 CLI로 포팅하면서 에이전트 하네스 엔지니어링을 실험해본 것입니다. 여기에 메일 연동이나 파일 첨부 같은 기능도 직접 추가해보며, 에이전트가 자율적으로 동작할 수 있는 환경을 구축하는 방법론을...
BMAD Method — AI 에이전트로 애자일 개발하는 방법론
AI 코딩 도구를 사용할 때 늘 부딪히는 문제가 있다. 자연어 프롬프트로 코드를 빠르게 만들 수는 있는데, 프로젝트가 커질수록 AI가 생성한 코드의 의도와 결정 과정이 불투명해진다. 어느 순간부터 "이 코드가 왜 이렇게 돼 있지?"를 추적하기 어려워진다. BMAD Method는 이 문제를 정면으로 다루는 오픈소스 방법론이다. 새 프로젝트에 적용해보기 전에...
Claude Code 멀티 에이전트 — Teams
Claude Code는 단일 에이전트로 동작하는 것 외에, 여러 전문화된 에이전트를 조율해서 복잡한 작업을 병렬로 처리하는 팀 구조를 지원한다. --- Claude Code는 Agent 도구로 하위 에이전트(서브프로세스)를 생성할 수 있다. 각 에이전트는 독립된 컨텍스트를 갖고, 자신에게 할당된 도구 셋과 역할로 동작한다. 오케스트레이터 (메인 Claude...
Claude Code 메모리: CLAUDE.md와 .claude/rules를 규칙으로 쓰는 법
진행 기간: 2026.06 Claude Code로 한 레포를 오래 다루다 보면 "매번 같은 걸 다시 설명하는" 순간이 온다. PR 본문은 이렇게 써라, Dooray 업무 제목은 이 형식이다, 한국어로 풀어 써라. 이걸 어디에 적어둬야 Claude가 실제로 지키는지 — 그게 이 글의 주제다. 나는 그동안 이런 규칙을 프로젝트 안 .claude/skills/s...
Claude Code를 11일 동안 쓴 결과 — 데이터로 본 나의 사용 패턴
> 시리즈 1탄. 후속편: Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식 Claude Code 사용 이력을 분석하는 기능이 생겼길래 돌려봤다. 11일치 세션 데이터를 보니 생각보다 솔직한 결과가 나왔다. 잘 됐던 것, 안 됐던 것이 숫자로 찍혀 있으니 부정하기가 어렵다. 수치부터 보면: 549 메시지, 42 세션, 10...
Claude Code를 5주 더 쓴 결과 — 스킬·CLAUDE.md를 키워가는 방식
1탄을 쓴 게 4월 1일이니 5주 정도 지났다. 그때 글의 마지막 인사이트가 "반복 작업은 스킬로 만들 것" 한 줄이었다. 그 한 줄이 이후 5주 동안 어떻게 굴러갔는지 정리해두려고 한다. 11일 회고는 결과 분석에 가까웠다. 549 메시지·42 세션·108 커밋 같은 수치가 중심이었고, 잘됐던 것·안됐던 것·인사이트가 각각 한 칸씩 차지했다. 이번 글은...
Claude Code의 Skill 시스템 - 개발자를 위한 AI 자동화의 새로운 차원
최근 Claude Code를 쓰면서 느낀 생각이 있다. "이게 진짜 내 개발 경험을 바꿀 수 있겠다"는 확신이었다. 특히 Skill 시스템이라는 개념을 알게 된 이후로는 더욱 그렇다. 혹시 Claude Code를 써본 적 있는가? 그렇다면 /commit, /review-pr, /pdf 같은 명령어들을 마주쳤을 것이다. 이것들이 바로 Skill이다. 마치 터...
Docling — IBM Research 의 문서 파싱 toolkit 상세 정리
문서를 RAG·LLM 컨텍스트로 넣으려면 PDF·PPTX·HTML 같은 입력을 깨끗한 텍스트 (또는 markdown / JSON) 으로 변환해야 한다. 이걸 "쉽게" 해주는 라이브러리는 의외로 많지 않다. 표가 있는 PDF, 스캔본, 다단 레이아웃, 페이지 안의 그림과 캡션 같은 변형이 많기 때문. Docling 은 IBM Research (Zurich)...
OpenClaw vs Hermes Agent — 갈아탈까 고민하며 정리한 비교
지금 나는 OpenClaw로 개인 에이전트를 돌리고 있다. 잘 동작하지만, 에이전트를 여러 개 구성하고 그 위에 제대로 된 화면을 얹는 그림을 그리다 보니 Hermes Agent가 자꾸 눈에 들어온다. 갈아탈지 말지를 결정하기 전에, 두 프레임워크가 메모리·구성·UI·자기개선에서 실제로 무엇이 다른지 공식 문서 기준으로 정리했다. OpenClaw 자체의 내...
OpenClaw는 context와 memory를 어떻게 관리하나 — 나만의 에이전트를 구성하는 법
OpenClaw를 쓰면서 "이 에이전트가 어제 일을 어떻게 기억하지?", "긴 대화가 쌓이면 context는 어떻게 관리되지?" 가 궁금해졌다. config 파일 몇 개만 만지면 에이전트가 살아 움직이는데, 그 안에서 무슨 일이 벌어지는지 알아야 내가 원하는 대로 길들일 수 있다. 이 글은 OpenClaw의 context·memory 관리 방식을 공식 문서...
멀티모달 LLM (Multimodal Large Language Model)
- 여러 종류의 입력을 동시에 이해하고 처리할 수 있는 LLM - 즉, 기존 LLM이 텍스트만 이해했다면, 멀티모달 LLM은 다음을 모두 처리할 수 있다 - 텍스트 - 이미지 - 음성 - 비디오 - 코드 이미지와 텍스트를 함께 다루는 모델을 특히 VLM(Vision-Language Model)이라고 부른다. 요즘 쓰는 GPT-4o, Claude, Gemin...
사람용 CLI와 AI 에이전트용 CLI는 설계가 다르다
예전에는 CLI를 사람만 썼다. 지금은 Claude Code 같은 AI 에이전트가 CLI를 호출해 업무를 자동화한다. 같은 도구라도 "에이전트가 쓰기 좋게" 설계하면 자동화가 훨씬 매끄럽고, 그러지 않으면 자동화가 자주 깨진다. 여러 업무 자동화 CLI를 직접 만들어 에이전트로 호출해 보면서 정리한 설계 원칙을 공유한다. (예시는 공개한 개인 도구 door...
스킬 문서를 신경망처럼 학습시킨다 — Microsoft SkillOpt 분석
나는 Claude Code 위에서 30개가 넘는 개인 스킬(skill)을 운영한다. 블로그 글 작성, 이력서 갱신, 주간보고, 사내 결재 자동화 같은 반복 워크플로우를 각각 SKILL.md 한 장으로 정의해두고 쓴다. 이 스킬들은 시간이 지나면서 점점 커진다. 한 번 실수하면 "이런 함정이 있더라"를 문서에 적어두고, 다음에 같은 실수를 피하는 식이다. 그...
하네스 엔지니어링 — 오래 실행되는 AI 에이전트를 위한 설계
AI 에이전트가 복잡한 작업을 수행하게 하면서 한 가지 사실을 깨달았다. 프롬프트를 잘 짜는 것만으로는 한계가 있다. 에이전트가 몇 시간 동안 돌아가는 작업을 수행할 때 생기는 문제는 모델이 멍청해서가 아니라, 에이전트를 둘러싼 구조(harness)가 없기 때문이다. 20252026년을 기점으로 "하네스 엔지니어링(Harness Engineering)"이라...
하네스 엔지니어링 실전 — 4인 에이전트 팀으로 코딩 파이프라인 구축하기
이론은 알겠다. 생성과 평가를 분리하라. 상태를 파일에 외부화하라. Initializer-Executor 패턴으로 세션 간 기억을 만들어라. (→ 하네스 엔지니어링 이론편) 그런데 막상 이걸 실제 코딩 워크플로우에 적용하려고 하면 손이 잘 안 간다. "어떤 에이전트를 몇 개 만들어야 하는가", "critic이 REVISE를 냈을 때 어떻게 처리하는가", "...