AI · AGENT
[초안] Agentic Workflow 상태 관리 — LangGraph로 보는 State Graph, Checkpoint, Human-in-the-loop, Tool 권한 경계
도구를 한 번 부르고 끝나는 에이전트는 함수 호출과 다를 게 없다. 진짜 어려움은 에이전트가 여러 step에 걸쳐 오래 살아 있을 때 생긴다. 사용자가 중간에 답을 주길 기다려야 하고, 외부 API가 죽으면 재시도해야 하고, 프로세스가 재시작돼도 진행 중이던 작업을 이어가야 한다. 이때 시스템이 다뤄야 하는 것은 모델의 출력이 아니라 워크플로의 상태(sta...
[초안] Agentic Workflow 평가와 Risk Gate 설계 — Human-in-the-loop와 LLM-as-a-judge
LLM 한 번 호출해서 답을 받는 시스템은 평가가 비교적 단순하다. 입력과 정답을 짝지어 두고, 정확도나 BLEU 같은 지표를 재면 어느 정도 그림이 나온다. 그런데 도구를 여러 번 부르고, 중간 결과를 보고 다음 행동을 정하고, 실패하면 되돌아가는 agentic workflow는 이야기가 다르다. 같은 입력에도 매번 다른 경로를 밟고, 최종 답이 맞아도...
[초안] LLM Tool Calling과 Agent Workflow 설계
LLM은 그 자체로는 "텍스트를 잘 만들어내는 함수"에 가깝다. 사용자의 문의, 예약 변경, 문서 조회, 알림 발송처럼 실제 업무를 처리해야 하는 AI Agent 시스템에서는 모델이 "그럴듯한 답"을 생성하는 것만으로는 충분하지 않다. 진짜 가치는 모델이 외부 시스템을 안전하게 호출하고, 그 결과를 바탕으로 다음 행동을 결정하며, 실패했을 때 사람에게 다시...
[초안] 헬스케어 AI Agent의 멀티턴 메모리 설계 — 시니어 백엔드 관점
헬스케어 도메인의 AI Agent는 일반적인 챗봇과 결정적으로 다르다. 사용자가 "어제 말한 그 약 때문에 속이 쓰려요"라고 하면, agent는 어제의 대화를 떠올려야 하고, 그 사용자의 복용 이력을 알아야 하며, 동시에 그 정보를 영구히 들고 있으면 안 된다. 의료 정보는 민감 정보이고, 잘못된 발화가 환자의 행동을 바꿀 수 있고, 데이터 유출의 임팩트가...