목록으로
업무 생산성 개선을 위한 AI 활용
통제된 AI 비서: 직장인 1명이 만든 디지털 직원 시스템
👤 붉은부엉이512 📅 2026-04-28 👁 조회 49
로컬 AI 비서로 하루 일을 10분에, 한 달 일을 5시간에 — 통제된 AI 시스템
① 어떤 상황에서 AI를 활용했나요?
회계 담당으로 일하면서 두 가지 상황을 동시에 마주칩니다.
첫째, 새 안건이 떨어지면 가장 먼저 "최근 2년 동안 우리 팀이 이 건과 관련해 뭘 했는지"를 정리해야 합니다. 검토자료, 전자결재 기안, 결재 회신, 전표, 회의 메모가 시스템 다섯 군데에 흩어져 있고, 누가 정리해 둔 것도 아닙니다. 자료를 모아 시간순으로 줄 세우는 일에만 하루가 통째로 사라졌습니다. 게다가 이건 회사 내부 자료라 외부 클라우드 AI로는 절대 보낼 수 없습니다.
둘째, 1년에 한 번 정도 "한 사람이 손으로 하면 한 달이 걸리는 큰 작업"이 떨어집니다. 콘텐츠 3~4만 건 규모의 면세 적용 요건 검토 같은 일입니다. 옛날에는 공공 서지 DB 사이트에 들어가 제목·저자로 한 건씩 검색하며 매칭했고, 그렇게 한 달짜리 작업이 됐습니다.
처음에는 ChatGPT·Claude 같은 일반 AI를 시도했지만 세 가지 한계가 있었습니다. 첫째, 환각(Hallucination) — AI가 자신 없는 부분을 자신 있게 답합니다. 둘째, 목표 해킹(Goal Hacking) — 분류 기준이나 판정 룰을 명시해도 효율을 명목으로 우회했습니다. 셋째, 회사 자료를 외부 클라우드로 보낼 수 없다는 보안 한계.
그래서 "AI를 더 똑똑하게 쓰는 법"이 아니라 "AI를 통제해서 안전하게 쓰는 법"을 1년 이상 매일 다듬어 왔습니다. 매일의 자료 정리부터 1년에 한 번 있는 큰 작업까지, 같은 룰 위에서 안전하게 처리하는 시스템을 만들었습니다.
② 어떤 AI를 어떻게 활용했나요?
다음 도구를 결합해 "매일 반복되는 자료 통합 조회"와 "1년에 한 번 떨어지는 한 달짜리 큰 작업"을 같은 시스템 위에서 처리하도록 설계했습니다.
• Ollama + qwen2.5:3b (로컬 LLM) + nomic-embed-text (로컬 임베딩): 회사 자료(검토자료·전자결재·전표 등 최근 2년치)를 본인 컴퓨터 안에서 인덱싱·답변. 외부 클라우드로 일체 전송하지 않는 "개인 업무비서"의 핵심.
• Claude Code (Anthropic의 CLI 환경): 전체 시스템의 하네스. 10명의 디지털 직원 — writer(글쓰기), designer(시각화), developer(코드·자동화), scheduler(일정), data(데이터 정리), research(조사), review(검토), curator(지식 관리), dispatcher(외부 발송), verifier(최종 검증) — 을 별도 마크다운 파일로 정의하고, 작업 유형에 따라 자동 라우팅합니다. 큰 작업은 orchestrator → searcher → verifier 3단 검증으로 처리합니다.
• Claude API (claude-haiku-4-5): 정밀 답변이 필요한 작업에 호출. 단, 회사 자료가 포함된 작업은 절대 호출되지 않습니다.
• 자체 라우터(llm_router.py): 토큰 길이·키워드·민감도 기준으로 로컬/클라우드 자동 분기. 회사 자료 키워드 감지 시 강제로 로컬 분기.
• Telegram Bot API + 자체 봇: 출퇴근길에 한 줄 메시지를 보내면 inbox 큐에 저장되고, 시스템이 5분마다 폴링해 작업 후 결과를 텔레그램으로 회신.
• Obsidian (Vault): 도메인 지식을 저장하는 위키. AI와 사람이 같은 노트를 함께 편집.

핵심 차별점은 도구 자체보다 그 위에 얹은 두 가지 레이어입니다. (1) 회사 자료는 로컬 LLM에서만 처리하는 강제 라우팅. (2) 6개의 절대 룰을 코드로 고정해 위반 시 자동 차단하는 거버넌스 훅. 이 두 가지가 있어야 회사 자료와 외부 자료를 같은 시스템으로 안전하게 다룰 수 있습니다.
③ 활용 결과 어떤 변화가 있었나요?
두 가지 핵심 사례에서 정량적으로 나타난 결과입니다.
• [사례 1 — 메인] 로컬 LLM 개인 업무비서: 새 안건이 떨어졌을 때 "최근 2년치 우리 팀 활동 통합 조회"가 하루 8시간에서 약 10분으로 줄었습니다. 약 98% 시간 단축. 더 중요한 건 회사 자료(검토자료·전자결재·전표 등)가 외부 API로 일체 나가지 않는다는 점입니다. 인덱싱부터 답변 생성까지 전부 본인 컴퓨터 안에서 끝납니다.
• [사례 2 — 서브] 자동 매칭 파이프라인: 콘텐츠 3~4만 건 규모의 면세 적용 요건 검토가 한 달에서 5시간으로 줄었습니다. 약 99% 시간 단축. 외부 공공 DB의 API를 호출해 식별번호·메타데이터를 한 번에 수집하고, 3단 교차 검증(searcher → verifier → review)으로 정합성을 확보했습니다. 이 과정에서 누락분이 발견되어 약 10억대 절감 임팩트로 이어졌습니다.
• [비용 절감] 클라우드 LLM만 쓰던 시절 월 약 30달러 → 로컬·클라우드 라우팅 적용 후 월 약 8달러. 약 73% 절감.
• [외부 전송 차단] 회사 자료 + 개인 민감 데이터 합산 월 50건 안팎이 로컬 LLM에서만 처리되어, 외부 API 전송 건수는 0건.
• [처리 속도] 짧은 분류·태깅은 클라우드 평균 1.8초에서 로컬 평균 0.3초로 약 6배 빨라짐.
• [접근성] 출퇴근 지하철에서 텔레그램으로 한 줄 보내면 회사 도착 전에 결과물이 도착합니다. PC 앞에 앉아 있어야만 가능하던 작업의 약 90%가 이동 중에 처리됩니다.
• [신뢰성] 거버넌스 코드 도입 1년 이상, AI가 제가 정한 룰을 어긴 사건 0건.
④ 나만의 방식 또는 개선 포인트는 무엇인가요?
기존의 일반적인 AI 활용과 본질적으로 다른 여섯 가지 설계 포인트가 있습니다. 이 6가지가 매일의 회사 자료 조회와 1년에 한 번의 큰 작업을 같은 안전 기준으로 동시에 처리할 수 있게 만든 핵심입니다.
1. 회사 자료 강제 로컬 처리: 검토자료·전자결재·전표 같은 회사 내부 자료는 로컬 LLM(Ollama + qwen2.5)에서만 인덱싱·답변하도록 라우터에서 강제. 외부 API 호출 자체가 차단됩니다. 이게 "개인 업무비서"의 보안 기반입니다.
2. 결정 불변성(Decision Immutability): 6개의 절대 룰을 코드 파일(DECISIONS.md)에 고정합니다. AI가 작업하기 직전, PreToolUse 훅(decision_guard.py)이 결과물을 검사해 룰 위반이면 프로세스를 자동 차단(exit 2)합니다. 컬럼 파생·별칭·간접 경로 같은 우회 패턴도 함께 차단합니다.
3. 10명 R&R 분리 + 3단 검증: 큰 작업은 orchestrator → searcher → verifier 3단 교차 검증. 한 AI에게 다 시키는 대신 전문 영역별로 나눠 환각 영역을 좁혔습니다.
4. 메모리 + 위키 이중 저장소: 사람·시점에 묶인 사실(memory/)과 도메인 지식(wiki/)을 분리해 컨텍스트 오염을 막습니다.
5. 자동 리플렉션 + 스킬 자동 포착: 같은 작업이 5회 이상 반복되면 자동으로 SKILL.md 절차서가 생성되어 다음에 재활용됩니다.
6. 목표 해킹 감지(goal_hack_detector): "성과를 부풀려줘" 같은 spec gaming 프롬프트를 감지하면 관련 결정 파일을 자동으로 환기합니다.

이 6가지를 코드 수준으로 구현한 것이 핵심 개선점입니다. 같은 시스템이 매일의 자료 조회(하루 → 10분)도, 1년에 한 번의 한 달짜리 작업(한 달 → 5시간)도 같은 안전 기준으로 처리합니다.
⑤ 다른 사람도 따라 할 수 있나요?
가능합니다. 회사 자료를 외부에 보낼 수 없는 상황이든, 매일의 자료 통합 조회든, 1년에 한 번의 큰 작업이든 같은 6단계로 적용할 수 있습니다.
7. Ollama 같은 로컬 LLM 런타임을 본인 PC에 설치합니다. (무료, 30분이면 끝납니다.)
8. 본인 업무에서 반복되는 결정 5~10개를 적습니다. 항상 이렇게 처리한다, 이것만은 절대 안 된다 같은 본인 기준입니다.
9. 그 결정들을 절대 안 바뀌는 룰과 상황에 따라 바뀌는 가이드라인으로 분류합니다.
10. 절대 룰을 한 파일(DECISIONS.md 등)에 모으고, AI에게 모든 대화 시작 전에 그 파일을 먼저 읽게 시킵니다.
11. 회사 자료가 들어가는 작업은 라우터로 강제 로컬 처리. 외부 API 호출이 차단되도록 키워드 매칭을 걸어 둡니다.
12. 텔레그램·메일·캘린더 같은 평소 쓰는 도구와 AI를 연결해 원격 지시 환경을 만듭니다.

코딩을 조금 할 줄 알면 1~2시간 안에 첫 버전을 만들 수 있고, 코딩을 못 해도 1·2단계만 적용해도 ChatGPT 사용 품질이 달라집니다. 본인은 이 시스템을 1년 이상 매일 운영하며 개선해왔고, 본 출품작에 등장한 모든 도구·코드·설계는 직접 작성한 것입니다. 회사 자료를 외부로 보낼 수 없는 직장인이라면 누구나 본인 환경에 똑같이 적용할 수 있는 구조이며, 자료 조회 하루 → 10분 같은 효과는 적용 첫 주부터 체감됩니다.
← 목록