마지막 commit. 모든 .md 안의 `kb` 단어 일괄 갱신. - 19 개 crate 이름 (`kb-core`, `kb-app`, …) → `kebab-*` (Rust 모듈 path 표기 `kb_*` → `kebab_*` 포함). - 미래 component (`kb-tui`, `kb-desktop`, `kb-asr-whisper`, `kb-ocr`, `kb-mcp`, `kb-vlm`, `kb-rerank`, `kb-vision-ocr`, `kb-index`, `kb-smoke`, `kb-architecture`) → `kebab-*` (P6+ 가 시작될 때 같은 prefix 사용). - CLI 명령 예제: `kb ingest` / `kb search` / `kb ask` / `kb init` / `kb doctor` / `kb inspect` / `kb list` / `kb eval` → `kebab <verb>`. fenced code block + 인라인 backtick 모두. - XDG paths + env vars + binary 경로 (`target/release/kb` → `target/release/kebab`) 동기화. - design doc / 최초 보고서 / SMOKE / HOTFIXES / phase epic / task spec 모든 reference 통일. - task-decomposition.md 의 `git -c user.name=kb` 는 과거 git history 기록용 author 정보라 그대로 유지 (실제 git history 의 author 는 변경 불가). - `tasks/phase-5-evaluation.md` 의 `status: planned` → `completed` 도 같이 (P5-1 + P5-2 PR 머지 후 미반영분). ## 검증 - `grep -rEn "\bkb-[a-z]|\bkb_[a-z]|\.config/kb\b|kb\.sqlite|\bKB_[A-Z]" --include="*.md"` 0 hits (task-decomposition.md 의 git author 제외). - 모든 file path reference 살아있음 (renamed file 들 모두 새 path 로 update). 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
96 lines
4.8 KiB
Markdown
96 lines
4.8 KiB
Markdown
---
|
||
title: "KB 작업 단위 인덱스"
|
||
source: kebab_local_rust_report.md
|
||
date: 2026-04-27
|
||
---
|
||
|
||
# KB 작업 단위 인덱스
|
||
|
||
[`kebab_local_rust_report.md`](../kebab_local_rust_report.md) 의 Phase 로드맵을 아키텍처 수준 작업 단위로 분해. 각 task 문서는 독립적으로 착수/검수 가능한 단위.
|
||
|
||
## 의존 그래프
|
||
|
||
```text
|
||
P0 ── P1 ── P2 ── P3 ── P4 ── P5
|
||
│
|
||
├─ P6 (image)
|
||
├─ P7 (pdf)
|
||
├─ P8 (audio)
|
||
└─ P9 (TUI/desktop)
|
||
```
|
||
|
||
P0~P5 는 직렬. P6~P9 는 P5 이후 병렬 가능.
|
||
|
||
## 작업 단위
|
||
|
||
| # | 코드 | 제목 | 핵심 산출 crate | 선행 |
|
||
|---|------|------|----------------|------|
|
||
| P0 | [phase-0-skeleton.md](phase-0-skeleton.md) | Workspace 뼈대 + 도메인 계약 | kebab-core, kebab-parse-types, kebab-config, kebab-app, kebab-cli | – |
|
||
| P1 | [phase-1-markdown-ingestion.md](phase-1-markdown-ingestion.md) | Markdown ingestion 파이프라인 | kebab-source-fs, kebab-parse-md, kebab-normalize, kebab-chunk, kebab-store-sqlite | P0 |
|
||
| P2 | [phase-2-lexical-search.md](phase-2-lexical-search.md) | SQLite FTS5 lexical 검색 + citation | kebab-search (lexical) | P1 |
|
||
| P3 | [phase-3-vector-hybrid.md](phase-3-vector-hybrid.md) | Local embedding + LanceDB + hybrid | kebab-embed, kebab-embed-local, kebab-store-vector, kebab-search | P2 |
|
||
| P4 | [phase-4-local-llm-rag.md](phase-4-local-llm-rag.md) | Local LLM + RAG + grounded answer | kebab-llm, kebab-llm-local, kebab-rag | P3 |
|
||
| P5 | [phase-5-evaluation.md](phase-5-evaluation.md) | Golden query / regression eval | kebab-eval | P4 |
|
||
| P6 | [phase-6-image.md](phase-6-image.md) | 이미지 ingestion (OCR + caption) | kebab-parse-image | P5 |
|
||
| P7 | [phase-7-pdf.md](phase-7-pdf.md) | PDF text + page citation | kebab-parse-pdf | P5 |
|
||
| P8 | [phase-8-audio.md](phase-8-audio.md) | 음성 transcription + timestamp citation | kebab-parse-audio | P5 |
|
||
| P9 | [phase-9-ui.md](phase-9-ui.md) | TUI + desktop app | kebab-tui, kebab-desktop | P5 |
|
||
|
||
## Component task decomposition (per phase)
|
||
|
||
각 phase 의 component-level 분해. AI sub-agent 1세션 = 1 task 가 sweet spot.
|
||
|
||
- P0 — [p0/](p0/) — 1 component
|
||
- [p0-1 skeleton](p0/p0-1-skeleton.md)
|
||
- P1 — [p1/](p1/) — 6 components
|
||
- [p1-1 source-fs](p1/p1-1-source-fs.md)
|
||
- [p1-2 parse-md frontmatter](p1/p1-2-parse-md-frontmatter.md)
|
||
- [p1-3 parse-md blocks](p1/p1-3-parse-md-blocks.md)
|
||
- [p1-4 normalize](p1/p1-4-normalize.md)
|
||
- [p1-5 chunk](p1/p1-5-chunk.md)
|
||
- [p1-6 store-sqlite](p1/p1-6-store-sqlite.md)
|
||
- P2 — [p2/](p2/) — 2 components
|
||
- [p2-1 fts-schema](p2/p2-1-fts-schema.md)
|
||
- [p2-2 lexical-retriever](p2/p2-2-lexical-retriever.md)
|
||
- P3 — [p3/](p3/) — 5 components
|
||
- [p3-1 embedder-trait](p3/p3-1-embedder-trait.md)
|
||
- [p3-2 fastembed-adapter](p3/p3-2-fastembed-adapter.md)
|
||
- [p3-3 lancedb-store](p3/p3-3-lancedb-store.md)
|
||
- [p3-4 hybrid-fusion](p3/p3-4-hybrid-fusion.md)
|
||
- [p3-5 app-wiring](p3/p3-5-app-wiring.md)
|
||
- P4 — [p4/](p4/) — 3 components
|
||
- [p4-1 llm-trait](p4/p4-1-llm-trait.md)
|
||
- [p4-2 ollama-adapter](p4/p4-2-ollama-adapter.md)
|
||
- [p4-3 rag-pipeline](p4/p4-3-rag-pipeline.md)
|
||
- P5 — [p5/](p5/) — 2 components
|
||
- [p5-1 golden-fixture-runner](p5/p5-1-golden-fixture-runner.md)
|
||
- [p5-2 metrics-compare](p5/p5-2-metrics-compare.md)
|
||
- P6 — [p6/](p6/) — 3 components
|
||
- [p6-1 image-extractor-exif](p6/p6-1-image-extractor-exif.md)
|
||
- [p6-2 ocr-adapter](p6/p6-2-ocr-adapter.md)
|
||
- [p6-3 caption-adapter](p6/p6-3-caption-adapter.md)
|
||
- P7 — [p7/](p7/) — 2 components
|
||
- [p7-1 pdf-text-extractor](p7/p7-1-pdf-text-extractor.md)
|
||
- [p7-2 pdf-page-chunker](p7/p7-2-pdf-page-chunker.md)
|
||
- P8 — [p8/](p8/) — 2 components
|
||
- [p8-1 whisper-adapter](p8/p8-1-whisper-adapter.md)
|
||
- [p8-2 segment-chunker](p8/p8-2-segment-chunker.md)
|
||
- P9 — [p9/](p9/) — 5 components
|
||
- [p9-1 tui-library](p9/p9-1-tui-library.md)
|
||
- [p9-2 tui-search](p9/p9-2-tui-search.md)
|
||
- [p9-3 tui-ask](p9/p9-3-tui-ask.md)
|
||
- [p9-4 tui-inspect](p9/p9-4-tui-inspect.md)
|
||
- [p9-5 desktop-tauri](p9/p9-5-desktop-tauri.md)
|
||
|
||
## Post-merge 핫픽스
|
||
|
||
머지 후 발견된 버그들과 그 follow-up PR들은 [HOTFIXES.md](HOTFIXES.md)에 dated 로그로 기록한다. 원래 task spec은 frozen 상태로 두고, post-merge 동작 변경은 HOTFIXES.md를 source of truth로 본다.
|
||
|
||
## 모든 task 공통 규약
|
||
|
||
- 의존성 경계 (`Allowed` / `Forbidden`) 위반 금지. report §19 참조.
|
||
- citation 없는 검색 결과 / RAG 응답 금지.
|
||
- 원본 파일 파괴 금지. 파생물만 재생성.
|
||
- 모든 record 에 version (parser/chunker/embedding/index/prompt) 기록.
|
||
- 각 phase 완료 = `cargo check --workspace && cargo test --workspace` 통과 + 해당 phase 의 완료 조건 CLI 데모 통과.
|