SMOKE 에 config migrate 스모크 단계(dry-run/적용/멱등/--json), DOGFOOD §9 에 스키마 마이그레이션 시나리오(.bak byte-identical·값 보존·가시화·멱등·doctor). v0.21.1 에 포함되도록 태그 이동. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
kebab — Local-first Knowledge Base + RAG
kebab 는 개인용 로컬 knowledge base + RAG 도구다. Markdown · PDF · 이미지 · 소스코드를 한 곳에 색인하고, 하이브리드 의미 검색과 근거 인용을 포함한 LLM 답변을 단일 binary 로 제공한다. 모든 추론은 로컬 (Ollama + fastembed) 에서 돌아간다.
Quick start
사전 요구는 두 가지뿐이다.
- Rust toolchain ≥ 1.85 (workspace 가 edition 2024 사용). rustup.
- Ollama —
kebab ask와 이미지/PDF OCR 가 사용. 공식 설치 안내 참고 후ollama serve실행. 기본 LLM family 는 gemma4 (ollama pull gemma4:e4b) — OCR/caption 도 같은 family 라 모델 하나면 된다. CPU-only 환경이면 소형 모델 (예:gemma3:4b) 을 권장.
# 1) 빌드 + 설치 (~/.cargo/bin/kebab)
git clone https://gitea.altair823.xyz/altair823-org/kebab.git
cd kebab
cargo install --path crates/kebab-cli --locked
# 2) 데이터 디렉토리 + config.toml 생성 (XDG 경로)
kebab init
# 3) config 최소 손보기 — workspace.root (색인할 폴더) 와 LLM endpoint
${EDITOR:-vi} ~/.config/kebab/config.toml
# 4) 색인 (Markdown · PDF · 이미지 · 소스코드 한 번에)
kebab ingest
# 5) 검색 (hybrid = lexical + vector RRF, citation 포함)
kebab search "Markdown chunking 규칙"
# 6) 질문 (RAG 답변 + 근거 인용, Ollama 필요)
kebab ask "내 KB 설계에서 저장소 전략은?"
clone 없이 git URL 로 바로 설치할 수도 있다: cargo install --git https://gitea.altair823.xyz/altair823-org/kebab.git --bin kebab --locked. 업데이트는 동일 명령에 --force. 제거는 cargo uninstall kebab-cli (데이터는 보존 — 데이터까지 지우려면 kebab reset --all --yes).
설치 없이 dev 흐름으로 돌려볼 때는 cargo run --release -p kebab-cli -- <subcommand>. 격리된 임시 워크스페이스로 검증하는 절차는 docs/SMOKE.md (--config <path> 로 분리).
핵심 기능
하이브리드 검색 + citation
lexical (FTS5 BM25) 과 vector (cosine) 두 채널을 RRF fusion 으로 합쳐 검색한다. 모든 hit 은 출처 위치를 매체별로 정확히 담는다 — Markdown/코드는 line, 이미지는 region, PDF 는 page. --tag · --media · --lang · --path-glob 등 다양한 필터와 --max-tokens · --cursor 같은 agent budget flag 를 지원한다.
doc-side expansion 별칭 (opt-in)
색인 시 각 청크에 대해 "같은 의미의 다른 표현"(동의어 · 약어 · 한↔영 번역 · 풀어쓴 설명) 별칭을 LLM 으로 생성해 별도 dense 벡터로 색인한다. 설명형 query 나 cross-lingual query 의 검색 일관성을 높인다 (나무위키 ~1000 문서 CS corpus 측정: 변형 일관성 14/18 → 16/18, 대조군 false-positive 미유발). 청크당 LLM 호출이 들어 비용이 크므로 default off — [ingest.expansion] enabled = true 로 opt-in.
파생물 캐시 (자동)
embedding 벡터와 별칭 LLM 결과를 청크 내용 해시 로 캐싱한다 (derivation_cache). 재색인·갱신 시 내용이 같은 청크는 재계산을 건너뛴다 (측정: cold 1879s → warm 13s ≈ 145배). 캐시 키에 모델·프롬프트·차원 버전이 포함돼 버전 변경 시 자동 무효화된다 (cascade 안전). 별도 설정 없이 투명하게 동작한다. (현재 TTL/LRU 자동 정리는 미구현 — 누적된 캐시는 kebab reset 으로만 정리.)
외부 계산 + 로컬 검색 워크플로
search/ask 는 asset 파일 없이 kebab.sqlite + lancedb 만으로 동작한다. 비싼 색인(임베딩·OCR·별칭 생성)을 성능 좋은 서버에서 수행한 뒤, 이 두 산출물만 로컬로 복사하면 그대로 검색·질문할 수 있다.
멀티미디어 색인
Markdown · PDF · 이미지(OCR + caption) · 소스코드(Rust/Python/TS/JS/Go/Java/Kotlin/C/C++ AST) · 리소스(YAML/Dockerfile/TOML/JSON/XML 등)를 확장자에 따라 자동으로 적절한 chunker 에 라우팅한다. embedded text 가 없는 scanned PDF 는 [pdf.ocr] 로 page-단위 OCR (opt-in). 전체 확장자→chunker 매핑은 docs/ARCHITECTURE.md.
RAG (근거 인용 + 거절)
검색 결과를 근거로 LLM 답변을 생성하고 [#번호] 인용을 단다. 근거가 부족하면 답을 지어내지 않고 거절한다. compound 질문은 --multi-hop 으로 분해→synthesize. 답변의 groundedness 는 mDeBERTa XNLI 로 검증할 수 있다 ([rag] nli_threshold, default off).
TUI
kebab tui 는 Ratatui 셸 — Library / Search / Ask / Inspect 패널을 vim-style 모드로 다룬다. 키 매핑은 앱 내 F1 cheatsheet 가 권위 소스다.
명령
| 명령 | 동작 |
|---|---|
kebab init |
XDG 경로에 데이터 디렉토리 + config.toml 생성 |
kebab ingest [<path>] |
워크스페이스 스캔 후 새/변경 문서 색인 (idempotent · incremental, --force-reingest 로 강제 재처리). 미지원 확장자는 자동 skip |
kebab ingest-file <path> |
단일 파일 ingest (workspace 외부 가능 — _external/ 로 deterministic copy) |
kebab ingest-stdin --title <T> |
stdin 의 markdown 본문 ingest |
kebab search --mode {lexical,vector,hybrid} "<query>" [flags] |
검색 (default hybrid = RRF fusion, citation 포함). 필터/budget flag 는 --help |
kebab ask "<query>" [flags] |
RAG 답변 + 근거 인용 (Ollama 필요). --session (multi-turn) · --stream · --multi-hop |
kebab list docs |
색인된 문서 목록 |
kebab inspect doc <id> / inspect chunk <id> |
raw record 보기 |
kebab fetch chunk|doc|span <id> [flags] |
indexed corpus 에서 verbatim text fetch |
kebab eval run | aggregate | compare | variants |
golden query 회귀 측정 + 변형 일관성 진단 |
kebab schema [--json] |
introspection — wire schemas / capabilities / models / stats |
kebab doctor |
설정 / 모델 / DB 헬스 체크 |
kebab tui |
Ratatui 셸 (Library / Search / Ask / Inspect) |
kebab mcp |
MCP stdio server (search / bulk_search / ask / fetch / schema / doctor / ingest_file / ingest_stdin) |
kebab reset [--all | --data-only | --vector-only | --config-only | --orphans-only] [--yes] |
XDG 데이터 wipe (irreversible) |
모든 명령에 --json 플래그가 있고, 출력은 frozen wire schema v1 을 따른다 (schema_version 항상 포함). --json 모드에서 fatal error 는 stderr 에 error.v1 ndjson 으로 emit (exit code 0/1/2/3 불변). 글로벌 flag: --readonly (write-path 비활성화), --quiet (human stderr 억제), env KEBAB_PROGRESS=plain. 전체 flag·wire 의미는 kebab <cmd> --help 와 docs/wire-schema/v1/. 외부 agent 통합(Claude Code skill / MCP)은 docs/mcp-usage.md 와 integrations/.
Configuration
~/.config/kebab/config.toml 은 kebab init 가 XDG 경로에 생성한다. 핵심 노브만 정리한다 (전체 절은 생성된 파일 주석 참고, 예시는 docs/SMOKE.md).
[workspace]
root = "~/KnowledgeBase" # 색인할 폴더. 절대 / tilde / env / 상대 경로 가능.
# 상대 경로의 base 는 config.toml 위치 (cwd 무관).
[models.embedding]
model = "multilingual-e5-large" # 다국어 sentence embedding (1024-dim).
# 첫 ingest 시 ONNX (~1.3GB) 자동 다운로드.
dimensions = 1024 # config 와 LanceDB stored dim 불일치 시 검색 0건.
[models.llm]
endpoint = "http://localhost:11434" # Ollama host:port
model = "gemma4:e4b"
# request_timeout_secs = 300 # 큰 모델은 늘림. 0 은 disable 이 아니라 "즉시 timeout".
[ingest.expansion] # doc-side expansion 별칭 (opt-in)
enabled = false # true 면 청크당 LLM 호출로 별칭 생성 — 비용 큼.
embed_aliases = true # 별칭을 줄별 개별 dense 벡터로 색인.
max_aliases_per_chunk = 8
[search]
stale_threshold_days = 30 # search hit / citation 의 stale 플래그 기준 (0 = off).
[rag]
prompt_template_version = "rag-v3" # 답변 언어 = 질문 언어. rag-v1/v2 는 legacy.
nli_threshold = 0.0 # >0 (예: 0.5) 면 mDeBERTa XNLI groundedness 검증.
- 파생물 캐시 — embedding·별칭 결과를 내용 해시로 자동 캐싱한다 (위 「핵심 기능」 참고). 설정 항목 없음.
[ingest.code]— code ingest 의 skip 정책 (skip_generated_header,max_file_bytes,extra_skip_globs)..gitignore자동 honor,.kebabignore는 추가 layer.[pdf.ocr]— scanned PDF 의 page-단위 OCR (default off / opt-in, page 당 ~수십 초 cost). 활성화 후 v0.19 시절 색인분은kebab ingest --force-reingest로 재처리.--config <path>— 임시 워크스페이스 / 격리 테스트용 (CLI · TUI 모두 honor).kebab config migrate— 새 버전에서 추가된 config 섹션을 기존config.toml에 설명 주석과 함께 채워 넣는다 (사용자가 손본 값·주석·순서는 보존, 멱등, 변경 시 자동.bak백업).--dry-run으로 변경 미리보기.kebab doctor가 갱신 필요 시 안내한다.kebab init으로 새로 생성되는 config.toml 도 섹션별 주석을 포함한다.KEBAB_*env — 일부 키 override (KEBAB_RAG_SCORE_GATE,KEBAB_EVAL_GOLDEN등).- XDG layout:
~/.config/kebab/,~/.local/share/kebab/,~/.cache/kebab/,~/.local/state/kebab/.
아키텍처
flowchart TB
user(["사용자"])
subgraph UI["UI binary"]
cli["kebab CLI"]
tui["kebab TUI"]
end
subgraph App["Facade"]
app["kebab-app"]
end
subgraph Pipeline["도메인 + 파이프라인"]
parse["parse-md / parse-pdf / parse-image / parse-code"]
chunker["chunker (md / pdf / code-AST / manifest)"]
embedder["embedder (fastembed multilingual-e5-large)"]
retriever["retriever (lexical / vector / hybrid RRF)"]
rag["RAG pipeline"]
end
subgraph Store["저장소"]
sqlite[("SQLite + FTS5")]
lance[("LanceDB")]
assets[("asset bytes")]
end
subgraph External["외부"]
fs[("workspace files")]
ollama[("Ollama HTTP")]
end
user --> cli
user --> tui
cli --> app
tui --> app
app --> parse
app --> chunker
app --> embedder
app --> retriever
app --> rag
fs --> parse
parse -. vision OCR / caption .-> ollama
parse --> sqlite
parse --> assets
chunker --> sqlite
embedder --> lance
retriever --> sqlite
retriever --> lance
rag --> retriever
rag --> ollama
v0.21.0 기준 핵심 설계:
- crate facade —
kebab-app가 유일한 facade다. UI binary (kebab-cli/kebab-tui) 는 store / parse / search / llm / rag 를 직접 참조하지 않는다 (frozen 설계 §8). 각 user-facing 엔트리는*_with_config(cfg, …)동반 함수로 explicit config 를 thread 한다. - chunk_id 는 위치 기반 — chunk 의 정체성은 문서 내 위치(ordinal + span)다. 반면 파생물 캐시 키는 내용 해시라, 내용이 같으면 위치·문서가 달라도 동일 캐시를 재사용한다.
- wire schema v1 — 모든
--json출력은schema_version을 담는 frozen contract다. 깨는 변경은*.v2major bump을 요구한다. - versioning cascade —
parser_version/chunker_version/embedding_version/prompt_template_version/index_version변경은 downstream record(청크·임베딩·캐시·eval)를 무효화한다.
crate-level 의존성 그래프 · 디렉토리 트리 · 확장자→chunker 전체 매핑 · 핵심 기술 결정은 docs/ARCHITECTURE.md, 진척도는 HANDOFF.md.
비-목표
다중 사용자 SaaS / K8s / 원격 vector DB / enterprise RBAC / 실시간 협업 / agent 임의 파일 수정 / multi-workspace / LLM-as-judge eval / CLIP 시각 embedding — frozen 설계 §0 / §11 참조.
버전 / 라이선스 / 참고
- 버전: v0.21.0 (
kebab --version으로 확인). - 라이선스:
MIT OR Apache-2.0. - 진척도: HANDOFF.md · 아키텍처: docs/ARCHITECTURE.md · Frozen 설계: docs/superpowers/specs/2026-04-27-kebab-final-form-design.md
- Task 인덱스: tasks/INDEX.md · Hotfix 로그: tasks/HOTFIXES.md · Smoke 절차: docs/SMOKE.md · MCP 사용: docs/mcp-usage.md