`kebab-normalize::derive_title(frontmatter_title, blocks, file_stem)` 가
다음 단계로 비어있지 않은 첫 결과를 사용:
1. frontmatter `title` (trim 후)
2. 첫 H1 텍스트
3. 첫 H2 텍스트
4. 첫 Paragraph (Quote / List / Code / Table / ImageRef 제외) 의 첫 80 자
5. 파일 stem (확장자 제외)
6. (sentinel) `"untitled"` — 위 다섯 단계가 모두 blank 인 병적 케이스
선택된 문자열은 NFC 정규화. 빈 문자열은 절대 반환하지 않음.
`build_canonical_document` 가 metadata lift 직후 helper 호출. 기존 단순
lift 로직 (metadata.user["title"] → CanonicalDocument.title) 은 fallback
chain 의 1 단계 입력으로 자리 이동.
`KEBAB_PARSE_MD_VERSION` 상수를 `pulldown-cmark-0.x` → `md-frontmatter-v2`
로 bump. parser_version 변경 → §4.2 doc_id 입력 변화 → 기존 markdown
doc 의 `doc_id` 갱신, 다음 ingest 시 idempotent upsert 로 자동 재처리
(design §9 cascade). `kebab-store-sqlite` 의 snapshot fixture 도 같은
literal 로 갱신.
기존 M7 정책 ("metadata.user[\"title\"] = '' 가 빈 title 로 lift") 은
폐기. 빈 문자열 입력은 fallback chain 을 타고 file stem 까지 떨어진다.
spec p9-fb-07 line 37: "빈 문자열 반환 금지".
테스트 (kebab-normalize):
- 8 개 단위 테스트 (각 fallback 단계 + NFC + sentinel)
- `build_canonical_document` 통합 테스트 2 개 (H1 / file stem)
- 기존 M7 테스트 2 개를 새 정책에 맞춰 갱신
문서:
- README: `kebab ingest` 행에 "title 자동 채움" 안내 + 기존 doc 도
다음 ingest 에서 갱신
- HANDOFF: 2026-05-03 머지 후 발견 entry
- spec status: `planned` → `in_progress`
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
12 KiB
HANDOFF — 진척도
새 conversation / 다른 사람이 이어받을 때 "지금 어디까지 됐고 다음에 뭘 할지" 의 단일 출처. 사용자 사용법은 README.md, 아키텍처는 docs/ARCHITECTURE.md, per-component 진행은 tasks/INDEX.md, 머지 후 발견된 버그는 tasks/HOTFIXES.md. 이 파일은 "phase 단위 진척" + "다음 task 후보" 만 담는다.
한 줄 요약
P0–P5 + P6 + P7 + P9-1/2/3/4 (Library / Search / Ask / Inspect) 머지 완료. kebab ingest 가 markdown / image / PDF 모두 처리. kebab search / kebab ask 가 매체 가로질러 결과 + page citation 반환. kebab tui 가 4 패널 (Library + Search + Ask + Inspect) 제공 — 사용자가 ? 로 ask, / 로 search, Library Enter / Search i 로 inspect, Search g 로 editor jump. 다음 후보 = P9-5 (desktop tauri) 또는 보류 중인 P8 (audio) 의 시스템 dep brainstorm.
Phase 로드맵
| Phase | 내용 | 핵심 산출 crate | 선행 | 상태 |
|---|---|---|---|---|
| P0 | Workspace 뼈대 + 도메인 계약 + ID recipe | kebab-core, kebab-parse-types, kebab-config, kebab-app, kebab-cli |
– | ✅ 완료 |
| P1 | Markdown ingestion (walk → parse → chunk → SQLite) | kebab-source-fs, kebab-parse-md, kebab-normalize, kebab-chunk, kebab-store-sqlite |
P0 | ✅ 완료 |
| P2 | SQLite FTS5 lexical 검색 + citation | kebab-search (lexical) |
P1 | ✅ 완료 |
| P3 | Local embedding + LanceDB + hybrid (RRF) + kebab-app wiring | kebab-embed, kebab-embed-local, kebab-store-vector, kebab-search |
P2 | ✅ 완료 |
| P4 | Local LLM + RAG + grounded answer | kebab-llm, kebab-llm-local, kebab-rag |
P3 | ✅ 완료 |
| P5 | Golden query / regression eval | kebab-eval |
P4 | ✅ 완료 |
| P6 | 이미지 ingestion (OCR + caption) | kebab-parse-image |
P5 | ✅ 완료 (4/4 component, OCR/caption Ollama-vision) |
| P7 | PDF text + page citation | kebab-parse-pdf |
P5 | ✅ 완료 (3/3 component, page-level chunker + ingest wiring) |
| P8 | 음성 transcription + timestamp citation | kebab-parse-audio |
P5 | ⏸ 보류 (whisper-rs 시스템 dep brainstorm 필요) |
| P9 | TUI + desktop app | kebab-tui, kebab-desktop |
P5 | 🟡 진행 (4/5 component — P9-1/2/3/4 완료 [Library / Search / Ask / Inspect], P9-5 desktop 예정) |
P0P5 직렬. P6P9 P5 이후 병렬 가능.
Component 카운트
총 33 component task — spec 시점 31 개 + 후속 wiring task 3 (P3-5 / P6-4 / P7-3) 가 머지 시점에 추가됨. per-component 진행 + status 는 tasks/INDEX.md.
머지 후 발견된 버그 / 결정 (요약)
머지 후 발견된 모든 deviation / hotfix 의 dated 로그는 tasks/HOTFIXES.md. 본 요약은 "누군가가 인수받을 때 알아두면 시간을 많이 절약하는" 항목만:
- P3-5 / P4-3
--config누락 —kebab-cli가--config <path>를 honor 하려면kebab_app::*_with_configcompanion 을 호출해야 함. 두 번 같은 모양으로 회귀했음. - P6-2 OCR 기본 엔진 — spec literal 의 Tesseract 가 시스템 dep 부담으로 거부됨, Ollama vision LM 으로 대체.
OcrEnginetrait 그대로라 future swap 가능. - P6-3 caption —
GenerateRequest.images필드를kebab-core::LanguageModeltrait 에 신설. 기존 caller 모두images: Vec::new()로 마이그레이션. - P7-2
chunk_id충돌 — pdf-page-v1 가 한 페이지 여러 chunk 분할 → 같은block_ids충돌. per-chunkpolicy_hash#c{char_start}변형 으로 회피. - P7-3 storage UNIQUE bug —
assets.workspace_pathUNIQUE +upsert_asset_row의ON CONFLICT(asset_id)gap 으로 byte 변경 re-ingest 실패.purge_orphan_at_workspace_pathhelper 추가, follow-up PR 으로 vector store orphan cleanup 까지 닫음 (VectorStore::delete_by_chunk_ids). - P9-1 ratatui 0.28 — spec literal 의
render_library<B: Backend>generic 이 ratatui 0.28 의 backend-agnostic Frame 과 어긋나 있어 제거. 테스트 seamApp::populate_library_for_testing(#[doc(hidden)]) 추가. - P9-2 jump_to_citation workspace_root — spec literal 의
jump_to_citation(citation, editor_env)가 workspace_root 인자 누락. citation.path 가 workspace 상대라 editor 호출 시 절대 경로 필요 →workspace_root: &Path인자 추가. 동일하게render_search<B: Backend>generic 도 P9-1 과 같은 사유로 제거. - P9-3 e/j/k 키 의 "input empty" 분기 — spec 의
e=toggle explain/j=k=scroll이 typing 과 충돌 ("explain" / "javascript" 같은 단어 입력 깨짐). input 이 비어 있을 때만 command 키로 동작 — vim "command vs insert" 컨벤션 변형. 사용자가 텍스트 입력 시 모든 알파벳 정상 통과. - P9-4 enter_inspect helper + Search
i키 — spec 의 진입 경로 (Library Enter → Doc inspect, Searchi→ Chunk inspect) 를 한 helper 로 묶음.InspectTargetenum (Doc(DocumentId) | Chunk(ChunkId)),return_to: Pane가 Esc 시 원래 pane 으로 복귀.c키가 모든 section (metadata / provenance / blocks / spans / text / embeddings) 일괄 collapse/expand — spec 의 "focus 기반 selective collapse" 는 v1 단순화. - 2026-05-02 P9 도그푸딩 후속 (p9-fb-06) —
kebab reset --all|--data-only|--vector-only|--config-only [--yes]추가. TTY 가 아니면--yes필수 (silent destruction 금지).--vector-only가 SQLiteembedding_records도 함께 truncate (off-disk Lance dir 만 wipe 시 orphan 방지). 도그푸딩 막힘 강도 1위 (수동 4 경로rm -rf부담) 해소. spec:tasks/p9/p9-fb-06-data-reset-command.md, plan:docs/superpowers/plans/2026-05-02-p9-fb-06-reset-command.md. - 2026-05-02 P9 도그푸딩 후속 (spec PR #51 + p9-fb-01 + p9-fb-02) —
kebab ingest진행 표시 도입. frozen design §2.4a 신설 (wire schemaingest_progress.v1line-delimited streaming) + §10 의 long-running 작업 절 추가.kebab-app::ingest_with_config_progress(.., progress: Option<Sender<IngestEvent>>)facade 추가, 기존_with_config가progress=Noneforwarding wrapper. CLI 가 indicatif TTY 진행 바 (stderr) / non-TTY 한 줄씩 /--json모드는 line-delimited stdout. p9-fb-03 (TUI background worker) + p9-fb-04 (cancel) 가 같은 stream 위에 build. - 2026-05-02 P9 도그푸딩 후속 (p9-fb-03) — TUI 의 background ingest worker. Library 의
r키가kebab_app::ingest_with_config_progress를 spawned thread 에서 호출, run loop 가 매 frame 마다 progress channel drain → 화면 하단 status bar 1 줄 갱신. terminal event (Completed/Aborted) 후 3 초 final 라인 hold + 자동 hide + Library auto-refresh. spec:tasks/p9/p9-fb-03-tui-ingest-background.md. (cancel slot 은 p9-fb-04 가 추가하는 형태로 단일화 — 회차 1 review 결과.) - 2026-05-02 P9 도그푸딩 후속 (p9-fb-04) — ingest cooperative cancellation.
kebab-app::ingest_with_config_cancellable(.., cancel: Option<Arc<AtomicBool>>)facade 추가, 기존_progress가cancel=Noneforwarding. asset loop iter 시작 boundary 마다 cancel poll → true 면 break +IngestEvent::Aborted { partial_counts }+Ok(IngestReport)정상 반환 (Err 아님). 부분 commit 보존, 다음 ingest 가 idempotent 재개. CLI Ctrl-C SIGINT handler (ctrlccrate) — 1회: cancel, 2회: hard exit (130). TUI Esc / Ctrl-C 가 cancel signal (in-flight 시), 그 외에는 quit.IngestState에cancel: Arc<AtomicBool>field 추가. spec:tasks/p9/p9-fb-04-ingest-cancellation.md. - 2026-05-02 P9 도그푸딩 후속 (spec PR #59 + p9-fb-15) — RAG multi-turn 도입. frozen design §3.8 갱신 —
Answer에conversation_id/turn_indexoptional field, 신규Turnstruct,RefusalReason::LlmStreamAbortedvariant.kebab-rag::AskOpts에history: Vec<Turn>/conversation_id/turn_index3 field 추가, 기존 caller 는Vec::new() / None(single-shot 동작 동일).RagPipeline::ask_with_history(query, history, conversation_id, turn_index, opts)helper. prompt 빌드:[이전 대화]블록을 user prompt 위에 prepend, newest-first, char budget (cfg.rag.max_context_tokens * 4) 안에서 oldest 부터 drop. retrieval query expansion: 직전 answer 첫 200 자 concat. wire schemaanswer.v1에 두 필드 +format: date-time추가. p9-fb-16 (TUI conversation UI) + p9-fb-17/18 (V004 storage + CLI session) 가 같은 facade 위에 build. spec:tasks/p9/p9-fb-15-rag-multi-turn-core.md. - 2026-05-02 P9 도그푸딩 후속 (p9-fb-16) — TUI Ask conversation UI.
AskState가turns: Vec<Turn>+current_question+conversation_id+last_answer로 재설계. answer area 가 transcript (Q1/A1,Q2/A2, ...) 로 갈음, 매 Enter 가 이전 turns 를history로 worker 에 전달 (ask_with_history). conversation_id 는 첫 submit 시 timestamp-based 자동 생성 (conv_<unix_nanos_hex>).Ctrl-L가 turns + conversation_id 초기화 (in-flight worker 는 그대로 finish, 결과는 새 conversation 의 stale turn 으로 silently 폐기). spec:tasks/p9/p9-fb-16-tui-ask-conversation.md. - 2026-05-03 P9 도그푸딩 후속 (p9-fb-20) —
kebab ask의 CLI citation block. 답변 출력 후근거:절 —[N] <full path>#<fragment> (score=<s>)한 줄씩.--show-citations(default ON) /--hide-citations(pipe 시 답변 본문만) flag.--json모드는 무영향 (citations 가 항상 wire payload 에 포함). spec p9-fb-20 의 "TUI citation pane + jump" 부분은 P9-3 의 기존render_citations_or_explain가 일부 cover — 추가 기능 (turn 별 fold + Enter/o jump + i inspect) 은 후속 task 로 미룸 (사용자 도그푸딩 priority 5위 의 핵심 = full path 가독성 = CLI block 으로 충족). spec:tasks/p9/p9-fb-20-citation-surface.md. - 2026-05-03 P9 도그푸딩 후속 (p9-fb-07) — Markdown title fallback chain.
kebab-normalize::derive_title(frontmatter_title, &[Block], file_stem)— 1) frontmatter title → 2) 첫 H1 → 3) 첫 H2 → 4) 첫 paragraph 80 chars → 5) 파일 stem (모든 단계 NFC 정규화, 빈 문자열 절대 반환 안 함, 마지막 sentinel"untitled").build_canonical_document가 lift 후 helper 호출. parser_version 상수pulldown-cmark-0.x→md-frontmatter-v2bump — 기존 doc 은doc_id가 갱신되므로 다음 ingest 가 자동 재처리 (idempotent upsert, design §9 cascade). spec:tasks/p9/p9-fb-07-md-title-fallback.md.
다음 task 후보
- P9-2 TUI search —
App.searchslot 채움. Library 의/가 enable 됨. - P9-3 TUI ask —
App.askslot 채움.?enable. - P9-4 TUI inspect —
App.inspectslot 채움.Enterenable. - P9-5 desktop tauri — 별도 분기. PDF citation rendering UI 가치 큼.
- P8 audio brainstorm — whisper-rs 시스템 dep 받을지 / 외부 transcription endpoint 사용할지 사용자 결정 필요. 사용자 패턴 (책+PDF 위주, audio 의향 없음) 상 후순위.
P9-2/3/4 는 P9-1 의 parallel-safety contract (sub-state slot 패턴) 덕에 병렬 진행 가능 — 같은 App 손대지 않음.
검증된 운영 동작 (release binary, fastembed enabled)
P7-3 머지 직후 25 시나리오 smoke 통과 — markdown + image + PDF 5 자산 워크스페이스에서 doctor / ingest / list / inspect / search (lex/vec/hybrid) / re-ingest / byte-edit re-ingest / corrupt PDF / RAG ask + page citation 모두. 자세한 시나리오 표는 conversation 기록 참조; 워크스페이스에 직접 돌려보는 절차는 docs/SMOKE.md.