docs(rename): kb → kebab — README, tasks/, docs/, design doc, report
마지막 commit. 모든 .md 안의 `kb` 단어 일괄 갱신. - 19 개 crate 이름 (`kb-core`, `kb-app`, …) → `kebab-*` (Rust 모듈 path 표기 `kb_*` → `kebab_*` 포함). - 미래 component (`kb-tui`, `kb-desktop`, `kb-asr-whisper`, `kb-ocr`, `kb-mcp`, `kb-vlm`, `kb-rerank`, `kb-vision-ocr`, `kb-index`, `kb-smoke`, `kb-architecture`) → `kebab-*` (P6+ 가 시작될 때 같은 prefix 사용). - CLI 명령 예제: `kb ingest` / `kb search` / `kb ask` / `kb init` / `kb doctor` / `kb inspect` / `kb list` / `kb eval` → `kebab <verb>`. fenced code block + 인라인 backtick 모두. - XDG paths + env vars + binary 경로 (`target/release/kb` → `target/release/kebab`) 동기화. - design doc / 최초 보고서 / SMOKE / HOTFIXES / phase epic / task spec 모든 reference 통일. - task-decomposition.md 의 `git -c user.name=kb` 는 과거 git history 기록용 author 정보라 그대로 유지 (실제 git history 의 author 는 변경 불가). - `tasks/phase-5-evaluation.md` 의 `status: planned` → `completed` 도 같이 (P5-1 + P5-2 PR 머지 후 미반영분). ## 검증 - `grep -rEn "\bkb-[a-z]|\bkb_[a-z]|\.config/kb\b|kb\.sqlite|\bKB_[A-Z]" --include="*.md"` 0 hits (task-decomposition.md 의 git author 제외). - 모든 file path reference 살아있음 (renamed file 들 모두 새 path 로 update). 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -3,7 +3,7 @@ phase: P6
|
||||
title: "이미지 ingestion (OCR + caption)"
|
||||
status: planned
|
||||
depends_on: [P5]
|
||||
source: kb_local_rust_report.md §9.1, §17 Phase 6
|
||||
source: kebab_local_rust_report.md §9.1, §17 Phase 6
|
||||
---
|
||||
|
||||
# P6 — 이미지 ingestion
|
||||
@@ -14,8 +14,8 @@ source: kb_local_rust_report.md §9.1, §17 Phase 6
|
||||
|
||||
## 산출 crate
|
||||
|
||||
- `kb-parse-image` — `Extractor` 구현. 이미지 → CanonicalDocument.
|
||||
- (선택) `kb-ocr` / `kb-vlm` 어댑터 (외부 모델 분리 시).
|
||||
- `kebab-parse-image` — `Extractor` 구현. 이미지 → CanonicalDocument.
|
||||
- (선택) `kebab-ocr` / `kebab-vlm` 어댑터 (외부 모델 분리 시).
|
||||
|
||||
## 추출 정보 3종 (§9.1)
|
||||
|
||||
@@ -83,10 +83,10 @@ photos/diagram-2026.png#caption # caption chunk
|
||||
## CLI
|
||||
|
||||
```text
|
||||
kb ingest ./assets/diagram.png
|
||||
kb ingest ./assets/ # 폴더 안 이미지 자동 인식
|
||||
kb search "이미지 안의 OCR 텍스트"
|
||||
kb inspect doc <image_doc_id> # OCR/caption/EXIF 모두 표시
|
||||
kebab ingest ./assets/diagram.png
|
||||
kebab ingest ./assets/ # 폴더 안 이미지 자동 인식
|
||||
kebab search "이미지 안의 OCR 텍스트"
|
||||
kebab inspect doc <image_doc_id> # OCR/caption/EXIF 모두 표시
|
||||
```
|
||||
|
||||
## 테스트
|
||||
@@ -99,13 +99,13 @@ kb inspect doc <image_doc_id> # OCR/caption/EXIF 모두 표시
|
||||
|
||||
## 의존성 경계
|
||||
|
||||
- `kb-parse-image` 는 `kb-core` + 이미지 디코딩 (`image` crate) + OCR adapter 만.
|
||||
- `kebab-parse-image` 는 `kebab-core` + 이미지 디코딩 (`image` crate) + OCR adapter 만.
|
||||
- LLM/embedding 호출 금지 (caption 은 별도 adapter 통해).
|
||||
- VLM caption 은 background job. ingest blocking 금지.
|
||||
|
||||
## 완료 조건
|
||||
|
||||
- [ ] `kb ingest <image>` 동작
|
||||
- [ ] `kebab ingest <image>` 동작
|
||||
- [ ] OCR text 검색 가능
|
||||
- [ ] OCR region citation 출력
|
||||
- [ ] caption 과 observed text provenance 분리
|
||||
|
||||
Reference in New Issue
Block a user