• v0.6.0 72798bd3ff

    v0.6.0 Stable

    altair823 released this 2026-05-10 15:03:45 +00:00 | 498 commits to main since this release

    v0.6.0 = RAG quality batch. fb-38 + fb-40 + fb-42 + fb-39 + fb-39b 5건 묶음.

    신규 surface

    • --bulk (fb-42) — stdin ndjson 으로 N query 한 번에 (cap 100). 응답 = stdout per-query ndjson + stderr summary. agent loop 효율.
    • 응답 hit 의 score_kind 필드 (fb-38) — "rrf" (hybrid) / "bm25" (lexical) / "cosine" (vector). top-level score 의 의미 declarative. agent confidence 오해 방지.

    kebab ask

    • 기본 prompt template rag-v2 (fb-40) — V1 의 4 규칙 + 3 신규: fact 인용 시 verbatim span / 학습 지식 동원 금지 / 근거 모호 시 "확실하지 않다" 명시. user TOML prompt_template_version = "rag-v1" 명시 시 legacy 동작.

    kebab eval run

    • precision_at_k_chunk metric (fb-39) — P@5, P@10. binary relevance via expected_chunk_ids. 분모 = k 고정. lever 적용 (chunk policy / RRF / cross-encoder / embedding) precision 비교용 측정 도구.
    • kebab eval compare 가 P@k delta surface — markdown table + JSON deltas.

    MCP

    • mcp__kebab__bulk_search 신규 tool (tools/list 7 → 8). N query JSON envelope bulk_search_response.v1 (results + summary).
    • mcp__kebab__search 응답 안 score_kind 필드 (fb-38) — agent guidance.
    • mcp__kebab__ask 응답 strict (fb-40 rag-v2) — 학습 지식 거부 / "확실하지 않다" 출현.

    Embedding

    • 기본 모델 multilingual-e5-large (1024 dim, fb-39b) — 이전 multilingual-e5-small (384 dim) 대비 한국어 retrieval precision 강화. fastembed 자동 다운로드 (~1.3 GB 첫 실행). user TOML model = "multilingual-e5-small" 명시 시 backwards-compat.

    Cascade

    • embedding_version 변경 — 모든 chunk 재-embed (fb-23 incremental ingest 자동). 옛 LanceDB table (chunk_embeddings_multilingual-e5-small_384) orphan. 정리: kebab reset --vector-only && kebab ingest.
    • prompt_template_version 변경 — 기존 eval_runs frozen, rag-v2 비교는 신규 run.

    호환성

    • wire 모든 추가 additive minor — 기존 consumer 무영향.
    • score_kind / bulk_search_* schemas additive (bulk_search_item.v1 + bulk_search_response.v1 신규).
    • 기존 user config TOML pinning 그대로 honored — opt-out path.

    도그푸딩 가이드

    # embedding 업그레이드 (신규 모델 ONNX 다운로드 + 전체 re-embed)
    kebab reset --vector-only && kebab ingest
    
    # bulk multi-query
    printf '{"query":"a"}\n{"query":"b"}\n' | kebab search --bulk --json
    
    # precision 측정 (golden 의 expected_chunk_ids 채워서)
    kebab eval run
    
    # rag-v2 행태 확인
    kebab ask "..." --json | jq .answer  # "확실하지 않다" 출현 가능
    

    의존성

    • 신규 dep 없음.
    • fastembed 4.9.1 의 MultilingualE5Large enum variant 활용 (이미 시드).
    Downloads