feat(search): provenance 출처 필터 — [[workspace.sources]] 멀티소스 + --source/--source-type
혼합 출처 KB(위키+jira 등)에서 색인은 전부 하되 질의 시 출처로 좁히는 provenance 레버. 전역 trust 곱셈가중(weighted-RRF)은 A/B 에서 반증(θ=0.85 만으로 incident MRR 0.918→0.340 절벽, 점수 압축) — 필터가 see-saw 없는 올바른 레버. - config [[workspace.sources]] (각 id/root/exclude/trust_level/source_type); 단일 root 는 implicit `default` source 로 정규화. validate: id 유일·비어있지 않음. - config schema v3→v4 (step_3_to_4, root→[[workspace.sources]] id=default 미러, 멱등) - V014 documents.source_id 컬럼+인덱스 (additive, DEFAULT 'default', 재색인 0) - Metadata.source_id + BodyHints trust precedence(frontmatter > source 기본값 > Primary) - ingest: --root 미지정 시 resolved_sources() 순회 + doc 마다 source_id/trust stamp - 검색 SearchFilters.source_type/source_id → lexical + vector 두 site (IN, OR) - CLI kebab search --source <id> / --source-type <type> (repeatable/comma-sep) 도그푸딩(620 doc, jira400+wiki220): --source wiki 로 개념 질의 MRR 0.780→0.810, --source jira 로 incident 0.918→0.975. trust precedence 실측(jira=secondary 기본값). version bump 0.28.0 → 0.29.0 (신규 CLI flag + config 키 + V014 migration → minor). follow-up: MCP search 필터 미노출 · kebab list source_id 미표시 · RAG provenance 라벨. 자세한 내용: tasks/HOTFIXES.md (2026-06-21), docs/release-notes/v0.29.0-draft.md. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com> Claude-Session: https://claude.ai/code/session_012Mc6W1fgsrbFKTsqA6P8La
This commit is contained in:
@@ -290,6 +290,21 @@ kebab search "rust" --doc-id "<doc-id>" --tag rust --json
|
||||
Bad `--ingested-after` → `error.v1.code = config_invalid`, exit 2.
|
||||
Unknown `--media` value → silently empty (no error).
|
||||
|
||||
### Source filters (`--source` / `--source-type`)
|
||||
|
||||
````bash
|
||||
# 단일 root 워크스페이스는 implicit `default` source 로 정규화되므로
|
||||
# 모든 문서가 source_id="default" — 이 필터는 전체와 동일하다.
|
||||
kebab search "rust" --source default --json | jq '.hits | length'
|
||||
|
||||
# source_type 필터 (frontmatter 의 source_type: 또는 source 기본값).
|
||||
kebab search "rust" --source-type markdown,reference --json | jq '.hits | length'
|
||||
````
|
||||
|
||||
멀티소스 KB 는 `[[workspace.sources]]` 로 명명 source 를 선언하면
|
||||
`--source <id>` 로 출처를 좁힌다 (예: `--source jira` → jira 문서만).
|
||||
빈 값 = 무필터, 콤마/반복 = OR. 모르는 값 → silently empty (no error).
|
||||
|
||||
### Trace + stats (fb-37)
|
||||
|
||||
Re-run a search with `--trace` to see per-stage candidate lists + timing:
|
||||
|
||||
Reference in New Issue
Block a user