kebab/docs/superpowers/specs at 1de3f4ffcad009e6731dda871c48d729a3617169 - kebab - Gitea: Git with a cup of tea

altair823-org/kebab

Files

History

altair823 1de3f4ffca docs(spec): query-paraphrase robustness 평가 프레임워크 설계 (측정 먼저)

목표 재정의: 한/영 overlap → 같은 의미의 다양한 표현(동의어·다른 어휘·풀어쓴
문장·한영)에서 일관된 답변 품질. 지난 reranker 실험이 overlap 프록시 최적화로
헛돈 교훈 반영 — 처방 전 진짜 지표(변형 일관성)를 직접 재는 평가부터.

Phase 1(본 spec 구현): kebab-eval golden suite에 변형 그룹(intent group) +
변형 일관성 메트릭(recall_spread, answer_consistency) + recall@pool vs recall@k로
(A)순위출렁/(B)어휘격차 자동 판별. Phase 2(처방)는 측정 결과 게이트 뒤 조건부.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>

2026-05-30 00:53:24 +00:00

..

2026-04-27-kebab-final-form-design.md

docs(contract): bump default prompt_template_version to rag-v3 (Todo #1 )

2026-05-29 02:45:13 +00:00

2026-05-04-component-docs-design.md

…

2026-05-04-p9-fb-23-incremental-ingest-design.md

…

2026-05-04-p9-fb-24-tui-affordances-design.md

…

2026-05-05-p9-fb-25-config-include-removal-design.md

…

2026-05-07-fb-26-fb-28-agent-ux-design.md

…

2026-05-07-p9-fb-27-introspection-and-error-wire-design.md

…

2026-05-07-p9-fb-30-mcp-server-design.md

…

2026-05-07-p9-fb-31-single-file-stdin-ingest-design.md

…

2026-05-08-p9-fb-32-stale-doc-indicator-design.md

…

2026-05-09-p9-fb-33-streaming-ask-design.md

…

2026-05-09-p9-fb-34-output-budget-controls-design.md

…

2026-05-09-p9-fb-35-verbatim-fetch-design.md

…

2026-05-10-p9-fb-36-search-filters-design.md

…

2026-05-10-p9-fb-37-trace-and-stats-design.md

spec(fb-37): trace + stats design

2026-05-10 12:05:31 +09:00

2026-05-10-p9-fb-38-score-semantics-design.md

spec(fb-38): score semantics design

2026-05-10 17:40:47 +09:00

2026-05-10-p9-fb-39-eval-foundation-design.md

spec(fb-39): eval foundation design (P@k metric)

2026-05-10 22:05:09 +09:00

2026-05-10-p9-fb-39b-embedding-upgrade-design.md

spec(fb-39b): embedding model upgrade design

2026-05-10 22:59:03 +09:00

2026-05-10-p9-fb-40-fact-grounded-answer-design.md

spec(fb-40): fact-grounded answer design

2026-05-10 18:55:05 +09:00

2026-05-10-p9-fb-42-bulk-multi-query-design.md

spec(fb-42): bulk multi-query design (rerank hint deferred)

2026-05-10 20:05:27 +09:00

2026-05-15-kebab-code-ingest-design.md

docs(p10-2): activate Tier 2 in code-ingest design §10.1 + §3.5 mappings

2026-05-20 13:24:16 +00:00

2026-05-22-korean-trigram-tokenizer-design.md

spec+plan(v0.17.0): korean trigram tokenizer + dogfood fixes

2026-05-23 00:43:31 +00:00

2026-05-25-p9-fb-41-finalize-spec.md

chore(release): bump version 0.17.2 → 0.18.0 + cut fb-41 multi-hop

2026-05-26 05:18:08 +00:00

2026-05-25-p9-fb-41-multi-hop-rag-design.md

feat(eval): fb-41 multi-hop golden set + spec/plan

2026-05-25 06:22:08 +00:00

2026-05-26-extractor-dispatch-unification-spec.md

docs: v0.20 image+pdf handoff + sub-item 3 spec/plan backfill

2026-05-26 23:34:17 +00:00

2026-05-26-hotfix-15-mcp-ask-multi-hop-flaky-spec.md

docs(rag): HOTFIX #15 spec + plan (3 round OMC reviewer approve)

2026-05-26 06:52:04 +00:00

2026-05-26-normalize-absorption-spec.md

refactor(parse-md): absorb kebab-normalize + kebab-parse-types — 24 → 22 crates + §3.7b 재작성

2026-05-26 15:00:59 +00:00

2026-05-26-s3-nli-model-unavailable-diagnose-spec.md

fix(rag): S3 NLI unavailable — hypothesis char budget + token-count fallback retry

2026-05-26 09:12:21 +00:00

2026-05-26-source-fs-dep-lightening-spec.md

refactor(source-fs): drop kebab-parse-code dep — 9 tree-sitter grammars drag 제거

2026-05-26 12:19:32 +00:00

2026-05-27-pdf-scanned-ocr-spec.md

docs(spec): HOTFIXES entry + parent spec cross-link for Bug #11 timeout deviation

2026-05-27 23:16:18 +00:00

2026-05-27-v0.20-sub1-bugfix2-spec.md

docs(superpowers): v0.20 sub-item 1 bugfix1/2/3 specs + plans + DOGFOOD.md

2026-05-28 01:21:34 +00:00

2026-05-27-v0.20-sub1-bugfix3-spec.md

docs(superpowers): v0.20 sub-item 1 bugfix1/2/3 specs + plans + DOGFOOD.md

2026-05-28 01:21:34 +00:00

2026-05-27-v0.20-sub1-bugfix-spec.md

docs(superpowers): v0.20 sub-item 1 bugfix1/2/3 specs + plans + DOGFOOD.md

2026-05-28 01:21:34 +00:00

2026-05-28-v0.20-ingest-log-spec.md

style: cargo fmt --all (round 4 ingest log feature follow-up)

2026-05-28 04:18:40 +00:00

2026-05-28-v0.20.2-dogfood-findings-design.md

docs(spec): v0.20.2 dogfood findings 설계 + round-1 critic 반영

2026-05-28 20:37:42 +00:00

2026-05-28-v0.20.x-korean-morphological-tokenizer-spec-critic-r1.md

docs(superpowers): v0.20.x C 한국어 morphological tokenizer spec + plan artifacts

2026-05-28 12:53:31 +00:00

2026-05-28-v0.20.x-korean-morphological-tokenizer-spec-critic-r2.md

docs(superpowers): v0.20.x C 한국어 morphological tokenizer spec + plan artifacts

2026-05-28 12:53:31 +00:00

2026-05-28-v0.20.x-korean-morphological-tokenizer-spec.md

docs(release): v0.20.1 release notes draft + spec/plan dogfood cross-link

2026-05-28 13:34:33 +00:00

2026-05-28-v0.20.x-logging-r2-spec.md

docs(superpowers): v0.20.x logging r2 spec + plan artifacts

2026-05-28 08:04:32 +00:00

2026-05-29-dogfood-search-quality-eval-design.md

docs(spec): reflect search-quality critic round-1 (eval --config, lang-filter non-goal, curation)

2026-05-29 03:43:00 +00:00

2026-05-29-query-paraphrase-robustness-eval-design.md

docs(spec): query-paraphrase robustness 평가 프레임워크 설계 (측정 먼저)

2026-05-30 00:53:24 +00:00