kebab

Author	SHA1	Message	Date
altair823	467a974901	docs(plan): doc-side expansion 구현 plan + spec 정제 (별도 FTS 테이블) spec: chunks_fts §5.5 verbatim 충돌 회피 → 별도 chunk_aliases_fts 테이블 + lexical 내부 body+alias 병합(RetrievalDetail/wire schema 무변경)으로 정제. plan: 7 task TDD (Chunk 필드 → V010 → config → ExpansionGenerator → ingest hook → lexical 병합 → 측정/문서). 완성 코드 + 빌드 규약. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 02:04:58 +00:00
altair823	098413922b	docs(spec): 색인시 doc-side expansion 설계 spec (Phase 2) brainstorm 확정: 청크당 별칭 생성(같은언어+한↔영 번역), additive+수동 재색인, 1차 단순 품질제어. 별도 FTS5 aliases 채널 → RRF 3채널 융합. flag off 기본, kebab eval variants 로 on/off 측정. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 01:54:46 +00:00
altair823	695010ea7a	Merge pull request 'docs: Phase 2 doc-side expansion 킥오프 + 구현 방법론 핸드오프' (#194 ) from docs/phase2-doc-expansion-kickoff into main Reviewed-on: #194	2026-05-30 01:23:48 +00:00
altair823	8bb7c276d0	docs: Phase 2 doc-side expansion 킥오프 + 구현 방법론 핸드오프 새 세션이 Phase 2(색인시 doc-side expansion)를 자립적으로 이어받을 컨텍스트 문서. 배경(rerank 반증→재정의→Phase1 진단 B우세→딥리서치→PoC), 설계 방향(KO↔EN 번역 별칭 + 별도 FTS5 필드 + RRF, flag off), 이미 만든 측정 도구(kebab eval variants + dogfood golden), 그리고 지금까지와 동일한 구현 방법론(brainstorm→spec→plan→OMC teammate sequential 구현+리뷰 +독립검증, 모델 라우팅, 빌드 redirect+exit, 측정=variant eval 프록시금지, gitea-pr 리뷰루프)을 담음. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 01:19:14 +00:00
altair823	01a03463a6	Merge pull request 'feat(eval): 변형 일관성(query-paraphrase robustness) 평가 프레임워크' (#193 ) from feat/paraphrase-robustness-eval into main Reviewed-on: #193	2026-05-30 01:12:26 +00:00
altair823	b6ad947378	docs: README 명령 표 슬림 + ARCHITECTURE 상세 이전·동기화 README 의 괴물 셀(ingest 2891→544, search 2952→687, ask 1244→415, tui 2300→453자)을 "무엇 + 핵심 flag + 포인터"로 축소. 빠진 구조 detail 은 ARCHITECTURE 로 이전: - symbol path 형식에 Go/Java/Kotlin/C/C++ 추가 + code chunk provenance(citation.kind/code_lang/repo) - Markdown title 자동 채움 순서(md-frontmatter-v2) - RAG groundedness 검증(mDeBERTa-v3 XNLI, nli_threshold gate) 결정 행 신설 - TUI 행을 P9-1~4 완료 + F1 cheatsheet 로 최신화 (stale "진행 예정" 제거) flag 망라는 --help, TUI 키는 in-app F1 cheatsheet(권위 런타임 소스)로 위임 — stale 방지. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 01:10:39 +00:00
altair823	1529e6d991	docs(readme): PR #193 회차 1 리뷰 반영 — eval 명령 표에 aggregate/variants 추가 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 01:00:32 +00:00
altair823	5ad1f98227	docs(handoff): doc-side expansion 딥리서치 + PoC 결과 (Phase 2 방향 확정) 딥리서치(104 agent): 어휘격차 pool-miss 최선책 = 색인시 doc-side expansion. PoC(dogfood KB): recall@50=0 이던 3쿼리가 별칭 추가로 rank1~2 부활(hybrid+vector, 골든 verbatim 아님=일반화). 핵심 미검증 고리 실 corpus 정량 확인. Phase 2 = 색인시 doc-side expansion(KO↔EN 번역 별칭) → 별도 FTS5 필드 → RRF, flag off. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 00:53:24 +00:00
altair823	a58cae2ff3	docs(research): 어휘격차 pool-miss 해결 딥리서치 레퍼런스 deep-research 워크플로(104 agent, 5각도, 22소스, 25 claim 3-vote 검증, 22 confirmed/3 killed). 결론: 색인시 doc-side expansion(doc2query)이 pool-miss 최선책 — pool 자체를 키우고 per-query 지연 ~0(색인시 1회), 정확매칭 보존(별도 필드 append). 단 vanilla mt5는 같은언어라 한/영 갭은 색인시 KO↔EN 대체 query 생성 필요. query-side(HyDE=거부된 per-query LLM, Vector-PRF=recall 주장 기각)는 부적합. 검증은 기존 variant eval 로 가능. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 00:53:24 +00:00
altair823	7a1dff1684	docs(handoff): query-paraphrase robustness Phase 1 완료 + (A)/(B) 진단 8그룹×4변형(dogfood) 측정: groups=8 A_dominant=2 B_dominant=4 spread@10=0.750. 진단 — 문제는 한/영이 아니라 어휘 거리(영어 풀어쓴 문장도 miss, 일부 한국어는 OK). B(어휘격차, recall@50=0, rerank 불가) 우세 → 쿼리 확장/번역 처방 신호. A(순위출렁)는 cap_theorem/vector_database 2그룹뿐. "측정 먼저" 논제 정량 검증(rerank 단독은 부분해법). Phase 2 처방 결정 대기. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 00:53:24 +00:00
altair823	0988f66331	feat(cli): kebab eval variants <run_id> — 변형 일관성 진단 리포트 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-30 00:53:24 +00:00
altair823	82e02aa4fe	fix(eval): 변형 일관성 리뷰 H1/M1 — pool truncation 방어 + answer 판정 정렬 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-30 00:53:24 +00:00
altair823	db4af0cc72	feat(eval): 변형 일관성 메트릭 + A/B(순위출렁/어휘격차) 분류 Co-Authored-By: Claude Opus 4.8 <noreply@anthropic.com>	2026-05-30 00:53:24 +00:00
altair823	ab20202241	test(eval): Task1 리뷰 nit — 3+멤버 그룹/group=None 테스트 + 에러 메시지에 divergent query id Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 00:53:24 +00:00
altair823	a51e6395c0	feat(eval): GoldenQuery.group + 그룹 정합성 검증 (변형 일관성 기반)	2026-05-30 00:53:24 +00:00
altair823	fe4c854673	docs(plan): query-paraphrase robustness Phase 1 구현 계획 5개 task: (1) GoldenQuery.group + 그룹 정합성 검증, (2) 변형 일관성 메트릭 모듈 + A/B(순위출렁/어휘격차) 분류, (3) kebab eval variants CLI, (4) dogfood golden 변형 그룹 큐레이션, (5) 측정 + 진단 리포트. TDD bite-sized, 완성 코드. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 00:53:24 +00:00
altair823	1de3f4ffca	docs(spec): query-paraphrase robustness 평가 프레임워크 설계 (측정 먼저) 목표 재정의: 한/영 overlap → 같은 의미의 다양한 표현(동의어·다른 어휘·풀어쓴 문장·한영)에서 일관된 답변 품질. 지난 reranker 실험이 overlap 프록시 최적화로 헛돈 교훈 반영 — 처방 전 진짜 지표(변형 일관성)를 직접 재는 평가부터. Phase 1(본 spec 구현): kebab-eval golden suite에 변형 그룹(intent group) + 변형 일관성 메트릭(recall_spread, answer_consistency) + recall@pool vs recall@k로 (A)순위출렁/(B)어휘격차 자동 판별. Phase 2(처방)는 측정 결과 게이트 뒤 조건부. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-30 00:53:24 +00:00
altair823	7fbfec647d	Merge pull request 'feat: v0.20.2 — Ask 응답언어 rag-v3 + 8 dogfood findings + 검색 품질 eval baseline' (#192 ) from fix/v0-20-2-dogfood-findings into main Reviewed-on: #192 v0.20.2	2026-05-29 05:27:52 +00:00
altair823	ca8c83b1ba	chore(hotfixes): PR #192 회차 1 리뷰 반영 — refusal marker 표기 정정 `<REFUSE>` marker → citation marker(`[#번호]`) 유무 기반 (pipeline.rs:463-486). release-notes 정정과 일관. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-29 05:22:57 +00:00
altair823	6c611990d8	chore: bump version 0.20.1 -> 0.20.2 v0.20.2 — Ask 응답언어 자동매칭(rag-v3) + 8 dogfood findings + eval --config facade 패치 + 검색 품질 golden baseline (hybrid hit@3=1.0 / MRR=0.833, lexical hit@3=1.0). evidence: tasks/HOTFIXES.md 2026-05-29, docs/release-notes/v0.20.2-draft.md. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-29 05:10:42 +00:00
altair823	166b1404e4	docs(release-notes): correct refusal判정 mechanism + O-2 phrasing leader review of writer draft: refusal 판정은 citation marker(`[#번호]`) 유무 기반이며 `<REFUSE>` 특수 마커가 아님. O-2 문구 예시도 실제 rag-v3 규칙으로 정정. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-29 04:58:08 +00:00
altair823	2d0168b7ab	docs(sync): README + HANDOFF v0.20.2 surface 반영 CLAUDE.md docs-split 규칙에 따라 사용자 visible surface 변경 동기화. README: - [rag] prompt_template_version default rag-v2 → rag-v3 (v0.20.2) - v3 규칙 설명 (답변 언어 = 질문 언어) - O-2 known limitation (소형 모델 refusal 언어 불일치) HANDOFF: - 머지 후 발견된 버그/결정 에 v0.20.2 1줄 요약 추가 - 검색 품질 baseline (hybrid MRR=0.833) + O-2 known limitation 언급 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 04:54:26 +00:00
altair823	4afcaf96d2	docs(release-notes): add v0.20.2-draft (rag-v3 응답언어 + 검색 품질 eval 인프라) v0.20.2 릴리즈 노트 초안 작성. 사용자 영향 4단락 구조로 각 finding 기술. - Finding #1/O-2: rag-v3 응답언어 자동 매칭 + refusal 언어중립화 - Finding #2: bulk search input schema 확정 (15필드) - Finding #3: list docs human-readable path 보강 - Finding #7: index_version 두 곳 구분 (vector vs FTS5) - eval --config facade + 검색 품질 baseline (hybrid hit@3=1.0 / MRR=0.833) - Finding #4/#5/#6/#8: docs/schema 정비 - version cascade 주의 (rag-v3 → eval compare) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 04:54:19 +00:00
altair823	16c4579399	docs(hotfixes): add 2026-05-29 v0.20.2 dogfood findings + 검색 품질 baseline 8-finding 도그푸딩 라운드 및 검색 품질 baseline 결과를 HOTFIXES 에 기록. - 8 findings 요약 표 (rag-v3, bulk schema, list docs, index_version 등) - Finding O-2 known limitation (소형 모델 refusal 언어 불일치) - 검색 품질 baseline 표 (hybrid MRR=0.833, lexical MRR=0.7) - golden 큐레이션 교훈 (dispatch.py 정답 정정 → hit@3 0.9→1.0) - eval logs cross-link Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 04:54:11 +00:00
altair823	40d7faee71	docs(dogfood): add §10.2 search quality baseline scenario (v0.20.2 golden suite) eval --config facade 패치로 dogfood KB 직접 평가 가능해짐에 따라 §10 Eval 에 §10.2 검색 품질 baseline 섹션 추가. - golden suite 실행 명령 (hybrid + lexical eval run → aggregate) - v0.20.2 metric baseline 표 (hybrid hit@3=1.0 / MRR=0.833) - 정성 체크리스트 (한국어 2자 hit@3, empty=0, MRR 임계치) - golden 큐레이션 절차 + dispatch.py 오류 교훈 - §10.1 로 기존 basic eval run 재구성 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 04:54:03 +00:00
altair823	a3bb2580bf	test(rag): add rag-v3 dispatch integration test + refresh stale rag-v2 docs (code-review) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 04:46:27 +00:00
altair823	2429189447	docs(spec): reflect search-quality critic round-1 (eval --config, lang-filter non-goal, curation) Incorporates all critic (opus) round-1 findings into the dogfood search-quality eval design spec: BLOCKER-1: §4.4 execution commands now use --config /build/dogfood/config.toml (Task A facade-rule patch makes this the canonical path). §5.1 re-titled from "(후속 패치)" to "Task A로 적용됨 — 권장 운영 경로"; XDG workarounds demoted to "패치 전 fallback". Intro paragraph updated accordingly. MAJOR-1: §3 Non-Goals gains an explicit bullet: lang/media/code_lang SearchFilters validation is out of scope for this harness (runner uses SearchFilters::default(), runner.rs:151). §4.1 "code 검색" row no longer claims code_lang filter coverage. MINOR-1: §4.3 step 3 now names kebab inspect doc <id> as the primary chunk-selection path (breaks chunk-level curation loop); search hits demoted to "보조 확인용". MINOR-2: §4.1 golden category table gains two new rows — 한국어 N-gram fallback query (복합어/신조어 coverage) and 영어 whole-token exact query (separates substring artefacts). MINOR-3: §4.1 YAML header note added: record corpus_revision in golden file so stale-bail root cause is immediately traceable. NIT: §9 References line numbers corrected (runner.rs:31, metrics.rs:116/144); runner.rs:151 SearchFilters::default() reference added. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 03:43:00 +00:00
altair823	d93b757cf1	fix(cli): thread --config through kebab eval run/aggregate/compare (facade-rule) Cmd::Eval now loads Config via cli.config (same pattern as all other subcommands) before dispatching to the inner match. Each arm now calls the *_with_config variant: run_eval(&opts) → run_eval_with_config(&cfg, &opts) compute_aggregate(run_id) → compute_aggregate_with_config(&cfg, run_id) store_aggregate(run_id, ..) → store_aggregate_with_config(&cfg, run_id, ..) Compare already called compare_runs_with_config but sourced cfg from Config::load(None) — that redundant load is removed; cfg comes from the shared binding above. Fixes the same facade-rule regression pattern as P3-5 / P4-3: previously `kebab --config /build/dogfood/config.toml eval run` silently evaluated the XDG-default (empty) KB instead of the dogfood KB. Also fixes runner.rs test that hardcoded rag-v2 after commit `5719969` bumped the default prompt_template_version to rag-v3. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 03:42:40 +00:00
altair823	571996938c	docs(contract): bump default prompt_template_version to rag-v3 (Todo #1 ) line 899: V1만 legacy → V1/V2 둘 다 legacy, v0.20.2 부터 rag-v3 default 선언. line 1349 (★): config 예시 default rag-v2 → rag-v3. line 1533 (★): §9 cascade table 코드 상수 rag-v2 → rag-v3. line 287 이후: answer.v1 예시 블록에 historical snapshot 주석 추가 (n1 — model+ptv stale, 값 변경 안 함). task spec grep 판단: tasks/p9/p9-fb-15 의 rag-v2 언급 2줄은 rag-v2 도입 시점 historical 기술 → frozen 유지. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 02:45:13 +00:00
altair823	be79bdb83d	docs(#7 ): distinguish vector-store vs FTS5 index_version (Todo #7 ) schema.schema.json models.index_version: vector store (LanceDB) version 임을 명시. search_hit.schema.json index_version: lexical (FTS5) version 임을 명시. search_hit.schema.json retrieval: 내부 필드 목록 + hybrid 전용 fusion 설명 추가 (hunk 공유). README kebab schema 행: index_version 두 곳의 의미가 다름을 주의 표기 추가. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 02:45:04 +00:00
altair823	4e76f103c1	docs(#5,#6): clarify retrieval.* nesting + single-mode score relation (Todo #5/#6) README Score 해석 절에 score ↔ retrieval.* 구조 설명 추가: - fusion_score/lexical_score/vector_score/lexical_rank/vector_rank 는 retrieval 내부 (top-level 아님). - single-mode 에서 score==fusion_score==lexical/vector_score 가 같은 값인 것은 정상 (Finding X). search_hit.schema.json score 필드에 score_kind 관계 + single-mode 동일값 이유 설명 추가. search_hit.schema.json retrieval/index_version 설명은 Task 12 커밋에 포함 (같은 hunk). Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 02:44:56 +00:00
altair823	4fd672193f	docs(#4 ): clarify lang vs code_lang semantic and und=code (Todo #4 ) lang_breakdown description에 code 문서는 자연어 감지 미수행(lang="und" 정상) 사실 추가. README에 lang vs code_lang 설명 절 신규 추가. task spec grep: tasks/p9/p9-fb-15 의 rag-v2 언급은 historical 기술 → frozen 유지. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 02:44:34 +00:00
altair823	1454321b12	fix(rag): rag-v3 refusal/hedge phrasing follows answer language (Finding O-2) SYSTEM_PROMPT_RAG_V3: 한국어 리터럴 refusal/hedge 문구를 언어 중립으로 교체. - 근거가 부족하면 "근거가 부족하다"고 답한다. → 답변 언어로 근거가 부족함을 밝히고 [#번호] 인용 없이 답한다. - 근거가 모호하면 "확실하지 않다" 라고 명시한다. → 근거가 모호하면 답변 언어로 불확실함을 명시한다. MULTI_HOP_SYNTHESIZE_SYSTEM_PROMPT: 동일 패턴 두 곳 교체. - 근거가 부족하면 "근거가 부족하다"고 답한다. → 답변 언어로 근거가 부족함을 밝히고 [#번호] 인용 없이 답한다. - self-check 의 즉시 "근거가 부족하다" 라고만 답한다. → 즉시 답변 언어로 근거가 부족하다고만 답한다. refusal 판정 로직(citation marker 기반)은 무변경 — 문구만 언어 중립화. test rag_v3_contains_v2_rules_plus_language_rule: "확실하지 않다" assert → "불확실함" assert 로 갱신. task spec grep: tasks/p9/p9-fb-15 의 rag-v2 언급은 도입 시점 historical 기술 → frozen 유지. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 02:43:28 +00:00
altair823	649ec35108	feat(cli): add Ollama remote-endpoint hint to kebab init (Todo #8 ) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 02:19:34 +00:00
altair823	dece5e89fc	feat(bulk): document bulk search input schema + error shape hint (Todo #2 ) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 02:16:21 +00:00
altair823	3cb49f1f9b	feat(cli): show title + doc_path in list docs human output (Todo #3 ) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>	2026-05-29 02:03:10 +00:00
altair823	f5ff823984	docs(dogfood): add RAG response-language scenario (Todo #1 verification)	2026-05-28 21:28:22 +00:00
altair823	b82eaec21a	feat(config): default prompt_template_version rag-v2 -> rag-v3 (Todo #1 )	2026-05-28 21:20:59 +00:00
altair823	6daa43375b	feat(rag): add rag-v3 system prompt with response-language matching (Todo #1 )	2026-05-28 21:20:18 +00:00
altair823	85efeeca3e	docs(plan): v0.20.2 dogfood findings 구현 plan (15 task) planner(opus) 작성 → critic 리뷰 시도 → leader 좌표 검증. 8 todo → 15 task: 코드 4 (rag-v3 / list docs / bulk / init) + 각 finding 후 전체 도그푸딩 검증 task 4 + docs-only 3 + contract + HOTFIXES/release-notes + version bump. plan critic round-1 은 환경 도구 손상으로 좌표 blocker(B-1/B-2/M-1/M-2)를 오진 → leader 가 pipeline.rs/config/cli/bulk/Cargo.toml 을 직접 grep 검증해 plan 좌표 정확 확인, executor 용 "anchor grep 재확인" + binary 경로 주의 헤더 추가. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-28 21:09:39 +00:00
altair823	2b4ba8e104	docs(spec): v0.20.2 dogfood findings 설계 + round-1 critic 반영 v0.20.1 전체 도그푸딩에서 발견된 8 todo (Ask 응답언어 rag-v3 / doc.lang docs / bulk input / list title / fusion_score·score_kind / schema index_version / Ollama hint) 를 단일 patch release 로 설계. writer worker 초안 → opus critic round-1 리뷰 반영: - B1: top-level score placeholder → 확정 (score_kind 가 의미 선언, search.rs:95-99) - M1: 이미지 caption 언어 강제 out-of-scope 명시 - M2: config default 테스트(lib.rs:1316) 갱신 필요 명시 - M3: bulk input 전체 필드 (query/mode/k/trust_min/ingested_after/media/tag/lang) - M4: rag-v3 의 eval_runs.config_snapshot_json cascade 영향 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-05-28 20:37:42 +00:00
altair823	b08941d6ab	docs(handoff): mark brainstorming-needed items in v0.20.1 findings todo 각 todo 에 fix path classification 추가: - 🧠 필수: design / user expectation 결정 필요 — brainstorming skill 우선 - 🔧 mechanical: spec drift 또는 명확한 fix — 별 brainstorming X - 📝 mild discussion: spec drafter self-review 로 trade-off 결정 가능 Classification: - 🧠 필수 (2): #1 Ask 영어→한국어 response policy, #4 doc.lang semantic - 🔧 mechanical (4): #2 bulk schema, #5/#6 docs sync, #7 schema rename - 📝 mild (3): #3 list title, #8 Ollama default 추가 brainstorming 후보 (직접 finding 외): - BS-A: HTML corpus 지원 (1415 file skipped) - BS-B: Tier 1/2/3 chunker UX visibility - BS-C: kebab dogfood subcommand (자동화) - BS-D: 영문 code chunk 의 tokenized_korean_text 효율 - BS-E: builtin_blacklist 명세 노출 권장 워크플로: 1. brainstorming 단계 먼저 (#1, #4 + BS-x 별 검토) 2. mechanical batch (#2, #5, #6, #7) — 한 PR 3. mild discussion batch (#3, #8) 4. dogfood retest → v0.20.2 patch release	2026-05-28 19:45:53 +00:00
altair823	6bf4e82e62	docs(handoff): v0.20.1 full dogfood findings todo for next session 머지 후 v0.20.1 의 full dogfood (사용자 실제 corpus 6293 file, 3.5 시간 ingest, §1~§11 시나리오) 발견된 findings 를 새 session 의 self- contained todo handoff 로 정리. P0 (bug / 의도와 다른 동작): - #1 Ask 영어 query → 한국어 응답 (rag-v2 prompt template 강제) - #2 bulk search input format 불명확 (wire schema 미명시) - #3 list docs title 중복 (heading-based, doc_path 보조 필요) - #4 doc.lang = und 53% (code file 의 lang detection 실패) P1 (docs drift): - #5 fusion_score 위치 (.retrieval.fusion_score) - #6 score_kind="bm25" 의미 (lexical mode 의 fusion_score) - #7 schema index_version vs lexical_index_version 혼동 P2 (setup): - #8 Ollama endpoint default 가 localhost (사용자 환경 remote) 각 todo 별 severity, scenario, suspected location, action item 명시. 새 session 시작 명령 + branch 권장 + 도그푸딩 재실행 절차 + finding cumulative table 포함. Repo state: main HEAD=a0c7fa3, clean. v0.20.1 binary OK. /build/dogfood/ KB (3940 docs, 34896 chunks) preserved for regression test.	2026-05-28 19:40:10 +00:00
altair823	a0c7fa3d1a	docs(claude): dogfood 보관소를 /build/dogfood/ 로 통합 + 분류 정책 명시 사용자 정정 따라 dogfood data layout 갱신: 1. 위치: /build/cache/dogfood/ → /build/dogfood/. /build/cache 는 의미상 캐시 (regeneratable downloads/models) 이지 test data 아님. /build/dogfood 는 sudo 로 신설 + chown. 2. 분류 정책: kebab version / 생성 시점 / scenario name prefix 금지 (v0.20.1-dogfood/, dogfood-v018/ 같은 디렉토리 신설 X). 모든 분류 는 문서 의미 / 종류 / 형식 기준만. 자세한 layout 은 /build/dogfood/README.md. 3. 단일 디렉토리 정책: source 문서 + KB state + logs 모두 /build/ dogfood/ 안 하나로. 매 도그푸딩 run 마다 kb/ 만 reset, 별 디렉토리 신설 X. 4. 금지 위치 명시: /tmp/kebab-, /build/cache/dogfood, /home/altair823/ KnowledgeBase, XDG paths 신규 사용 금지. Source dirs 정리 (이번 commit 외 별 작업으로 완료): - /build/cache/dogfood{,-p10b,-v017,-v018,-v0.19.0} 모두 삭제 (move 후). - /home/altair823/KnowledgeBase, kebab-dogfooding 도 /build/dogfood/ 로 이동. - XDG paths 는 /build/dogfood/_archive/xdg-state/ 로 snapshot. 최종 corpus: 6293 files (markdown/code/html/manifest/resources), 554M.	2026-05-28 14:44:23 +00:00
altair823	ebc6bf45c4	Merge pull request 'feat(v0.20.1): 한국어 morphological tokenizer (V009) + N-gram supplement + eager backfill' (#191 ) from feat/korean-morphological-tokenizer into main v0.20.1 — V009 한국어 morphological tokenizer + N-gram supplement (Bug #8 closure). 22 implementation commit + 2 docs polish (dogfood data consolidation + CLAUDE.md trigger policy). Dogfood evidence: KnowledgeBase 1781 doc / 9050 chunk backfill 26.6초, '한국' query 0 → 10 hit. PR-level review verdict: APPROVED WITH NOTES (4 minor docs polish, all addressed).	2026-05-28 14:17:13 +00:00
altair823	d8fdc815be	docs(claude): dogfood trigger + 통합 data 보관소 정책 사용자 요청 — 사용자가 누적된 ad-hoc 도그푸딩 데이터를 /build/cache/ dogfood/ 한 곳에 collection 한 후, 도그푸딩의 필요 시점을 추론해 CLAUDE.md 에 정책 section 추가. 신규 section `## Dogfood trigger` (사이 Release 와 Naming): - 도그푸딩이 필요한 시점 (6 trigger 분류: schema/migration, wire schema/CLI, search/RAG, performance, language/locale, file/asset). - Release-level: bump commit 이전에 evidence 명시 필수. - 도그푸딩 데이터 보관소: /build/cache/dogfood/ 의 디렉토리 구조 + README.md cross-link + /tmp/kebab-* 신규 사용 금지. - 도그푸딩 결과 기록: HOTFIXES dated entry + release notes draft 의 4-단락 풀어쓰기 + DOGFOOD.md scenario catalog cascade. 실 작업: - /build/cache/tmp/v0.20.1-* 5 디렉토리, /tmp/dogfood-* 2 디렉토리, 관련 log file 모두 /build/cache/dogfood/ 로 mv. config.toml 의 hard-coded path 자동 sed-replace. - /build/cache/dogfood/README.md 신규 — 디렉토리 구조 + 신규 시나리오 시작 절차 + V007 시뮬레이션 패턴 + 정리 정책. 기대 효과: 도그푸딩 evidence 의 git-tracked HOTFIXES + draft release notes 외에도 raw data 가 한 곳에서 자유롭게 재사용 가능. 새 release 의 도그푸딩이 이전 KB 위에서 incremental 확인 가능. Spec: docs/superpowers/specs/2026-05-28-v0.20.x-korean-morphological-tokenizer-spec.md §9 (도그푸딩 evidence cascade) Plan: post-implementation infrastructure	2026-05-28 14:06:24 +00:00
altair823	9f2a56d091	docs(hotfixes): large-scale KnowledgeBase dogfood evidence (N-gram supplement) 사용자 실제 /home/altair823/KnowledgeBase/ (1781 markdown / 9050 chunk) 를 v0.20.1+N-gram supplement 포함 binary 로 backfill 재실행: - Backfill duration: 26.6초 (9050 chunk, OnceLock 캐시 + 1000-row batch transaction). ~3 ms/chunk amortized. - '한국' query: V007 의 0 hit → V009 + N-gram 의 10 hit (Bug #8 functional closure 실측 검증). - '한국어' query: 5 → 10 hit (morpheme + N-gram 동시 매칭). - 영어 whole-token: 'token'/'pipeline'/'config' = 10 hit each (V009 회귀 측면 정상). Snippet evidence: KB 의 testdata/coding-md-corpus/*/...md 의 "문서를 한국어로 다시 정리하기" 패턴이 ko-dic 분해 + N-gram window 로 '한국' query 매칭 demonstrate. 기타 한국어 (서울, 지하철, 대한민국 등) 0 hit 는 KB corpus 의 단어 자체 부재 — data limitation, V009 implementation limitation X. Test data 위치: - /home/altair823/KnowledgeBase/ (사용자 실제 KB, 1781 markdown) - /build/cache/tmp/v0.20.1-dogfood/kb/ (ingested SQLite + LanceDB) - /build/cache/tmp/v0.20.1-dogfood2/corpus/ (한국어 wiki fixture) - /build/cache/tmp/v0.20.1-v007strict/corpus/no-space.md (whitespace-less) - /build/cache/tmp/v0.20.1-ngram/corpus/extra.md (대한민국, 한국정부, 주민등록번호) Spec: docs/superpowers/specs/2026-05-28-v0.20.x-korean-morphological-tokenizer-spec.md §9 + Appendix B Plan: docs/superpowers/plans/2026-05-28-v0.20.x-korean-morphological-tokenizer-plan.md (dogfood evidence final)	2026-05-28 14:02:02 +00:00
altair823	fe20be8195	feat(chunk): N-gram supplement (Option β) — sub-token emit for Korean compounds #4 (사용자 요청): spec §6.2 의 Option β (sub-token 추가 emit) 를 v0.21.x P9 follow-up 에서 v0.20.1 implementation 으로 promote. dogfood 의 ko-dic compound noun limitation (`대한민국`, `한국정부`, `주민등록번호` 등 단일 token 정책) 해소. Implementation (`crates/kebab-chunk/src/lib.rs::tokenize_korean_morphological`): - 신규 helper `is_hangul()` — 한글 음절 (U+AC00..D7A3) + 자모 (U+1100..11FF, U+3130..318F) 판정. - lindera output 의 각 morpheme 에 대해, 한글만 + 길이 ≥ 3 인 경우 sliding window 2-gram 추가 emit. `[한국정부, 한국, 국정, 정부]` 형태로 token list expand. - 영어 / 숫자 / 혼합 token 은 supplement X (false positive 회피). Tests (`crates/kebab-chunk/tests/tokenize_korean.rs`): - `tokenize_korean_morphological_emits_2gram_for_long_morpheme`: 5 probe fixture 중 supplement 발화 case 확인 (실측 `서울특별시` → `[서울, 특별시, 특별, 별시]`, `대한민국` → `[대한민국, 대한, 한민, 민국]`). - `tokenize_korean_morphological_no_2gram_for_english`: Rust optimization fixture 에서 영어 substring (`Rus`, `ust`, `imi`) emit 없음 보장. Dogfood evidence (`tasks/HOTFIXES.md` 2026-05-28 entry 보강): - '대한', '한민', '민국' query 모두 hit (대한민국 의 sliding window). - '특별', '주민', '등록' 같은 sub-token query hit. - 영어 'tokenizer' query 는 corpus 부재로 0 hit (supplement X). - Trade-off: DB size +20-30% (Korean-heavy), false positive 작은 risk. Spec: docs/superpowers/specs/2026-05-28-v0.20.x-korean-morphological-tokenizer-spec.md §6.2 (Option β promote) Plan: docs/superpowers/plans/2026-05-28-v0.20.x-korean-morphological-tokenizer-plan.md (post-implementation enhancement)	2026-05-28 13:48:05 +00:00
altair823	028d9ad4ea	docs(release): v0.20.1 release notes draft + spec/plan dogfood cross-link #1 (사용자 요청): release notes draft 작성 + spec/plan 의 dogfood evidence cross-link 보강. docs/release-notes/v0.20.1-draft.md (신규): - 4 단락 본문 (한국어 2자 query 지원 + 영어 substring 회귀 + V007→V009 자동 backfill + ingest 성능 영향). - Migration cascade table (lexical_index_version, corpus_revision, wire schema shape preservation). - API + dependency 변경 (lindera v3, lindera-ko-dic v3, retired short_query_hint helper, 새 facade APIs). - Breaking changes 명시 (영어 substring 회귀, 첫 부팅 latency, DB/ binary 크기 증가). - Upgrade 절차 + Known limitation + 14 dogfood scenario reference. spec Appendix B (segmentation evidence): - "Empirical verification (2026-05-28 dogfood — post-merge update)" subsection 신규. prior-knowledge 가정 vs 실측 결과 table. Scenario 1-4 모두 verified 표시. ko-dic 의 '서울특별시' → '[서울, 특별시]' 분해 증거 명시. plan Changelog: - post-implementation entry: 22 commit on branch, S3 blockers, S7 cascade, S11 sanity regression updates, opus PR review 4 finding fixes. - dogfood evidence entry: 14 scenario verify pass, ko-dic 분해 evidence, HOTFIXES + spec Appendix B cross-link. Spec: …spec…md Appendix B Plan: …plan…md (post-implementation + dogfood evidence Changelog) Release notes: docs/release-notes/v0.20.1-draft.md	2026-05-28 13:34:33 +00:00
altair823	a3513c9110	docs(hotfixes): V009 dogfood verification evidence (2026-05-28) V009 한국어 morphological tokenizer 의 dogfood 검증 결과를 HOTFIXES 2026-05-28 entry 에 보강. 14 scenario 의 hit count + ko-dic 의 compound noun 분해 evidence (서울특별시 → [서울, 특별시]) + Option α acceptance 의 known limitation 명시. Reference corpus: DOGFOOD.md §2.1bis 의 korea-overview.md + korea-compound.md (10 KB 합계, 2 markdown). KB ingest + 14 query 검증 모두 expected. 사용자 KnowledgeBase 같은 영어/code 중심 KB 에서 한국어 lexical 0-hit 가 정상임을 reference fixture evidence 와 분리해 사용자 오인 방지. Spec: docs/superpowers/specs/2026-05-28-v0.20.x-korean-morphological-tokenizer-spec.md §9 Plan: docs/superpowers/plans/2026-05-28-v0.20.x-korean-morphological-tokenizer-plan.md (S11 + dogfood evidence)	2026-05-28 13:24:29 +00:00

1 2 3 4 5 ...

1015 Commits