v0.17.0 release cut — PR-A (한국어 trigram FTS tokenizer + lexical builder + hint surface) + PR-B (C typedef alias unit + parser_version cascade + orphan purge) + PR-C (code_lang_chunk_breakdown additive wire field) 셋 머지 후. Breaking changes: - V007 migration (chunks_fts unicode61 → trigram) — chunks 원본 / embedding / vector 불변, FTS shadow 자동 backfill. 사용자는 다음 open 시 V007 즉시 적용 (re-ingest 불필요). kebab.sqlite 파일 크기 ~2-5배 또는 수백 MB 증가. - 영어 lexical 검색이 substring 매칭으로 동작 변경 (token → tokenization/tokenizer 도 hit, recall ↑ / 단어 경계 ↓). - C parser_version code-c-v1 → code-c-v2 (typedef alias 추출 cascade). 같은 file 의 옛 doc/chunks/vector 는 same-workspace_path orphan purge 가 자동 정리. Additive (backwards-compat): - SearchResponse.hint additive field — 한국어 2자 query 등 trigram 비호환 시 안내. - schema.v1.stats.code_lang_chunk_breakdown additive field — chunk 단위 언어별 분포. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
4.8 KiB
4.8 KiB