Files
kebab/tasks/p9/p9-fb-38-score-semantics.md
altair823 16b4f9fb9f 📝 docs(HANDOFF): 도그푸딩 피드백에 따른 백로그 항목 추가
- P9 dogfooding 백로그 항목 fb-26 ~ fb-42 추가
- 각 항목의 목표, 증상, 후속 작업 및 위험 요소 명시
- release 계획에 따른 0.3.0 ~ 0.6.0 분할

📝 docs(INDEX): 백로그 항목에 대한 세부 정보 추가

- fb-26 ~ fb-42 항목의 세부 정보 및 상태 추가
- 각 항목의 목표와 후속 작업 명시
- 도그푸딩 피드백에 따른 개선 사항 반영

🔧 chore(tasks): 새로운 백로그 항목 파일 생성

- p9-fb-26 ~ p9-fb-42 각 항목에 대한 개별 파일 생성
- 각 파일에 목표, 증상, 후속 작업 및 위험 요소 포함
- doogfooding 피드백을 기반으로 한 개선 사항 문서화
2026-05-06 13:26:36 +00:00

2.0 KiB

phase, component, task_id, title, status, target_version, depends_on, unblocks, contract_source, contract_sections, source_feedback
phase component task_id title status target_version depends_on unblocks contract_source contract_sections source_feedback
P9 kebab-search + kebab-app + wire-schema p9-fb-38 Score semantics 노출 + 문서화 (RRF score 천장 / 채널별 score 분리) open 0.5.0
../../docs/superpowers/specs/2026-04-27-kebab-final-form-design.md
§4 search
§10 UX
wire-schema search_hit.v1
사용자 도그푸딩 2026-05-06 — Claude Code 가 kebab CLI 사용 후 "top score ~0.5 천장" 지적. RRF 의 rank-only fusion 특성상 absolute relevance 가 아닌데 외부 도구가 score 를 confidence 로 오해.

p9-fb-38 — Score semantics 노출 + 문서화

백로그 only — 미구현. 본 spec 은 도그푸딩 피드백 skeleton. 구현 착수 전 superpowers:brainstorming 으로 설계 단계 선행 필요. score field naming / wire schema 변경 범위 / 채널별 score 노출 정책 brainstorm 후 확정.

증상 / 동기

  • hybrid 검색의 RRF score 가 일정 ceiling 에 머무름. RRF 수식 (2/(k+rank), post-merge hotfix) 상 max = 2/(k+1).
  • 외부 도구 (Claude Code skill, MCP) 가 score 를 0~1 confidence 로 해석 → "0.5 면 50% 확신" 오용.
  • 단일 channel score (raw BM25 / cosine sim) 가 wire 에 노출 안 됨 — 디버깅도 어려움.

Goal (skeleton — brainstorm 단계에서 확정)

  • score 의 의미를 wire 와 README 에 명시.
  • 채널별 raw score (lexical BM25, vector cosine) 를 search_hit 에 옵션 필드로 노출.
  • RRF score 와 channel score 의 관계 / scale 문서화.

후속 작업 — brainstorm 필요 항목

  • score field 를 그대로 둘지 (legacy), rrf_score / lexical_score / vector_score 분리할지.
  • wire schema 변경이 additive (minor) 인지 breaking (major) 인지 결정.
  • README / docs/wire-schema 갱신 범위.

Risks / notes

  • wire schema breaking 시 외부 통합 (claude-code skill 등) 영향 — 버전 cascade 필요.
  • spec PR 우선 — design §4 search score scale 정의 추가.