docs(release-notes): correct refusal判정 mechanism + O-2 phrasing

leader review of writer draft: refusal 판정은 citation marker(`[#번호]`)
유무 기반이며 `<REFUSE>` 특수 마커가 아님. O-2 문구 예시도 실제 rag-v3
규칙으로 정정.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-05-29 04:58:08 +00:00
parent 2d0168b7ab
commit 166b1404e4

View File

@@ -36,9 +36,9 @@ kebab ask "토크나이저가 뭐야?" # → 한국어 답변
**trade-off**: 한국어 corpus 를 영어로 물을 때 LLM 이 근거를 영어로 번역해 답하므로 원문 표현이 일부 달라질 수 있다. 원문 그대로 필요하면 큰따옴표 직접 인용 (`[#번호]` 앞에 chunk 속 원문) 이 v3 에서도 유지된다.
**Finding O-2 — refusal 언어중립화**: refusal 문구의 한국어 리터럴 (`"근거가 부족합니다"`) 언어중립 표현 (`"근거가 부족하면 답변 언어로 답변할 수 없습니다"`) 으로 변경.
**Finding O-2 — refusal 언어중립화**: rag-v3 system prompt 의 refusal/hedge 규칙에서 한국어 리터럴 (`근거가 부족하면 "근거가 부족하다"고 답한다`) 언어중립 표현 (`근거가 부족하면 답변 언어로 근거가 부족함을 밝히고 [#번호] 인용 없이 답한다`) 으로 변경.
**Known limitation**: gemma4:e4b 같은 소형 모델은 refusal 메시지의 언어가 query 언어와 불일치할 수 있음 (영어 query → 한국어 refusal 가능). refusal 판정 자체는 `<REFUSE>` marker 기반이라 정확도 영향 없음.
**Known limitation**: gemma4:e4b 같은 소형 모델은 refusal 메시지의 언어가 query 언어와 불일치할 수 있음 (영어 query → 한국어 refusal 가능). refusal 판정 자체는 답변의 citation marker (`[#번호]`) 유무 기반 — 유효 marker 가 없으면 `LlmSelfJudge` 로 refuse 판정 — 이라 문구 언어와 무관하게 정확함 (refusal 문구 텍스트는 판정에 쓰이지 않음).
**mitigation**:
- refusal 판정은 LLM 출력 내 marker 기반으로 항상 정상 동작.