-
v0.26.1 — ingest 진행 로그 개선 Stable
released this
2026-06-03 11:07:20 +00:00 | 27 commits to main since this releasev0.26.1 — ingest 진행 로그 개선
OCR/caption 이 켜진 볼트(이미지·PDF 혼재)를 색인할 때, 진행바가 멈춘 것처럼 보이는데 무엇 때문에 느린지 알 수 없던 문제를 해결합니다. 검색·색인 결과나 명령/설정은 전혀 바뀌지 않는 관측성(observability) 개선이라 patch 릴리스입니다(기본 동작 불변).
무엇이 보이게 되었나.
- 현재 파일명 — 진행바에 지금 처리 중인 파일이 표시됩니다 (
ingest [===>] 142/997 · vault/foo.png). - 느린 phase + 모델 — 이미지 OCR·caption·임베딩이 도는 동안 그 사실과 사용 모델이 실시간으로 보입니다 (
· OCR(gemma4:e4b)…). 이전엔 이미지 OCR/caption 에 진행 이벤트가 없어 "정지"처럼 보였습니다. - 경과시간 heartbeat — 한 파일이 오래 걸려도
(45s)처럼 경과초가 이벤트 사이에도 계속 갱신되어, 멈춘 게 아니라 무거운 작업 중임이 드러납니다. - 종료 요약 — 끝에 가장 오래 걸린 파일 top-5 가 출력되어 병목 파일을 사후에 바로 파악할 수 있습니다.
Trade-off / 호환성. 사람용 진행바(stderr) 표시만 풍부해졌고,
--json출력에는 additive wire 이벤트가 더해졌습니다 — 신규asset_phase(ingest_progress.v1) +asset_timings의ocr_ms/caption_ms필드. 모두 backward-compat(기존 소비자는 새 필드를 무시하면 그만)이라 wire major bump 없이 v1 유지. 미디어가 없는 텍스트 위주 ingest 의 표시·성능에는 변화가 없습니다.검증. clippy 0, kebab-app/cli 61 그룹·parse-image/tui 14 그룹 테스트 0 failed. 상세:
tasks/HOTFIXES.md2026-06-03 entry.참고: 색인이 느린 근본 원인이 미디어 OCR/caption 인 경우, 텍스트 위주 볼트라면
[image.ocr]/[image.caption]/[pdf.ocr]를enabled = false로 두면 크게 빨라집니다(이 릴리스의 로그가 그 판단을 돕습니다).Downloads
- 현재 파일명 — 진행바에 지금 처리 중인 파일이 표시됩니다 (