diff --git a/docs/SMOKE.md b/docs/SMOKE.md index c5124ff..941e105 100644 --- a/docs/SMOKE.md +++ b/docs/SMOKE.md @@ -107,16 +107,18 @@ respect_markdown_headings = true chunker_version = "md-heading-v1" [models.embedding] -provider = "fastembed" # "fastembed"(기본) / "candle"(순수 Rust, NUMA-안전) - # / "none"(lexical-only — Ollama 불필요) - # ⚠ provider="candle" 사용 시 아래 model/dimensions 도 - # multilingual-e5-large / 1024 로 바꿔야 함 - # (candle 은 현재 e5-large 만 지원). -model = "multilingual-e5-small" +provider = "fastembed" # "fastembed"(기본, onnxruntime) / "candle"(순수 Rust, NUMA-안전) + # / "ollama"(원격 HTTP /api/embed) / "none"(lexical-only — Ollama 불필요) + # ⚠ provider/model 변경 시 아래 dimensions 도 맞춰야 함. +model = "multilingual-e5-small" # candle/ollama 는 "snowflake-arctic-embed-l-v2.0" + # (ollama 태그 "snowflake-arctic-embed2", 1024-dim) 도 지원 — + # 설명형 query recall 보강. e5↔arctic 전환은 + # embedding_version cascade (재색인 필요). version = "v1" -dimensions = 384 +dimensions = 384 # arctic / e5-large 는 1024. batch_size = 64 num_threads = 0 # candle 전용 CPU 스레드 캡 (0=auto). env KEBAB_EMBED_THREADS 우선. +# endpoint = "http://127.0.0.1:11434" # provider="ollama" 전용; 생략 시 [models.llm].endpoint fallback. [models.llm] provider = "ollama"