//! config.toml 마이그레이션 엔진 (순수 변환, I/O 없음). //! //! 두 메커니즘: (1) reconciliation — default 구조에 있고 사용자 파일에 //! 없는 섹션/키를 주석과 함께 추가. (2) step 체인 — schema_version 기반 //! non-additive 변환(deprecated 제거 등). 자세한 계약은 spec //! `docs/superpowers/specs/2026-05-31-config-migration-design.md`. use toml_edit::{DocumentMut, Item}; /// 현재 바이너리가 이해하는 config 스키마 버전. 마이그레이션 완료 시 /// 사용자 파일의 `schema_version` 을 이 값으로 stamp 한다. pub const CURRENT_SCHEMA_VERSION: u32 = 4; /// 한 번의 마이그레이션에서 발생한 개별 변경. #[derive(Clone, Debug, PartialEq, serde::Serialize)] pub struct MigrationChange { pub kind: ChangeKind, /// dotted path, 예: `ingest.code`, `workspace.include`. pub path: String, /// 사람·wire 용 한 줄 설명. pub detail: String, } #[derive(Clone, Copy, Debug, PartialEq, Eq, serde::Serialize)] #[serde(rename_all = "snake_case")] pub enum ChangeKind { AddedSection, AddedKey, RemovedDeprecated, } /// 마이그레이션 결과 요약(순수 변환 단계 산출). I/O 계층이 backup_path /// 등을 채워 wire 로 내보낸다. #[derive(Clone, Debug, PartialEq, serde::Serialize)] pub struct MigrationOutcome { pub from_schema_version: u32, pub to_schema_version: u32, pub changes: Vec, /// 변환 후 직렬화된 새 문서 텍스트(멱등 시 입력과 동일). pub new_text: String, } impl MigrationOutcome { pub fn changed(&self) -> bool { !self.changes.is_empty() } } /// 문서 최상단 헤더(경로 정책 등). 기존 init 헤더를 이전. const HEADER: &str = "\ # kebab config — `~/.config/kebab/config.toml`. # # `workspace.root` accepts: 절대 / tilde(~) / env(${VAR}) / 상대 경로. # 상대 경로의 base 는 cwd 가 아니라 THIS config 파일의 디렉토리. # # 처리 가능한 형식 (extractor 가 자동 결정 — config 에 명시할 수 없음): # • Markdown: .md # • 이미지: .png .jpg .jpeg (OCR + caption) # • PDF: .pdf # # 런타임 override: `KEBAB_*` env (예: KEBAB_WORKSPACE_ROOT=/tmp kebab ingest). # # 이 파일은 `kebab config migrate` 로 새 스키마에 맞춰 갱신할 수 있다 # (빠진 섹션 추가 + 손본 값·주석 보존). "; /// 테이블 헤더(`[section]`) 위에 붙일 주석. dotted path → 한 줄(들). fn section_comment(path: &str) -> Option<&'static str> { Some(match path { "workspace" => "# 색인 대상 워크스페이스.", "workspace.sources" => "# named multi-source (각 source 의 id 가 documents.source_id 로 stamp).", "storage" => "# XDG 저장 경로(데이터/sqlite/벡터/에셋/모델).", "indexing" => "# 병렬도 + 파일시스템 watch.", "chunking" => "# 청크 크기·오버랩·heading 존중.", "models" => "# embedding / llm / nli 모델.", "models.embedding" => "# 다국어 sentence embedding. dim 불일치 시 검색 0건.", "models.llm" => "# Ollama host:port + 모델.", "models.nli" => "# NLI(groundedness) 모델.", "search" => "# 검색 기본 k·stale 기준·fusion.", "rag" => "# 답변 생성: prompt 템플릿·score gate·NLI.", "ui" => "# TUI 팔레트·role 스타일.", "ingest" => "# 모든 형식 ingest 우산: 병렬도 + chunking/code/image/pdf.", "ingest.chunking" => "# 청크 크기·오버랩·heading 존중(전 형식 공통).", "ingest.code" => "# code ingest skip 정책(.gitignore 자동 honor).", "ingest.image" => "# 이미지 OCR + 캡션(기본 off, asset 당 모델 호출 비용).", "ingest.image.ocr" => "# 이미지 OCR(기본 off).", "ingest.image.caption" => "# 이미지 캡션(기본 off).", "ingest.pdf" => "# PDF ingest. scanned PDF OCR 은 기본 off(page 당 cost).", "ingest.pdf.ocr" => "# scanned PDF page-단위 OCR(기본 off).", "logging" => "# ingest 로그(기본 on, ~/.local/state/kebab/logs).", _ => return None, }) } /// leaf 키 인라인 주석. dotted path(예: `ingest.chunking.target_tokens`) → 한 줄. /// 값 뒤에 ` # ...` suffix 로 부착된다(`#` 없이 본문만 반환). fn key_comment(path: &str) -> Option<&'static str> { Some(match path { "workspace.root" => "색인 루트. 절대/~/${VAR}/상대(=이 파일 기준).", "workspace.exclude" => "denylist glob.", "storage.copy_threshold_mb" => "이 크기(MB) 초과 파일은 사본 대신 참조.", "models.embedding.provider" => "fastembed | candle | ollama | none.", "models.embedding.dimensions" => "모델 출력 차원. 틀리면 검색 0건.", "models.embedding.num_threads" => "candle 전용 CPU 스레드 cap(0=auto).", "models.embedding.endpoint" => "ollama provider 시 HTTP. 비우면 llm.endpoint fallback.", "models.llm.request_timeout_secs" => "단일 HTTP 상한. 0=즉시실패(비활성화 아님).", "ingest.max_parallel_extractors" => "동시 extractor 수.", "ingest.max_parallel_embeddings" => "동시 임베딩 수.", "ingest.chunking.target_tokens" => "청크 목표 토큰(전 형식 공통).", "ingest.chunking.respect_markdown_headings" => "markdown heading 경계 존중.", "ingest.image.ocr.enabled" => "이미지 OCR(기본 off, asset 당 비용).", "ingest.image.ocr.engine" => "ollama-vision | paddle-onnx.", "ingest.image.ocr.model" => "ollama-vision 전용. paddle-onnx 는 번들 모델 사용(이 값 무시).", "ingest.image.ocr.request_timeout_secs" => "0=즉시실패(비활성화 아님).", "ingest.image.ocr.score_thresh" => "DBNet box 점수 하한(paddle).", "ingest.image.ocr.unclip_ratio" => "box 패딩 비율(paddle).", "ingest.image.ocr.max_boxes" => "이미지당 box cap(paddle).", "ingest.image.caption.enabled" => "이미지 캡션(기본 off).", "ingest.pdf.ocr.enabled" => "scanned PDF OCR(기본 off, page 당 비용).", "ingest.pdf.ocr.always_on" => "true=모든 page vision 호출(dual-text).", "ingest.pdf.ocr.engine" => "ollama-vision | paddle-onnx.", "ingest.pdf.ocr.model" => "ollama-vision 전용. paddle-onnx 는 번들 모델 사용.", "ingest.pdf.ocr.valid_ratio_threshold" => "유효문자 비율 < 이면 scanned 판정.", "ingest.pdf.ocr.min_char_count" => "page 문자수 < 이면 auto-scanned.", "ingest.pdf.ocr.request_timeout_secs" => "0=즉시실패(비활성화 아님).", "rag.score_gate" => "검색 점수 게이트.", "rag.nli_threshold" => "0=NLI 게이트 off.", "search.default_k" => "기본 검색 결과 수.", "ui.theme" => "dark | light.", "logging.ingest_log_enabled" => "ingest 로그(기본 on).", _ => return None, }) } /// Config::defaults() 를 직렬화 + 주석 부착한 "완전체" 문서. /// init 과 migrate reconciliation 의 단일 참조 원천. pub fn annotated_default_document() -> DocumentMut { let defaults = crate::Config::defaults(); let pretty = toml::to_string_pretty(&defaults).expect("defaults serialize"); let mut doc: DocumentMut = pretty.parse().expect("defaults parse as toml_edit"); // 헤더: 첫 최상위 항목의 prefix 로. if let Some((mut first_key, _)) = doc.as_table_mut().iter_mut().next() { first_key.leaf_decor_mut().set_prefix(format!("{HEADER}\n")); } annotate_table(doc.as_table_mut(), ""); doc } /// 재귀적으로 하위 테이블에 헤더 주석 부착. `prefix_path` 는 dotted 누적 경로. /// annotated_default_document 는 항상 주석 없는 defaults 에서 새로 만들므로 /// 무조건 부착해도 중복되지 않는다. fn annotate_table(table: &mut toml_edit::Table, prefix_path: &str) { let keys: Vec = table.iter().map(|(k, _)| k.to_string()).collect(); for key in keys { let path = if prefix_path.is_empty() { key.clone() } else { format!("{prefix_path}.{key}") }; if let Some(item) = table.get_mut(&key) { if let Some(sub) = item.as_table_mut() { if let Some(c) = section_comment(&path) { sub.decor_mut().set_prefix(format!("\n{c}\n")); } annotate_table(sub, &path); } else if let Some(kc) = key_comment(&path) { // 스칼라/배열 leaf: 값 뒤 인라인 주석 suffix. 배열(exclude 등)은 // 멀티라인 직렬화돼도 닫는 `]` 뒤로 가 유효. if let Some(v) = item.as_value_mut() { v.decor_mut().set_suffix(format!(" # {kc}")); } } } } } /// 참조(주석 달린 default) 테이블 `reference` 를 기준으로, 사용자 테이블 /// `user` 에 없는 항목을 decor(주석) 포함 통째 복사한다. 이미 있는 키는 /// 건드리지 않는다(값 불가침). 양쪽이 테이블이면 하위로 재귀. pub fn reconcile( reference: &toml_edit::Table, user: &mut toml_edit::Table, prefix_path: &str, changes: &mut Vec, ) { for (key, ref_item) in reference.iter() { let path = if prefix_path.is_empty() { key.to_string() } else { format!("{prefix_path}.{key}") }; match user.get_mut(key) { None => { // schema_version 키는 stamp 단계가 다룬다(change 기록 X). if path == "schema_version" { user.insert(key, ref_item.clone()); continue; } let kind = if ref_item.is_table() { ChangeKind::AddedSection } else { ChangeKind::AddedKey }; user.insert(key, ref_item.clone()); changes.push(MigrationChange { kind, path: path.clone(), detail: section_comment(&path).map_or_else( || format!("{key} 추가"), |c| c.trim_start_matches("# ").to_string(), ), }); } Some(existing) => { if let (Some(ref_tbl), Some(user_tbl)) = (ref_item.as_table(), existing.as_table_mut()) { reconcile(ref_tbl, user_tbl, &path, changes); } // 둘 다 테이블이 아니면(스칼라 등) 값 불가침 → 무시. } } } } /// v1 → v2: deprecated `workspace.include` 제거(p9-fb-25). 멱등. pub fn step_1_to_2(doc: &mut DocumentMut, changes: &mut Vec) { if let Some(ws) = doc.get_mut("workspace").and_then(|i| i.as_table_mut()) { if ws.remove("include").is_some() { changes.push(MigrationChange { kind: ChangeKind::RemovedDeprecated, path: "workspace.include".to_string(), detail: "p9-fb-25: 처리 형식은 extractor 가 자동 결정 — 더 이상 사용 안 함." .to_string(), }); } } } /// `from_path` 의 마지막 키를 통째(decor 포함) remove 해 `to_path` 의 dotted /// 경로에 삽입한다(중간 테이블 자동 생성). 대상 키가 이미 있으면 덮어쓰지 /// 않는다(사용자 명시 우선). 원본이 없으면 no-op(멱등). fn move_table( doc: &mut DocumentMut, from_path: &[&str], to_path: &[&str], changes: &mut Vec, ) { // from 의 부모까지 내려가 마지막 키를 remove. let (from_parent, from_key) = from_path.split_at(from_path.len() - 1); let mut cur = doc.as_table_mut(); for k in from_parent { match cur.get_mut(k).and_then(Item::as_table_mut) { Some(t) => cur = t, None => return, // 원본 없음 → no-op. } } let Some(item) = cur.remove(from_key[0]) else { return; }; // to 경로의 부모 테이블 확보(없으면 생성), 마지막 키에 삽입. let (to_parent, to_key) = to_path.split_at(to_path.len() - 1); let mut cur = doc.as_table_mut(); for k in to_parent { if cur.get(k).is_none() { cur.insert(k, Item::Table(toml_edit::Table::new())); } cur = cur .get_mut(k) .and_then(Item::as_table_mut) .expect("just inserted"); } if cur.get(to_key[0]).is_none() { cur.insert(to_key[0], item); changes.push(MigrationChange { kind: ChangeKind::AddedSection, path: to_path.join("."), detail: format!("{} → {}", from_path.join("."), to_path.join(".")), }); } } /// 옛 `[indexing]` 의 bare 스칼라 키들을 `[ingest]` 로 옮긴다(테이블 자체가 /// 아니라 키 단위). 대상에 이미 있는 키는 덮어쓰지 않는다. fn move_indexing_keys(doc: &mut DocumentMut, changes: &mut Vec) { let Some(idx) = doc.as_table_mut().remove("indexing") else { return; }; let Some(idx_tbl) = idx.as_table().cloned() else { return; }; if doc.get("ingest").is_none() { doc["ingest"] = Item::Table(toml_edit::Table::new()); } let ingest = doc["ingest"].as_table_mut().expect("ingest table"); for (k, v) in idx_tbl.iter() { if ingest.get(k).is_none() { ingest.insert(k, v.clone()); } } changes.push(MigrationChange { kind: ChangeKind::AddedKey, path: "ingest".to_string(), detail: "indexing → ingest (병렬도 키)".to_string(), }); } /// v3: pdf paddle 동작 보존. v2 는 pdf paddle 이 `[image.ocr]` 의 모델 경로를 /// 빌려썼다. relocation 후 image.ocr 의 paddle 6키 실제 값을 pdf.ocr 대칭 /// 키로 복사한다(pdf 가 이미 명시한 키는 덮어쓰지 않음, pdf 가 paddle 일 때만). fn copy_image_paddle_to_pdf(doc: &mut DocumentMut) { const PADDLE_KEYS: [&str; 6] = [ "det_model", "rec_model", "dict", "score_thresh", "unclip_ratio", "max_boxes", ]; let img = doc .get("ingest") .and_then(|i| i.get("image")) .and_then(|i| i.get("ocr")) .and_then(Item::as_table) .cloned(); let Some(img) = img else { return; }; let pdf_is_paddle = doc .get("ingest") .and_then(|i| i.get("pdf")) .and_then(|i| i.get("ocr")) .and_then(|o| o.get("engine")) .and_then(Item::as_str) == Some("paddle-onnx"); if !pdf_is_paddle { return; } let Some(pdf) = doc["ingest"]["pdf"]["ocr"].as_table_mut() else { return; }; for k in PADDLE_KEYS { if pdf.get(k).is_none() { if let Some(v) = img.get(k) { pdf.insert(k, v.clone()); } } } } /// v2 → v3: 미디어 테이블을 `[ingest.*]` 로 relocation(값·주석 보존) + pdf /// paddle 값 보존. 멱등(이미 v3 면 원본 테이블이 없어 전부 no-op). pub fn step_2_to_3(doc: &mut DocumentMut, changes: &mut Vec) { move_indexing_keys(doc, changes); move_table(doc, &["chunking"], &["ingest", "chunking"], changes); move_table(doc, &["image", "ocr"], &["ingest", "image", "ocr"], changes); move_table( doc, &["image", "caption"], &["ingest", "image", "caption"], changes, ); move_table(doc, &["pdf", "ocr"], &["ingest", "pdf", "ocr"], changes); // 빈 껍데기 [image] / [pdf] 제거. for empty in ["image", "pdf"] { if let Some(t) = doc.get(empty).and_then(Item::as_table) { if t.is_empty() { doc.as_table_mut().remove(empty); } } } copy_image_paddle_to_pdf(doc); } /// v3 → v4: 단일 `workspace.root` 를 `[[workspace.sources]]` 의 implicit /// `default` source 로 미러링한다(`id = "default"`, `root = <기존 root>`). /// 기존 `workspace.root` 키는 그대로 둔다 — `resolved_sources()` 가 sources /// 가 있으면 그쪽을 우선하므로 무해하고, defaults reconcile 이 root 를 다시 /// 추가하려 하지 않게 한다. 멱등: `[[workspace.sources]]` 가 이미 있으면 no-op. pub fn step_3_to_4(doc: &mut DocumentMut, changes: &mut Vec) { let Some(ws) = doc.get_mut("workspace").and_then(Item::as_table_mut) else { return; }; // 이미 sources 가 선언돼 있으면(array-of-tables 든 inline 이든) 손대지 않음. if ws.contains_key("sources") { return; } // root 가 없으면 만들 게 없음(defaults 에는 항상 있지만 방어). let Some(root_val) = ws.get("root").and_then(Item::as_str).map(str::to_string) else { return; }; let mut entry = toml_edit::Table::new(); entry.insert("id", toml_edit::value("default")); entry.insert("root", toml_edit::value(root_val)); let mut aot = toml_edit::ArrayOfTables::new(); aot.push(entry); ws.insert("sources", Item::ArrayOfTables(aot)); changes.push(MigrationChange { kind: ChangeKind::AddedSection, path: "workspace.sources".to_string(), detail: "workspace.root → [[workspace.sources]] id=default".to_string(), }); } /// 파일의 schema_version(없으면 1) 부터 CURRENT 까지 step 적용. fn run_steps(doc: &mut DocumentMut, from: u32, changes: &mut Vec) { if from < 2 { step_1_to_2(doc, changes); } if from < 3 { step_2_to_3(doc, changes); } if from < 4 { step_3_to_4(doc, changes); } } /// 사용자 config.toml 텍스트를 받아 step 체인 + reconciliation + version /// stamp 를 적용하고 결과를 반환한다. 순수 함수(I/O 없음). 파싱 실패 시 /// from=1, 변경 없음, new_text=입력 그대로(상위에서 파싱 에러를 따로 처리). pub fn migrate_document(text: &str) -> MigrationOutcome { let mut doc: DocumentMut = match text.parse() { Ok(d) => d, Err(_) => { return MigrationOutcome { from_schema_version: 1, to_schema_version: CURRENT_SCHEMA_VERSION, changes: Vec::new(), new_text: text.to_string(), }; } }; let from = doc .get("schema_version") .and_then(toml_edit::Item::as_integer) .unwrap_or(1) as u32; let mut changes = Vec::new(); // 1. non-additive step 체인. run_steps(&mut doc, from, &mut changes); // 2. additive reconciliation(버전 무관). let reference = annotated_default_document(); let ref_table = reference.as_table().clone(); reconcile(&ref_table, doc.as_table_mut(), "", &mut changes); // 3. schema_version stamp. let current_in_file = doc .get("schema_version") .and_then(toml_edit::Item::as_integer) .unwrap_or(0) as u32; if current_in_file != CURRENT_SCHEMA_VERSION { doc["schema_version"] = toml_edit::value(i64::from(CURRENT_SCHEMA_VERSION)); } MigrationOutcome { from_schema_version: from, to_schema_version: CURRENT_SCHEMA_VERSION, changes, new_text: doc.to_string(), } } #[cfg(test)] mod tests { use super::*; #[test] fn annotated_default_has_per_key_comments() { let text = annotated_default_document().to_string(); // 대표 키 인라인 주석 존재. assert!(text.contains("# 색인 루트"), "workspace.root 주석 누락:\n{text}"); assert!(text.contains("0=즉시실패"), "request_timeout 주석 누락:\n{text}"); assert!( text.contains("paddle-onnx 는 번들 모델"), "ocr.model 주석 누락:\n{text}" ); // 주석 추가가 파싱을 깨지 않는다. let back: crate::Config = toml::from_str(&text).expect("parse annotated default"); assert_eq!(back, crate::Config::defaults()); } #[test] fn annotated_default_has_all_sections_and_parses_back_to_defaults() { let doc = annotated_default_document(); let text = doc.to_string(); // v3: 미디어 형식 섹션이 전부 `[ingest.*]` 하위로 통합됐다. IngestCfg // 는 스칼라(병렬도) 필드가 있어 bare `[ingest]` + 하위 테이블이 함께 // 직렬화된다. for section in [ "[workspace]", "[ingest]", "[ingest.chunking]", "[ingest.code]", "[ingest.image.ocr]", "[ingest.pdf.ocr]", "[logging]", "[ui]", ] { assert!(text.contains(section), "missing {section}:\n{text}"); } assert!(text.contains("# "), "no comments attached"); let back: crate::Config = toml::from_str(&text).expect("parse annotated default"); assert_eq!(back, crate::Config::defaults()); } #[test] fn reconcile_adds_missing_section_preserving_user_values_and_comments() { // ingest 통째 누락(→ ingest.code 추가), logging 통째 누락, // default_k 는 사용자가 바꿈, 주석 보유. let user_text = "\ schema_version = 1 [workspace] root = \"/my/notes\" # 내 워크스페이스 [search] default_k = 25 "; let mut user: DocumentMut = user_text.parse().unwrap(); let reference = annotated_default_document(); let ref_tbl = reference.as_table().clone(); let mut changes = Vec::new(); reconcile(&ref_tbl, user.as_table_mut(), "", &mut changes); let out = user.to_string(); // 누락된 [ingest.code] 가 주석과 함께 추가. assert!(out.contains("[ingest.code]"), "ingest.code not added:\n{out}"); // 통째 누락된 logging 추가. assert!(out.contains("[logging]"), "logging not added"); // 사용자 값/주석/기존 섹션 보존. assert!(out.contains("root = \"/my/notes\"")); assert!(out.contains("# 내 워크스페이스")); assert!(out.contains("default_k = 25")); // 새 섹션 주석 부착. assert!(out.contains("code ingest skip 정책")); // 통째 누락 부모는 부모 경로로 한 번 기록. assert!( changes .iter() .any(|c| c.kind == ChangeKind::AddedSection && c.path == "ingest") ); assert!( changes .iter() .any(|c| c.kind == ChangeKind::AddedSection && c.path == "logging") ); } #[test] fn reconcile_does_not_overwrite_user_value_differing_from_default() { let user_text = "\ schema_version = 2 [rag] score_gate = 0.8 "; let mut user: DocumentMut = user_text.parse().unwrap(); let reference = annotated_default_document(); let ref_tbl = reference.as_table().clone(); let mut changes = Vec::new(); reconcile(&ref_tbl, user.as_table_mut(), "", &mut changes); let out = user.to_string(); assert!(out.contains("score_gate = 0.8"), "user value clobbered:\n{out}"); assert!(!changes.iter().any(|c| c.path == "rag.score_gate")); } #[test] fn step_1_to_2_removes_deprecated_workspace_include() { let user_text = "\ [workspace] root = \"/n\" include = [\"*.md\"] "; let mut user: DocumentMut = user_text.parse().unwrap(); let mut changes = Vec::new(); step_1_to_2(&mut user, &mut changes); let out = user.to_string(); assert!(!out.contains("include"), "include not removed:\n{out}"); assert!( changes .iter() .any(|c| c.kind == ChangeKind::RemovedDeprecated && c.path == "workspace.include") ); let mut changes2 = Vec::new(); step_1_to_2(&mut user, &mut changes2); assert!(changes2.is_empty()); } fn read_schema_version(text: &str) -> u32 { let doc: DocumentMut = text.parse().unwrap(); doc.get("schema_version") .and_then(toml_edit::Item::as_integer) .unwrap_or(1) as u32 } #[test] fn migrate_document_stamps_version_and_is_idempotent() { let old = "\ schema_version = 1 [workspace] root = \"/n\" include = [\"*.md\"] "; let outcome = migrate_document(old); assert_eq!(outcome.from_schema_version, 1); assert_eq!(outcome.to_schema_version, CURRENT_SCHEMA_VERSION); assert!(outcome.changed()); assert!(!outcome.new_text.contains("include")); assert!(outcome.new_text.contains("[ingest.code]")); assert_eq!(read_schema_version(&outcome.new_text), CURRENT_SCHEMA_VERSION); let again = migrate_document(&outcome.new_text); assert!(!again.changed(), "not idempotent: {:?}", again.changes); assert_eq!(again.new_text, outcome.new_text); } fn changes_after_second_pass(text: &str) -> Vec { let mut doc: DocumentMut = text.parse().unwrap(); let mut ch = Vec::new(); step_2_to_3(&mut doc, &mut ch); ch } #[test] fn step_2_to_3_relocates_media_tables() { let v2 = "\ schema_version = 2 [indexing] max_parallel_extractors = 4 watch_filesystem = true [chunking] target_tokens = 700 [image.ocr] enabled = true engine = \"paddle-onnx\" det_model = \"/custom/det.onnx\" [image.caption] enabled = true [pdf.ocr] enabled = false engine = \"paddle-onnx\" "; let mut doc: DocumentMut = v2.parse().unwrap(); let mut changes = Vec::new(); step_2_to_3(&mut doc, &mut changes); let out = doc.to_string(); // 새 위치 존재. assert!(out.contains("[ingest]"), "{out}"); assert!(out.contains("max_parallel_extractors = 4")); assert!(out.contains("watch_filesystem = true")); assert!(out.contains("[ingest.chunking]")); assert!(out.contains("target_tokens = 700")); assert!(out.contains("[ingest.image.ocr]")); assert!(out.contains("det_model = \"/custom/det.onnx\"")); assert!(out.contains("[ingest.image.caption]")); assert!(out.contains("[ingest.pdf.ocr]")); // 옛 위치 제거. assert!(!out.contains("[indexing]")); assert!(!out.contains("\n[chunking]")); assert!(!out.contains("\n[image.ocr]")); assert!(!out.contains("\n[image.caption]")); assert!(!out.contains("\n[pdf.ocr]")); // pdf paddle 동작 보존: image paddle det_model 이 pdf 대칭 키로 복사. let reparsed: DocumentMut = out.parse().unwrap(); let pdf_det = reparsed["ingest"]["pdf"]["ocr"].get("det_model"); assert_eq!(pdf_det.and_then(|v| v.as_str()), Some("/custom/det.onnx")); // 멱등. let again = changes_after_second_pass(&out); assert!(again.is_empty(), "not idempotent: {again:?}"); } #[test] fn step_3_to_4_mirrors_root_into_default_source() { let v3 = "\ schema_version = 3 [workspace] root = \"/my/notes\" exclude = [\".git/**\"] "; let mut doc: DocumentMut = v3.parse().unwrap(); let mut changes = Vec::new(); step_3_to_4(&mut doc, &mut changes); let out = doc.to_string(); // 새 array-of-tables 가 id=default 로 추가. assert!(out.contains("[[workspace.sources]]"), "{out}"); assert!(out.contains("id = \"default\""), "{out}"); // 기존 root 는 보존(reconcile 이 다시 추가하지 않게). assert!(out.contains("root = \"/my/notes\""), "{out}"); // 재파싱 후 sources.default 가 root 를 미러. let reparsed: DocumentMut = out.parse().unwrap(); let src0 = reparsed["workspace"]["sources"][0].as_table().unwrap(); assert_eq!(src0["id"].as_str(), Some("default")); assert_eq!(src0["root"].as_str(), Some("/my/notes")); // 멱등. let mut changes2 = Vec::new(); step_3_to_4(&mut doc, &mut changes2); assert!(changes2.is_empty(), "step_3_to_4 not idempotent"); } #[test] fn step_3_to_4_noop_when_sources_already_present() { let v4 = "\ schema_version = 4 [workspace] root = \"/my/notes\" exclude = [] [[workspace.sources]] id = \"notes\" root = \"/my/notes\" "; let mut doc: DocumentMut = v4.parse().unwrap(); let mut changes = Vec::new(); step_3_to_4(&mut doc, &mut changes); assert!(changes.is_empty(), "must not touch existing sources"); // 기존 source 만 존재(default 가 추가되지 않음). assert!(!doc.to_string().contains("id = \"default\"")); } #[test] fn migrate_document_v3_to_v4_adds_sources_and_is_idempotent() { let v3 = "\ schema_version = 3 [workspace] root = \"/n\" exclude = [] "; let outcome = migrate_document(v3); assert_eq!(outcome.from_schema_version, 3); assert_eq!(outcome.to_schema_version, 4); assert!(outcome.changed()); assert!(outcome.new_text.contains("[[workspace.sources]]")); assert_eq!(read_schema_version(&outcome.new_text), 4); let again = migrate_document(&outcome.new_text); assert!(!again.changed(), "not idempotent: {:?}", again.changes); assert_eq!(again.new_text, outcome.new_text); } #[test] fn migrate_document_missing_schema_version_treated_as_v1() { let old = "[workspace]\nroot = \"/n\"\n"; let outcome = migrate_document(old); assert_eq!(outcome.from_schema_version, 1); assert_eq!(read_schema_version(&outcome.new_text), CURRENT_SCHEMA_VERSION); } }