docs: sudo 없이 ollama 설치 + ask --stream 권장 (v0.17.0 post-dogfood) #163
Reference in New Issue
Block a user
Delete Branch "docs/ollama-install-and-stream"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
요약
v0.17.0 확장 도그푸딩에서 사용된 두 운영 패턴을 README / docs/SMOKE.md 에 옮���. docs only — 코드 변경 없음, wire 영향 없음.
(1) sudo / systemd 없이 ollama 설치 — tarball 받아
/opt/ollama/{bin,models,logs}같은 사용자 디렉토리에 풀고OLLAMA_MODELSenv 로 모델 위치 분리. 도그푸딩 머신에서/build/cache/ollama패턴으로 검증. 컨테이너 / WSL2 / root 권한 제약 환경에 유용.(2)
kebab ask --streamUX 권장 — cold start 가 긴 모델 (8B+ 또는 첫 호출) 은 progressive 토큰이 5 분 timeout 한도 안에서 빠르게 surface 됨. p9-fb-33 의 streaming 경로를 일반 권고로 옮김. 동일 inference 시간이라도 wait-and-pray 보다 안정적.PR #162 (
request_timeout_secsconfig 노브) 와 sibling — 같은 v0.17.0 post-dogfood 라운드의 남은 두 항목.변경 요약
kebab ask --stream권장 (fb-33)" — 한 문장 + CLI 예시 + MCP host 의streaming_askcapability flag 안내.사용자 가시 영향
kebab ask --stream인지 빠르게 인지.검증
시험 항목 (Test Plan)
kebab ask "..." --stream 2> events.ndjson > final.json→ stderr 에 ndjson event 흐름, stdout 에 최종 answer.v1 1줄.kebab schema --json | jq '.capabilities.streaming_ask'→true확인.Assisted-by: Claude Code
확장 도그푸딩에서 사용된 두 패턴을 README + SMOKE 에 옮김. (1) sudo / systemd 없이 격리 디렉토리에 ollama 설치 — tarball 받아 /opt/ollama/{bin,models,logs} 같은 사용자 디렉토리에 풀고 OLLAMA_MODELS env 로 모델 위치 분리. 컨테이너 / WSL2 / 회사 머신 등 root 권한 제약 환경에 유용. 도그푸딩 머신에서 /build/cache/ollama 로 같은 패턴 검증. (2) cold start 가 긴 모델 (8B+ 또는 첫 호출) 은 `kebab ask --stream` 권장 — 동일 inference 시간이라도 progressive 토큰이 5분 timeout 한도 안에서 빠르게 surface 됨. p9-fb-33 의 streaming 경로를 UX 개선 권고로 명시. 코드 변경 없음 — docs only. README + SMOKE 두 군데 동일 패턴 sub-bullet + bash snippet. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>