diff --git a/k8s/apps/llamacpp/configmap.yaml b/k8s/apps/llamacpp/configmap.yaml index def4c36..b625575 100644 --- a/k8s/apps/llamacpp/configmap.yaml +++ b/k8s/apps/llamacpp/configmap.yaml @@ -6,7 +6,7 @@ data: LLAMA_CACHE: /models LLAMA_ARG_HOST: 0.0.0.0 LLAMA_ARG_PORT: "8080" - LLAMA_ARG_HF_REPO: unsloth/Qwen3.6-35B-A3B-MTP-GGUF:UD-Q6_K + LLAMA_ARG_HF_REPO: "unsloth/Qwen3.6-35B-A3B-MTP-GGUF:UD-Q6_K" LLAMA_ARG_CTX_SIZE: "32768" LLAMA_ARG_FLASH_ATTN: auto LLAMA_ARG_FIT: "on"