apiVersion: v1
kind: ConfigMap
metadata:
  name: llamacpp-config
data:
  LLAMA_CACHE: /models
  LLAMA_ARG_HOST: 0.0.0.0
  LLAMA_ARG_PORT: "8080"
  LLAMA_ARG_HF_REPO: "igorls/gemma-4-12B-it-heretic-GGUF:Q8_0"
  LLAMA_ARG_CTX_SIZE: "32768"
  LLAMA_ARG_FLASH_ATTN: auto
  LLAMA_ARG_FIT: "on"