src/localserv: set fixed seed for deterministic sampling

google-labs-jules[bot] · gendeux · google-labs-jules[bot] · commit ebfed22f4bf4 · 2026-01-26T21:07:41.000Z
Explicitly set `sampling.seed` to 42 in `localserv_main.cc`. This ensures that `Inference::reinitialize` uses a fixed seed rather than a random one derived from `time(NULL)`. This prevents non-deterministic behavior in the sampler chain (e.g., `min_p` or internal `llama.cpp` RNG usage) that was causing CI test failures in `localserv_test.py`, even when greedy sampling was enabled. This change aligns `localserv`'s reliability with `assistant_cli`.

Co-authored-by: gendeux &lt;109779922+gendeux@users.noreply.github.com&gt;
diff --git a/src/localserv/localserv_main.cc b/src/localserv/localserv_main.cc
@@ -260,6 +260,7 @@ int main(int argc, char** argv) {
   // Use deterministic (greedy) sampling for reproducibility
   auto& sampling = std::get<rendezllama::inference::Sampling>(opt.infer_via);
   sampling.pick_via = rendezllama::inference::Determinism();
+  sampling.seed = 42;
 
   std::vector<Vocabulary::ChatMessage> messages;
   std::vector<char> formatted(llama_n_ctx(ctx));