talk-llama : sync llama.cpp (#3084)

ggml-ci
2025-08-15 16:42:28 +02:00 · 2025-04-28 16:40:23 +03:00
parent 28dcdff4c5
commit f3c42399a3
36 changed files with 16940 additions and 12400 deletions
--- a/examples/talk-llama/llama-cparams.h
+++ b/examples/talk-llama/llama-cparams.h
@ -29,6 +29,7 @@ struct llama_cparams {
    bool offload_kqv;
    bool flash_attn;
    bool no_perf;
+    bool warmup;

    enum llama_pooling_type pooling_type;