ik_llama.cpp

main

b2cb4512c5 · Create parameters overview (#1269) · Updated 2026-02-20 07:20:56 +01:00

ik/cuda_mmq_iq2_k 217905c8b3 · Fix iq2_ks · Updated 2025-05-14 18:03:54 +02:00 git	4211 3698	ZIP TAR.GZ
ik/cuda_mmq_iq4_k d91316e475 · MMQ for iq6_k · Updated 2025-05-14 11:34:22 +02:00 git	4211 3698	ZIP TAR.GZ
ik/fix_ser_cuda 79bdbbb3c0 · This seems to work · Updated 2025-05-13 19:01:54 +02:00 git	4211 3695	ZIP TAR.GZ
ik/fix_ser 2c18ef1400 · Cleanup · Updated 2025-05-13 14:04:37 +02:00 git	4211 3690	ZIP TAR.GZ
ik/fix_412 d2362176df · Fix new CUDA FA on Touring · Updated 2025-05-12 14:01:35 +02:00 git	4211 3687	ZIP TAR.GZ
ik/fix_mla_imatrix 902024a64c · Fix imatrix calculation for MLA models · Updated 2025-05-12 12:20:22 +02:00 git	4211 3687	ZIP TAR.GZ
ik/cpu_deepseek_fa 83dab6a7ce · It must be like this · Updated 2025-05-12 09:19:28 +02:00 git	4211 3688	ZIP TAR.GZ
ik/enable_mla3_in_crippled_ggufs 999d991152 · Add newly created tensors to model.tensors_by_name · Updated 2025-05-11 17:03:22 +02:00 git	4211 3685	ZIP TAR.GZ
ik/cuda_flash_mla3_v2 d7008ad52d · constexpr and minor changes · Updated 2025-05-11 10:21:51 +02:00 git	4211 3684	ZIP TAR.GZ
ik/fix_cuda_fa_race 2f32589b8e · Fix race in the CUDA DeepSeek FA kernel · Updated 2025-05-11 07:03:10 +02:00 git	4211 3681	ZIP TAR.GZ
ik/offload_policy 154a195f75 · Minor · Updated 2025-05-10 18:07:02 +02:00 git	4211 3682	ZIP TAR.GZ
ik/remove_unnessessary_ids_copy c4e1c2c905 · CUDA: fix TG with SER · Updated 2025-05-10 10:06:48 +02:00 git	4211 3680	ZIP TAR.GZ
s6/rope_freq_fix caf309157b · convert : adapt MiniCPM3 to separate rope_freqs insertion · Updated 2025-05-09 13:30:49 +02:00 git	4211 3680	ZIP TAR.GZ
ik/cuda_fix_quantized_flash_mla3 c5ed8f4069 · Fix CUDA FlashMLA-3 with quantized KV cache · Updated 2025-05-09 08:36:38 +02:00 git	4211 3674	ZIP TAR.GZ
ik/handle_incompatible_deepseek_ggufs 2565b29f33 · Handle incompatible DeepSeek GGUFs · Updated 2025-05-07 17:25:40 +02:00 git	4211 3673	ZIP TAR.GZ
ik/fix_deepseek_q80_cache 93d053f7ab · Fix DeepSeek q8_0 cache · Updated 2025-05-07 11:02:05 +02:00 git	4211 3670	ZIP TAR.GZ
ik/fix_xeon_6226R e6da985f02 · Fix build for Xeon Gold 6226R · Updated 2025-05-07 09:23:18 +02:00 git	4211 3669	ZIP TAR.GZ
ik/cuda_flash_mla3 1982beb005 · Minor tweak · Updated 2025-05-07 08:07:34 +02:00 git	4211 3674	ZIP TAR.GZ
s6/deci_support 296367a50d · Update vocab.py · Updated 2025-05-05 08:37:01 +02:00 git	4211 3672	ZIP TAR.GZ
ik/fix_deepseek_fattn f455ead8aa · Fix DeepSeek FA · Updated 2025-05-05 07:31:55 +02:00 git	4211 3667	ZIP TAR.GZ

... 19 20 21 22 23 ...

Default Branch

Branches