llama.cpp

mirror of https://github.com/ggerganov/llama.cpp synced 2026-05-03 04:42:06 +02:00

History

Johannes Gäßler 2e1c9cd814 CUDA: generalized (mma) FA, add Volta support (#17505 ) * CUDA: generalized (mma) FA, add Volta support * use struct for MMA FA kernel config --------- Co-authored-by: Aman Gupta <aman>		2025-12-03 16:57:05 +01:00
..
cmake	ggml: Skip backend library linking code when GGML_BACKEND_DL=ON (#15094 )	2025-08-07 13:45:41 +02:00
include	CUDA: generalized (mma) FA, add Volta support (#17505 )	2025-12-03 16:57:05 +01:00
src	CUDA: generalized (mma) FA, add Volta support (#17505 )	2025-12-03 16:57:05 +01:00
.gitignore
CMakeLists.txt	ggml webgpu: add support for emscripten builds (#17184 )	2025-12-03 10:25:34 +01:00