Llama-Cpp | Hi, I'm Muhammad Amal

January 30, 2026 · 9 min read

Benchmarking SLM Latency and Memory on Constrained Hardware

January 13, 2026 · 9 min read

Running Phi-4-mini on a Raspberry Pi 5 with llama.cpp

January 9, 2026 · 8 min read

Quantizing SLMs to 4-Bit with GGUF Without Wrecking Accuracy

January 6, 2026 · 9 min read

Why Small Language Models Belong at the Edge in 2026

January 13, 2025 · 10 min read

llama.cpp Deep Dive, Quantization, GGUF, and Inference Speed